사이언스 투데이
과학본색 사이언스 매거진 별별 이야기 내 몸 보고서 날씨학개론 생각 연구소 줌 인 피플 궁금한S

[줌 인 피플] 4차 산업혁명 시대, 데이터가 핵심이다…남영준 교수

■ 남영준 / 중앙대 문헌정보학과 교수

[앵커]
우리나라는 스마트폰 보유율이 높은 만큼 매일 수많은 디지털 데이터를 만들어내고, 저장하며, 전달하고 있습니다.

하지만 이 데이터를 관리하고, 보존하는 일에는 상대적으로 취약한 편인데요.

오늘 줌 인 피플 시간에는 4차 산업혁명 시대, 무엇보다 중요한 원천으로 자리 잡은 데이터의 중요성에 대해 남영준 중앙대 문헌정보학과 교수와 이야기 나눠보겠습니다. 어서 오세요.

석탄과 전기, 인터넷의 공통점은 산업혁명 때마다 일종의 '원유' 역할을 한 것들이죠. '4차 산업혁명'에는 '데이터'가 원유의 역할을 해낼 것이라는 주장이 많던데요. 이처럼 데이터의 중요성이 커지는 이유는 어디서 찾을 수 있을까요?

[인터뷰]
네 데이터가 매우 중요한 이유는 예전의 선진국이라고 하면 하드웨어나 소프트웨어를 가지고 있는 것이었습니다. 근데 비약적인 소프트웨어와 하드웨어의 발달로 인해 국가 간 기술격차는 거의 없는 상황이에요.

결국은 기술의 완성도와 정교함이 경쟁력의 핵심이고, 그 경쟁력을 높이기 위해서는 동일한 소프트웨어를 사용해서 얼마나 많은 데이터를 가졌는지로 결정되기 때문입니다. 따라서 데이터를 많이 가지고 있는 국가 혹은 기업이 경쟁력을 가진 것이고 데이터가 지금 4차 산업혁명 시대에서 국가적인 자산이 되는 것입니다.

[앵커]
국가 경쟁력은 데이터가 좌지우지한다는 말씀이신데요. 그래서 정부는 최근 공공데이터를 개방하는 사례가 늘고 있는데요. 하지만 공공 데이터를 잘 활용하고 있다는 목소리도 나오는데 그 이유는 무엇일까요?

[인터뷰]
크게 두 가지 이유입니다. 하나는 공무원들의 우려입니다. 혹시라도 개방한 데이터가 잘못된 데이터이거나 혹은 개인정보와 같은 민감정보가 포함되어 있어 의도치 않은 문제가 발생할지도 모른다는 우려 때문입니다. 다른 하나는 우리가 2년 마다 받는 건강보험공단 건강검진이 있는데 그 데이터를 보험업계나 제약업계에서 굉장히 원합니다.

근데 그런 데이터는 개인정보와 사생활 관련 정보로 인해 공개 자체가 거의 불가능한 데이터입니다. 저부터도 제 것을 내게 된다면 반대할 것 같아요. 산업계에서는 그런 걸 원하는데 실제로는 못 주는 거죠, 그러다 보니 위험성이 없는 데이터는 핫한 면에서 떨어지는 거고요. 그러다 보니 정부에서 내놓은 데이터가 쓸모가 없다는 이야기를 듣는 이유입니다,

[앵커]
빅데이터 기술은 방대하고 의미 없어 보이는 자료들 중에서 유의미한 결과를 도출하는 것이 목적이잖아요. 그러려면 특별한 기술이 필요할 것 같은데, 데이터를 단순히 접근하는 것이 아니라 과학으로 접근해서 분석하려면 어떤 방법이 필요할까요?

[인터뷰]
보통 학원에 가서 분석기술을 배우는 것은 누구나 할 수 있습니다. 그러나 유의미한 데이터들은 인사이트가 중요하거든요. 어떤 데이터가 있느냐도 중요하지만, 어떻게 쳐다보느냐도 중요하기 때문에 인문학적 마인드, 수학적, 공학적 마인드가 종합적으로 필요하죠. 그러다 보니 분석기술도 중요하지만, 어떻게 사물을 쳐다보는 능력 이런 것들이 중요하기 때문에 실질적으로 과학적 하나의 학문으로 자리 잡을 수 밖에 없는 상황입니다.

[앵커]
데이터 기술만큼이나 바라보는 관점도 중요하다는 말씀이시군요. 데이터 과학의 중요성이 커지면서 이 분야의 인재 육성도 중요할 것 같습니다. 현재 우리나라의 상황은 어떤가요?

[인터뷰]
외국도 마찬가지입니다. 우리나라도 데이터의 중요성이 늘어나면서 많은 과학자를 육성하려고 노력했죠. 최근 발표에 따르면 2022년까지 우리나라에서 필요한 데이터 전문 인력은 약 3만2천 명이라고 말합니다. 그런데도 초중급 인력들은 실질적으로 공급이 수요보다 많고 고급인력은 공급이 절대적으로 부족한 상황입니다. 특히 인공지능 분야는 특히 부족한 상황입니다.

[앵커]
과기정통부에서 얼마 전에 인공지능대학원을 설립하기로 한 것도 이것 때문으로 보이는데요. 그렇다면 데이터 전문인력의 육성 필요성을 한 번 더 강조해주신다면요?

[인터뷰]
저희가 경제발전을 이룬 요인 중 하나가 원유정제기술로 산업을 이뤄 선진국에 들어와 있는데요. 앞으로는 데이터의 정제기술이 초선진국가로 가기 위해서 가장 중요한 부분입니다. 그러다 보니 지금과 같은 4차산업 혁명시대에 데이터 정제기술을 갖추지 못하면 우리나라의 초선진국가 진입이 그만큼 늦어지기 때문에 전문가의 육성이 시급합니다.

[앵커]
빅데이터를 분석하거나 공공데이터의 활용과 관련해서 항상 따라다니는 게 바로 개인정보 침해 문제가 아닐까 싶습니다. 이 부분은 어떻게 해결해야 할까요?

[인터뷰]
가장 어려운 부분이죠. 저는 문화적 차이라고 표현하는데요. 적절한 예인지는 모르겠지만, 우리나라는 개인정보를 사용해서는 안 된다, 다만 이럴 때 사용하라고 정의되어 있습니다. 그러니깐 우리나라는 유턴을 할 때 허락 사인이 있을 때만 됩니다. 근데 서구, 미국에서는 아무 곳에서나 할 수 있고 유턴 금지 표시가 있는 곳에서만 할 수 없습니다, 그것과 똑같이 우리는 법에 의해서 선제적 규제를 하고 있고 미국에서는 활용을 하다 문제가 생기면 그때 규제가 이루어집니다.

그게 문화적 차이거든요. 그래서 그런 문화의 차이를 국가가 개인에게 맡기기보다는 국가가 나서서 실질적으로 개인정보가 붙어있는 데이터는 대부분 국가가 관리하고 있거든요. 그니깐 국가가 데이터 프리존을 만들어서 사용자가 데이터 프리존에 들어와서 마음껏 쓰고 결과 값을 가지고 봤던 데이터는 그대로 두고 나오는 거죠. 그러면 국민은 자신의 개인정보가 활용은 됐지만, 완전하게 보안이 이루어지고요. 실질적으로 사용자들은 자기가 원하는 값을 가지게 되는 거죠. 개인정보를 지금의 법으로 민간에서는 활용하기 어려운 상황입니다.

[앵커]
그렇군요. 데이터 수집과 분석 등이 중요한 만큼 모아둔 데이터를 보관, 보존하는 일 또한 중요하잖아요. 민간에서는 사실 데이터 보존은 잘 이뤄지지 않고 있다고 들었는데, 실정은 어느 정도인가요?

[인터뷰]
민간 기업에서는 의무적으로 많은 데이터를 수집해서 관리하고 있는데요. 기업의 부도 혹은 폐업 등과 같이 기업 자체가 사라졌을 때 어떠한 보존 정책이 거의 이루어지지 않고 있습니다. 그러다 보니 민간에서 얼마나 가지고 있고 얼마나 사라지는지를 국가가 통계조차 못 내고 있습니다. 그래서 이제는 국가가 나서서 최소한의 데이터를 보존할 수 있는 정책적 보완이 필요하다고 생각하고 있습니다.

[앵커]
그렇다면 데이터 관련 정책은 어떤 방향으로 나아가야 할까요?

[인터뷰]
저는 자유롭지만, 국민이 안심할 수 있는 데이터생태계를 조성했으면 좋겠습니다. 자유롭다는 것은 마음껏 사용할 수 있다는 것을 뜻하는 것이고 안심이라는 것은 자신의 정보를 안전하게 보존 받고 보호받을 수 있는 것을 뜻하는 겁니다. 그러기 위해서는 우리 국민이 데이터가 재화가치를 가지고 있다는 것을 인정해야 하고요. 그러다 보면 자연히 민간시장에서 데이터 거래가 이루어질 것이고 민간시장에서 이루어지는 데이터 거래는 정부가 불법적이거나 개인정보를 침해하는 것에 대해서는 완전히 차단해줘야 하고 그것 외에는 간섭해서는 안 됩니다.

그래서 자유로운 거래, 그리고 거래에 따라서 형성된 데이터를 국가가 구하는 정책을 국가가 전략적으로 만들어주면 우리나라도 4차 산업혁명 시대에 우리나라도 데이터 강국이 될 수 있다고 저는 생각합니다.

[앵커]
데이터의 중요성이 갈수록 커지는 상황에 대비해서 이를 둘러싼 환경도 잘 갖춰나가야겠다는 생각이 듭니다.

지금까지 남영준 중앙대 문헌정보학과 교수와 이야기 나눠봤습니다. 오늘 말씀 잘 들었습니다.
  1.  16:00황금나침반 <183회> (2)
  2.  16:40팩트체크 한일경제전쟁 <3회>...
  3.  17:10수상한 비디오 크레이지S <14...
  1.  YTN사이언스 특집·파일럿 프로그램 외...
  2. YTN사이언스 구매 프로그램 공모