사이언스 투데이
science 취재파일 바이오 위클리 사이언스 HOT5 사이언스 매거진 별별 이야기 내 몸 보고서 날씨학개론 생각 연구소 과학의 달인 궁금한S

[과학의달인] 최첨단 언어 인공지능 '엑소브레인'…"질문에 대한 정답을 척척"

[앵커]
인공지능은 4차 산업혁명 시대의 핵심기술로 우리 일상에 깊숙하게 자리 잡고 있죠. 특히 인간의 두뇌구조를 본뜬 '딥러닝'을 활용해 그 범위를 넓혀가고 있는데요.
인공지능의 현재와 미래의 모습은 어떨지 오늘 '과학의 달인'에서 알아보도록 하겠습니다.

한국전자통신연구원 인공지능연구소 임준호 책임연구원과 함께하겠습니다. 어서 오세요.

인공지능 연구에 대한 자세한 이야기 나눠보기 전에 먼저 관련 영상 준비했습니다. 화면으로 함께 보시죠.

지금 살펴본 영상이 2016년이죠. 우리나라에서 인공지능 '엑소브레인'이 퀴즈쇼에 출연해 우승을 차지한 장면이었습니다. 우선, 엑소브레인이 무엇인지 자세히 소개해주시죠.

[인터뷰]
엑소브레인은 인공지능이 지금과 같이 관심을 받기 훨씬 이전인 2012년도에 향후 국가 차원에서 인공지능 기술이 필요하다고 판단하여, 10년의 장기간에 걸쳐서 시작한 프로젝트입니다.

엑소브레인 기술은 크게 사람이 사용하는 언어를 이해하는 기술, 이해한 내용에 기반을 둬 지식을 학습하는 기술, 사람이 궁금해하는 질문에 올바른 답을 찾아서 제공하는 기술로 구성되어 있습니다.

[앵커]
그러니까 우리나라의 최초의 토종인공지능이라고 말할 수 있을 것 같은데, 사람이 사용하는 언어를 이해하고, 질문도 이해하고 올바른 답까지 제공하려면 많은 학습이 필요했을 것 같습니다. 어떤가요?

[인터뷰]
네, 맞습니다. 사람이 사용하는 언어를 이해하기 위해서 어휘나 문장, 문장 간 관계를 분석하는 7종류의 기술을 개발하였고, 이를 이용하여 당시 약 12만 권 분량의 일반 상식과 관련된 지식을 학습했습니다.

그리고 사람의 질문에 올바른 정답을 제공하기 위해 다양한 지식 가운데 올바른 정답을 추론하고, 해당 정답이 맞는지를 검증하는 기술을 같이 개발하였어요.

이렇게 개발한 이해, 학습, 답변 기술을 검증하기 위하여 EBS 장학퀴즈에 출전하였고, 왕중왕전 우승자들과 대결하는 행사를 개최했는데요.

결과는 다행히 엑소브레인이 왕중왕전 우승자들을 큰 점수 차이로 이기고 우승할 수 있었어요.

[앵커]
지금 다행이라고 하셨지만 2011년에도 미국의 유명 퀴즈쇼에서 인공지능인 IBM 왓슨이 출연해서 우승을 차지만 사례도 있었습니다. 이처럼 인간을 인공지능이 뛰어넘는 사례가 계속해서 나오고 있는데 최근에 엑소브레인의 활용 범위를 점차 넓혀나가고 있다고요?

[인터뷰]
네, 엑소브레인의 진화를 화면으로 준비했는데요. 잠깐 살펴보시죠.

"민식이법에서 어린이 보호구역의 규정 속도는?"

[앵커]
네, 지금 영상이 나오고 있네요.

"국회 교섭단체 구성 인원의 기준은 몇 명인가?"

[앵커]
질문을 던지니까 바로 정답을 찾아주네요.

[앵커]
그러게요. 몇 초 안 걸리는 것 같아요. 20명 이상이라는 대답까지 내놨습니다.

[인터뷰]
지금 화면을 통해서 잠깐 예문을 하나 실행해보겠습니다. 방금 살펴봤던 민식이법에서 어린이 보호구역의 규정 속도는? 이라는 질문을 입력하게 되면 실제 법령상에는 민식이법이 존재하진 않습니다. 공식 법명은 아니고요, 도로교통법 제12조 어린이 보호구역의 지정 및 관리에 관해서 설명하고 있고요. 그 구역 내에선 시속 30km 이내로 제한할 수 있다는 부분이 규정에 대한 내용이어서 이 중에서 시속 30km 이내라고 하는 정답을 올바르게 찾아서 사용자에게 제시하게 됐습니다.

[앵커]
우리가 민식이법이라고 흔히 말하지만, 실제 법명이 있잖아요? 그 부분을 알아내서 그것까지 생각해서 답을 찾아주는 기술. 잘 들었습니다.

질문자의 질문을 완벽히 이해하고 정확한 답을 찾아내는 그런 기술인데, 법령을 우리가 예시로 들어봤잖아요? 법령 쪽에 엑소브레인을 적용한 특별한 이유가 있을까요?

[인터뷰]
난도가 높으면서 사람들의 생활과 관련이 있는 부분이 법률 분야잖아요. 그래서 엑소브레인 기술을 우선 적용했습니다. 사실 해외에서는 '리걸 테크'라고 해서 법령 쪽에 인공지능 기술을 적용해서 많은 연구를 하고 있습니다.

벤처기업도 많이 생기고 투자도 많이 이뤄지고 있지만, 한국은 아직 시작단계에 있어요. 이런 법률 분야가 향후 인공지능 기술이 많이 적용돼서 활성화될 것으로 보고 있어서 적용하게 되었습니다.

[앵커]
'리걸 테크', 그러니까 법조 기술이라고 해야 할까요. 그런 기술을 말씀해주셨는데, 법령의 경우엔 용어도 어렵고, 내용도 굉장히 많아서 적용하기 쉽지 않았을 것 같습니다. 어떤가요?

[인터뷰]
네, 맞습니다. 법률 분야는 앞서 말씀드린 장학퀴즈와 다른 점이 질문에 대한 답변이 특정 사건 또는 특정 인물과 같은 단답형 질문이 아니라, 법령 내 문장이나 절과 같은 서술형 질문이 많은 점이 특징이에요. 그래서 엑소브레인은 이와 같은 법령 분야 언어를 이해하고 서술형 답변이 가능하도록 기술을 고도화하였습니다.

엑소브레인은 법령에 포함된 어휘의 의미를 학습하기 위해서 각 어휘가 주변에 어떤 어휘와 어떤 관계로 같이 사용되는지를 분석해요.

예를 들어서, "개의"라는 단어가 있다면 일상생활에서는 자주 사용되지 않지만, 주변에 같이 사용되는 단어들을 통하여 "회의를 개최한다"라는 의미를 포함한 단어라는 것을 딥러닝 기술을 이용하여 학습하게 되는 것이죠.

말씀드린 딥러닝 기반의 언어 이해 기술을 이용하여, 국내 법령 전체와 국외 헌법을 포함하여 총 1,451건의 법률을 학습하였고, 이렇게 학습한 덕에 지금의 수준에 도달할 수 있었습니다.

[앵커]
이렇게 많은 법률을 학습하기 위해서 꼭 필요한 게 앞서 언급한 두뇌를 본뜬 기술, 딥러닝 기술이라는 게 필요하다고 알고 있는데 이 딥러닝 기술에 대해서 좀 더 자세히 설명해주시죠.

[인터뷰]
딥러닝 기술이란 한 사람이 평생 읽는 글이 예를 들어, 약 1GB라고 한다면, 딥러닝 기술은 훨씬 더 많은 20~30GB의 데이터를 약 30~40번씩 반복 학습을 하면서 언어의 뜻과 의미를 학습해야 합니다. 더불어, 딥러닝 기술을 위한 컴퓨터 역시 한 달 이상 학습해야 사람과 비슷하게 언어를 이해할 수 있어요.

이렇게 언어를 기본적으로 이해하는 딥러닝 기술을 이용해서 어떤 질문이 입력되었을 때, 어떤 단락의 어떤 부분이 정답인지를 가르치면, 새로운 질문이 들어오거나, 새롭게 제정되거나 개정된 법률이 들어와도 올바르게 정답을 찾을 수 있습니다.

[앵커]
단순히 빅데이터를 인공지능에 주입하는 것에 그치지 않고 딥러닝 기술을 활용해서 이해하고 활용할 수 있도록 도와준다고 이해하면 되겠는데요. 그런데 우리가 일상에서 궁금한 점이 생기면 보통 포털 사이트에 검색하잖아요. 포털사이트에 직접 검색을 하는 것과 엑소브레인에 검색하는 것과는 어떤 차이가 있을까요?

[인터뷰]
엑소브레인과 같이 사람의 질문에 정답을 제시하는 기술을 질의 응답이라고 불러요. 검색 기술과 질의 응답 기술의 공통점은 둘 다 사람이 모르는 내용을 제공하는 지식 제공 기술이라는 점인데요.

구글이나 네이버의 궁금한 사항을 검색하면 사용자가 직접 문서를 클릭해 해당 내용을 일일이 살펴봐야 하고, 또 정확한 답변인지도 검증하기가 어렵습니다.

하지만 질의 응답 기술은 검색 기술을 기본으로 포함하고, 사람이 직접 문서를 보면서 자신이 궁금해하는 내용을 찾는 과정을 컴퓨터가 대신한다고 보시면 됩니다. 하지만 컴퓨터가 사람이 이해하는 것처럼 문서를 이해하려면 언어를 이해하는 고난도 기술이 필요해서 그동안 아무도 해결하지 못한 기술이었어요.

실제 질의 응답을 가장 많이 연구하고 있는 글로벌 기업 역시 구글입니다.

[앵커]
말씀해주신 질의 응답 기술이 기존의 검색 기술을 대체할 수 있는 정말 혁신적인 기술이라고 볼 수 있겠는데요. 법령 쪽 외에도 어떤 곳에서 활용할 수 있을까요?

[인터뷰]
엑소브레인은 궁극적으로 사람이 사용하는 언어를 컴퓨터가 이해하여, 사람이 언어를 사용하는 모든 분야에 활용하기 위한 목적으로 개발한 기술이에요.

마치 지금의 전기가 모든 산업에 널리 쓰이고 있는 것처럼, 앞으로는 언어를 처리하는 인공지능 기술이 모든 산업에 널리 쓰이게 하는 게 목표에요. 구체적으로는 법률 분야뿐 아니라, 은행이나 보험사와 같은 금융 회사의 고객 상담 서비스, AI 챗봇, AI 스피커와 같이 다양한 분야에 적용할 수 있습니다.

[앵커]
그러면 앞으로 연구원님의 계획은 무엇인지 들어볼게요.

[인터뷰]
제가 연구하는 방향성은 "궁극적으로 사람을 돕는 기술을 개발하자" 입니다. 사람을 돕는 기술을 만들기 위해서, 앞에서 말씀드린 현재 기술이 가진 한계들을 극복하는 기술을 연구하고, 또한 개발한 기술이 국내 기업 및 학계에서 널리 사용되도록 개발한 기술과 데이터를 일반에 공개하고 있어요.

인공지능 기술은 지금보다 훨씬 더 많이 발전하고, 훨씬 더 많은 다양한 영역에 적용될 거예요. 법률 분야에서는 인공지능을 바라볼 때, AI 판사, AI 변호사라고 부르기도 하지만, 실제는 사람을 대체한다기보다 판사나 변호사를 도와주는 인공지능 시스템이라고 보는 게 더 정확할 거에요. 그리고 법률을 잘 모르는 일반 사람들도 인공지능의 도움으로 더 쉽게 법률 지식에 접근할 수 있도록 하여 사람들에게 도움을 주고자 합니다.

마지막으로 법률 이외의 일상생활과 관련된 분야에서도 저희가 개발한 기술이 적용되어 많은 사람을 도울 수 있도록 하는 게 목표에요.

[앵커]
이 법률 분야뿐만 아니라 말씀해주신 것처럼 일상생활과 관련된 모든 분야에서도 도움을 주려면 좀 더 보완해야 할 부분이 있을 것 같은데 보완해야 할 점에 관해서 설명해주시죠.

[인터뷰]
언어를 이해하는 인공지능 기술은 기존 기술과 비교하면 엄청나게 발전하였지만, 사람과 비교하면 아직 부족한 점이 정말로 많아요.

단적인 예를 들자면, 특정 분야에 인공지능 기술을 적용하려면 아직도 많은 양의 학습데이터가 필요한데, 이를 구축하는데 많은 시간과 비용이 소요됩니다.

또, 딥러닝의 한계가 있는데요. 예를 들어 바나나 그림이 있으면 바나나라고 단번에 맞히지만 다른 모양의 물건을 갖다놨더니 바나나를 못 맞히는 경우가 있어요. 어떠한 예제가 와도 틀리지 않아야 하니까 이를 잡아내는 기술도 연구 중입니다.

마지막으로, 민감한 문제의 경우 인공지능 시스템이 어떤 결과를 제시할 때, 왜 이런 결과를 제시하였는지도 같이 알려줘야 하는데 이와 같은 부분도 많이 부족합니다.

방금 말씀드린 대용량의 학습데이터, 강건한 인공지능 시스템, 결과의 설명 가능성 등의 연구가 복합적으로 이뤄져야 진정 사람에게 도움이 될 수 있고, 현재의 인공지능을 뛰어넘는 차세대 인공지능이라고 부를 수 있다고 생각해요.

[앵커]
앞으로 인공지능 기술이 해결해야 할 과제도 들어봤는데요. 사실 인공지능이 보편화 될 미래를 떠올리면 막연한 두려움과 불안감이 드는 게 사실이었어요. 오늘 얘기를 듣다 보니까 인공지능 기술이 우리의 삶을 더 이롭게 하는 데 큰 역할을 할 수 있겠다는 생각이 듭니다. 지금까지 한국전자통신연구원 인공지능연구소 임준호 책임연구원과 함께했습니다. 오늘 말씀 고맙습니다.
  1.  03:00다큐 세상 해조류 전쟁,블루 ...
  2.  04:00브라보 K-사이언티스트 <29회...
  3.  04:30녹색의 꿈 가뭄과 폭우 어떻...
  1.  YTN사이언스 프로그램 모니터요원 선...
  2. [종료] YTN사이언스 구매 프로그램 공모