사이언스 투데이
science 취재파일 바이오 위클리 사이언스 HOT5 사이언스 매거진 별별 이야기 내 몸 보고서 날씨학개론 생각 연구소 과학의 달인 궁금한S

[사이언스 취재파일]끝까지 안 봐도 되네…인공지능이 동영상 검색까지?

■ 이혜리 / 과학뉴스팀 기자

[앵커]
다양한 분야의 과학 이슈를 과학 기자의 시각으로 집중, 분석하는 '사이언스 취재 파일' 시간입니다.

스튜디오에 이혜리 기자 나와 있습니다. 오늘은 어떤 주제로 이야기 나눠볼까요?

[인터뷰]
오늘은 인공지능에 대한 이야기를 준비했는데요. 제가 이번에 취재한 인공지능은 동영상 자료를 찾고 영상 속 정보를 습득하는 데 도움이 되는 그런 기술입니다. 관련 내용 조금 더 자세히 알아보겠습니다.

[앵커]
동영상과 관련한 인공지능이다. 정확히 어떤 개념인지 궁금한데요?

[인터뷰]
우리 일상생활과 아주 밀접한 기술이라고 볼 수 있는데요. 우선 두 앵커는 요즘에 어떤 정보를 검색할 때, 동영상 검색을 찾아보시는 편인가요?

[앵커]
저는 동영상 공유 플랫폼이 있죠. 그곳에 궁금했던 내용을 검색해보면 관련 영상들이 워낙 많고 콘텐츠를 쉽게 찾을 수 있어서 좋더라고요.

[인터뷰]
네, 아무래도 젊은 세대일수록 동영상 검색을 많이 하시는데요. 그런데 이럴 경우, 한 가지 불편한 점이 있죠. 내가 원하는 정보가 어디쯤에서 나올지, 일단 영상을 다 보기 전에는 알 수 없다는 건데요. 그래서 이런 불편함을 덜어 줄 인공지능이 개발됐습니다. 보고자 하는 영상의 주소 링크를 입력하면 입력과 동시에 영상 속 음성 해설이 텍스트로 변환되고요. 영상이 재생되는 중간중간 궁금한 내용을 질문하면 해답이 될 만한 내용이 시작되는 지점을 찾아 바로 재생시켜 줍니다. 바로 이런 형식으로 질문할 수 있는 것입니다.

[동영상 내용 분석 인공지능 시연]
"화분 어디서 산 거야?"
"성수역에 있는 **테이블에서 받침까지 5만5천 원 주고 샀어요."

[인터뷰]
이 인공지능은 영상 길이나 종류에 상관없이 그 내용을 바로 텍스트로 바꿀 수 있고요. 질문자의 음성을 정확하게 인식해서 질문의 의도를 파악하고 원하는 내용을 찾아주는 역할을 하는 겁니다.

[앵커]
상당히 신기하네요. 무엇보다 정확도와 속도가 놀랍습니다. 예전에 동영상 관련 인공지능이라고 하면 내가 관심 있는 콘텐츠를 찾아서 추천해주는 정도였는데 이것은 한 단계 진화했다는 느낌이 듭니다.

[인터뷰]
이런 기능을 수행하려면 복잡한 인공지능 기술이 적용돼 있어야 하는데요. 1차로는 음성을 인식해서 텍스트로 변환하는 인공지능 기술이 필요하고요. 사람의 질문을 알아들을 수 있는, 그러니까 질문의 의도가 무엇인지 파악하는 인공지능 기술이 추가돼야 합니다. 또 텍스트로 변환된 동영상 내용을 빠르게 이해할 수 있는 이른바 '기계 독해' 인공지능도 적용돼 있어야 하는데요. 이와 관련해서 전문가의 이야기 들어보시죠.

[정수익 /인공지능 기업 매니저 : 기계 독해는 미리 훈련한 대량의 데이터를 학습한 두뇌가 있어요, 그런 모델을 가지고 문서만으로 그 문서 안에 있는 답을 찾아내는 기술이에요. 적용될 수 있는 부분은 많은데요. 보험에서 약관 정보 같은 경우나 법률 상담할 때 법률 정보, 의료 정보, 상품에 대한 안내서 이런 다양한 문서에서 답을 찾아내는 것을 할 수 있고요.]

[앵커]
핵심이 기계 독해였군요. 텍스트로 변환된 동영상 속의 내용을 빠르게 읽고 그 답을 찾아주는 기술이라고 보면 될 것 같은데요. 전문가 이야기처럼 보험 약관, 법률 용어도 어렵잖아요. 그런 것들을 빨리 찾아서 이해하는 데 도움이 될 것 같아요.

[인터뷰]
원래 기계 독해 인공지능 기술은 어려운 문서를 빠르게 파악하기 위해 개발된 건데요. 요즘처럼 동영상을 보고 내용을 검색하는 사람들이 늘면서 이를 동영상 분야로 확대해 적용한 사례라고 할 수 있습니다. 동영상 검색을 돕는 인공지능 기술 사례는 한 가지 더 있는데요. 특정 키워드를 입력하면 관련 동영상 리스트를 보여주고, 검색된 동영상에서도 원하는 정보가 나오는 시작 시점을 보여주는 기술도 최근 개발됐습니다. 심지어는 실시간 방송에서 방송하는 사람의 음성을 인식하고 수시로 올라오는 채팅 대화의 텍스트를 파악해서 대화에 참여할 수 있는 그런 인공지능 기술도 개발된 상태입니다.

[앵커]
사실 요즘에 누구나 특히 어르신들도 동영상 콘텐츠를 소비하시잖아요. 이런 영상 콘텐츠 소비가 대세가 되었다고 볼 수 있는데요. 이런 흐름에 맞춰서 기술도 따라서 개발되고 있는 것이죠?

[인터뷰]
맞습니다. 실제로 통계를 보면 이를 더 확실하게 알 수 있는데요. 전체 6만여 명을 대상으로 한 인터넷 이용실태조사 내용에 따르면 인터넷 이용자 가운데 80% 이상이 동영상 서비스를 이용하고 있다고 답변했습니다. 특히 동영상을 통한 정보검색(37.7%)의 경우에는 포털(84.4%)에 이어, 2위를 기록할 정도로 중요한 정보검색 도구로 뛰어올랐습니다. 이렇게 동영상 소비가 큰 흐름으로 자리 잡으면서 검색 기술 개발에도 변화가 시작된 건데요. 기존에는 주로 문서나 이미지를 중심으로 정보 분석이 이뤄졌다면, 이제는 동영상 분야로 인공지능 기술을 활발하게 접목하기 시작한 겁니다. 전문가 이야기 들어보시죠.

[김건희 / 서울대 컴퓨터공학부 교수 : 다양한 데이터 형식을 동시에 이해할 뿐만 아니라 근래 특징이 영상을 기반으로 정보를 공유하는 빈도가 훨씬 높아졌기 때문에 영상에 대한 이해를 바탕으로 한 텍스트 이해, 음성 이해를 통한 대화가 아주 중요해졌다고 볼 수 있겠습니다.]

[인터뷰]
실제로 저희만 봐도 예전에는 문자로만 이야기했다면, 요즘은 동영상도 공유하고, 이모티콘을 보내기도 합니다. 이런 다양한 요소를 활용하는 사례가 늘고 있으므로 인공지능 기술도 이런 소통에 참여해서 내용을 이해하려는 쪽으로 고도화되지 않을까 싶습니다.

[앵커]
방금 소통이란 말씀을 하셨는데요. 앞서 관련 영상을 보는데 컴퓨터와 말을 하고 있다는 생각이 들었습니다. 앞으로 인공지능 기술이 어떻게 발전할지 그 모습도 기대해보겠습니다. 지금까지 이혜리 기자와 함께했습니다. 오늘 말씀 고맙습니다.
  1.  04:00브라보 K-사이언티스트 <29회...
  2.  04:30녹색의 꿈 가뭄과 폭우 어떻...
  3.  05:30이제 만나러 갑니다 <29회> (...
  1.  YTN사이언스 프로그램 모니터요원 선...
  2. [종료] YTN사이언스 구매 프로그램 공모