메뉴

YTN 사이언스

검색

칭찬이야? 비꼬는 거야?…음성 속 감정 읽고 표정 짓는 AI

2026년 06월 22일 오전 09:00
[앵커]
사람의 말은 어조에 따라 칭찬이 되거나 비꼼이 될 수도 있는데요.

국내 연구진이 음성 속 미묘한 감정을 인식해 영상 속 화자의 표정을 바꾸는 기술을 개발했습니다.

김은별 기자입니다.

[기자]
한 여성이 무표정으로 말을 하는 영상에,

비꼬는 어조의 음성을 입력하자 여성의 표정이 퉁명스럽게 바뀝니다.

이뿐 아니라 동정심이나 질투 등 미묘한 감정이 담긴 음성을 입력해도 음성별로 표정을 구현해 냅니다.

국내 연구팀이 개발한, 음성을 입력하면 표정을 출력하는 인공지능 모듈입니다.

이 인공지능은 음성에 담긴 감정과 얼굴 표정의 특징을 숫자로 읽어낸 후 변화를 파악해 같은 감정과 목소리끼리 연결하는 방식으로 학습합니다.

이후 음성을 입력하면, 어떤 표정을 지을지 추측해 새로운 표정을 출력하는 겁니다.

감정에 따라 미리 정해진 표정 중 하나를 고르는 게 아니라, 감정 사이의 변화량을 수치화해 미묘한 감정도 표정에 반영할 수 있다는 게 연구진의 설명입니다.

[김 태 환 / UNIST 인공지능대학원 교수 : "AI에서도 결국 모든 데이터는 일종의 공간에서 한 점으로 표현이 되거든요. 음성 공간에서의 감정의 차이에서 비디오 공간에서 감정 차이로 전이가 되도록 이동할 수 있도록 함수를 학습하는 겁니다."]

연구팀은 이 인공지능 모듈의 감정분류 정확도가 55.91%로 기존 최신모델 대비 약 14% 향상됐다고 밝혔습니다.

이번 연구는 인공지능 및 컴퓨터 비전 분야 국제학술지 '컴퓨터 비전 앤 패턴 레커그니션'에 게재됐습니다.

YTN 사이언스 김은별입니다.


YTN 사이언스 김은별 (kimeb0124@ytn.co.kr)
[저작권자(c) YTN science 무단전재, 재배포 및 AI 데이터 활용 금지]