"빅테크들, 저작권 규정 무시한 채 AI 학습 데이터 마구잡이 수집"

2024년 04월 08일 11시 33분

사이언스 투데이 일반

챗GPT와 같은 생성형 인공지능, AI 개발 경쟁에 불이 붙으면서 거대 정보기술기업인 빅테크업체들이 저작권 규정도 무시한 채 AI 학습용 데이터 확보에 사활을 걸고 있다고 뉴욕타임스가 보도했습니다.

뉴욕타임스는 현지시간 6일 챗GPT 개발사 오픈AI는 GPT-4 모델을 개발 중이던 2021년, 기존에 수집한 AI 학습용 데이터가 고갈될 위기에 처하자 유튜브 영상과 팟캐스트 등의 콘텐츠를 무단으로 사용했다고 내부 사정을 잘 아는 소식통들을 인용해 전했습니다.

유튜브는 규정을 통해 플랫폼에 올라온 영상을 다른 독립된 기능을 위해 사용하는 것을 금지하고 있습니다.

당시 오픈AI 직원들은 위법 가능성을 인지하고 있었지만 AI를 학습시키는 것이 정당한 이용 목적에 해당할 수 있다고 믿었다고 이 소식통들은 뉴욕타임스에 전했습니다.

하지만 오픈AI가 유튜브 영상을 무단으로 사용했다는 사실을 인지했음에도 구글 일부 직원들은 이를 막지 않았다고 주장했습니다.

구글도 이미 일부 유튜브 영상을 자체 AI 개발에 사용한 상황이었기에 만약 오픈AI의 행동을 문제 삼는다면 영상 창작자의 저작권 침해 문제가 커질 수 있다고 판단했기 때문이라고 신문은 설명했습니다.

챗GPT 열풍을 잇기 위해 AI 개발 경쟁에 뛰어든 메타 역시 페이스북·인스타그램 게시물뿐 아니라 소설, 에세이와 같은 저작물까지도 무단으로 손을 댔다고 뉴욕타임스는 전했습니다.

이런 가운데 오픈AI 등 일부 회사들은 데이터 고갈 문제 해결을 위해 AI가 생성한 데이터로 다시 AI를 학습시키는 '합성' 데이터 활용 방안도 연구하고 있다고 신문은 덧붙였습니다.

YTN 김선희 (sunnyk@ytn.co.kr)

YTN 사이언스

"빅테크들, 저작권 규정 무시한 채 AI 학습 데이터 마구잡이 수집"

이 시각 주요 뉴스

많이 본 뉴스

최신 과학 뉴스

뉴스 속 코너