■ 최소라 / 과학뉴스팀 기자
[앵커]
학술지 논문들은 엄격한 검증을 거친, 인류 지식의 보고로 여겨져 왔습니다.
그런데 생성형 AI를 무분별하게 사용하면서 이 보고가 흔들리고 있습니다.
논문도 엉터리, 심사도 엉터리인 황당한 실태를 취재기자와 함께 짚어보겠습니다.
최소라 기자 나와 있습니다.
어서 오세요. 논문을 쓰는 데 AI를 이용했다는 것까지는 기술의 발전인가 싶기도 한데요, 그 내용이 일반인이 보기에도 황당한 수준이라고요?
[기자]
네, 그렇습니다.
말씀하신 대로 학계에서는 AI로 데이터를 분석하거나, 번역의 도움을 받는 게 일상화됐습니다.
문제는 선을 넘는 오남용이 벌어지고 있다는 건데요,
먼저 준비한 화면을 함께 보시겠습니다.
국제 학술지 '프론티어스'에 정식으로 게재됐다가 논란이 된 후에 철회된 논문의 삽화입니다.
생쥐 한 마리가 그려져 있는데, 고환이 몸집보다 더 크게 그려져 있고요,
심지어 주변에 적힌 단어들은 실제로 존재하지 않는 단어로, AI가 생성해낸 흔적으로 보입니다.
또 다른 논문 함께 보시겠습니다.
'엘스비어'에 실린 논문의 서론인데요,
가장 첫 문장이 "물론이죠. 주제에 맞는 서론을 써드리겠습니다." 이렇게 시작합니다.
저자가 AI에 명령어를 입력한 뒤에 AI가 내놓은 답변의 인사말까지 그대로 복사해서 붙여넣은 겁니다.
두 사례 모두 AI를 무분별하게 사용하다 벌어진 일입니다.
[앵커]
인사말까지 그대로 베꼈다니 웃음이 나면서도 씁쓸한데, 이렇게 눈에 보이는 문제보다 더 큰 문제는 눈에 잘 보이지도 않는다고요?
[기자]
그렇습니다.
앞서 보여드린 사례들은 그나마 눈에 띄어서 잡아낸 경우고요.
진짜 심각한 건 겉보기엔 그럴싸한 '가짜 참고문헌'입니다.
미국 컬럼비아대 연구진이 2023년부터 올 초까지 한 국제 학술지에 실린 생명과학 논문 250만 편을 조사했습니다.
그랬더니 무려 2,800편 넘는 논문에서 존재하지도 않는 논문을 진짜인 것처럼 참고문헌으로 인용한 사실이 적발됐습니다.
특히 2023년보다 2025년에 12배 많았는데요,
생성형 AI가 대중화되면서 급증한 것으로 봐서 AI 영향이 클 것으로 유추해 볼 수 있겠습니다.
AI가 통계적인 패턴만 짜 맞추다 보니 실제 저자명과 그럴듯한 제목을 조합해서, 유령 논문을 만들어낸 겁니다.
실제로 중국 연구진이 다양한 AI 모델로 논문을 생성해봤는데 유령 논문을 인용한 비율이 최대 90%에 달했고, GPT5조차 그 비율이 50% 수준이었습니다.
[앵커]
존재하지도 않는 논문을 인용한다, 이게 학계에서는 왜 치명적인 문제가 되는 걸까요?
[기자]
과학 연구는 앞선 연구의 데이터를 발판 삼아 한 계단씩 연구를 진전시키는 구조입니다.
그런데 엉터리 연구가 발표된다면 그 위에 쌓은 새 연구결과까지 신빙성이 떨어지는 겁니다.
게다가 본문이나 참고문헌에 있는 엉터리 데이터를 AI가 다시 학습하는 악순환이 일어날 수 있습니다.
전문가에게 직접 들어보시겠습니다.
[변 순 용 / 한국인공지능윤리학회장 : "인공지능이 자기가 만든 데이터를 가지고 자기가 학습할 경우에 결과의 부정확성이나 오류 가능성이 굉장히 높아졌다고 이해하시면 될 것 같습니다. 인류학에서 근친상간을 하는 부락이나 집단 내에서 기형아 발생 확률이 높다는 것에 (비유할 수 있습니다.)"]
[앵커]
지식의 생태계 자체가 교란될 수 있다는 뜻이군요. 그런데 학술지라면 전문가들의 심사 단계가 있었을 텐데, 이런 엉터리 논문들이 어떻게 심사를 통과할 수 있었던 건가요?
[기자]
논문이 실리려면 다른 과학자들이 꼼꼼하게 읽고 검증하는 '피어 리뷰', 그러니까 동료 평가를 거쳐야 합니다.
그런데 AI 덕분에 논문 작성이 쉬워지면서 전 세계적으로 논문 투고량이 폭증했습니다.
실제로 국제머신러닝학회, ICML 등에선 과거 연간 수천 편 수준이던 투고량이 최근에는 수만 편으로 늘었습니다.
한정된 심사위원들이 이 방대한 논문을 직접 일일이 검증하는 게 물리적으로 불가능해진 겁니다.
그러다 보니 심사를 AI에 맡기는 일도 만연해 있는데요,
AI 도움을 받는 게 무조건 안 좋다고 볼 수 없지만, 문제는 심사위원들이 최소한의 기본 검증조차 생략한 채 심사 전체를 AI에게 떠넘기기도 한다는 겁니다.
[앵커]
그런데 아무리 심사위원 개인이 날림 심사를 했다고 해도, 최종적인 게이트 키핑을 해야 할 학술지들도 비판을 피하기 어려워 보입니다.
[기자]
그렇습니다.
학술지들은 논문 저자에게 게재료를 받는데요,
SCI급 국제 학술지는 게재료가 수백만 원을 호가합니다.
여기에다 독자에게는 구독료까지 받아서 출판사들은 막대한 수익을 올리는데도, 심사위원에게는 심사비를 거의 주지 않거나 매우 조금만 주는데요,
이 때문에 부실한 심사로 이어진다는 지적이 나옵니다.
이런 구조로 대형 출판사들은 영업이익률이 매년 40% 안팎에 달합니다.
웬만한 글로벌 IT 기업보다 돈을 더 잘 버는 구조입니다.
그럼에도 기본적인 필터링이나 자체 검수 시스템을 갖추지 않았다는 점은 책임을 피할 수 없어 보입니다.
전문가에게 직접 들어보시겠습니다.
[유 창 동 / KAIST 전기·전자공학부 교수 : 유명 국제 학회에서는 AI 기반의 논문 리뷰 품질 평가 시스템을 발표하고 있으며 심사 과정의 신뢰성을 높이기 위한 기술적인 시도가 이어지고 있습니다. 다만 이런 제도와 기술이 완전히 자리 잡기 전까지는 논문 심사에 AI 활용이 적절했는지에 대한 사람의 최종 검수가 필요해 보입니다.]
[앵커]
제도가 하나둘씩 마련되는 모습인데, 어서 자리를 잡았으면 좋겠네요. 그렇다면 일단 한눈에 보기에도 엉터리인 논문을 게재한 학술지들만큼이라도 제재할 수단은 없을까요?
[기자]
현실적으로 정부나 사법기관이 민간 출판사를 처벌하기는 어렵습니다.
대신 '우회적 퇴출'이 있습니다.
'클래리베이트'와 같은 공신력 있는 논문 평가기관이 학술지를 공식 색인에서 제외하는 건데, 한마디로 공인 인증을 취소하는 겁니다.
그러면 학술지에 실린 논문들이 학계에서 인정받지 못하기 때문에 학술지 입장에서는 치명적입니다.
이처럼 AI 오남용이 잇따르자 학계도 자정 노력을 시작했습니다.
논문 저자에게는 논문을 제출할 때 AI 사용 여부와 프롬프트를 공개하도록 하고,
심사위원에게는 무단으로 AI를 썼을 경우 자격을 박탈하는 등 강도 높은 가이드라인을 세우고 있습니다.
또 미국 국립보건원, NIH는 부정하게 AI에게 심사를 맡긴 심사위원을 영구 자격 박탈하고, 연구비를 전면 중단하는 초강수를 뒀습니다.
우리 정부 역시 AI로 조작된 논문이 적발되면 연구비를 전액 환수하는 등 엄격한 제재안을 마련했습니다.
[앵커]
학술지에 대한 신뢰가 무너지기 전에 학계의 자성과 엄격한 제도 보완이 필요해 보이네요. 오늘 말씀 감사합니다.
YTN 사이언스 최소라 (csr73@ytn.co.kr)
[저작권자(c) YTN science 무단전재, 재배포 및 AI 데이터 활용 금지]