'AI 가짜 논문' 몸살…논문 철회 4배↑
챗GPT는 윤리적 책임 질 수 없어…'증명'과 '검증' 놓지 말아야

생각을

 

"1920년대 라디오가 대중에게 방송되면서 처음으로 온종일 생각할 필요가 없어졌다. 1950년대에는 위대한 텔레비전이 등장했고, 마침내 2007년 아이폰은 따분함에 영원하고 완전한 사망 선고를 내렸다. 그와 함께 우리의 상상력도 사라졌다"

– 마이클 이스터, 『편안함의 습격』 발췌

그리고 2022년 11월 30일, 챗GPT의 등장은 그 마지막 장을 쓴 듯하다. 이제 인간이 스스로 사고하고, 탐구하며, 지식을 만들어내는 고유한 행위, '사유'의 기능 마저 서서히 소실되고 있다. 편리함이라는 달콤한 덫에 갇힌 과학계는 지금 '생각의 부재'라는 새로운 위기에 직면했다.

 

"미안하지만 나는 AI야"

연구실의 풍경은 챗GPT가 등장하기 전인 3년 전과 너무도 달라졌다. 인공지능이 만들어내는 '가짜 논문'이 판을 치고, 이를 잡기 위해 또 다른 AI가 만들어지는 기현상이 벌어지고 있다.

지난해 세계 학술 저널 엘스비어의 '영상의학 사례 보고'에 게재된 미국 하버드대, 이스라엘 히브리대 연구진의 공동 논문이 생성형 AI의 답변을 검증 없이 복사해 사용한 것이 드러나 삭제되는 일이 있었다. 논문에는 "미안하지만 나는 AI 언어모델이기 때문에 환자의 실시간 정보와 데이터에 접근할 수 없다"는 문장이 그대로 남아 있었고, 해당 저널은 이를 AI 사용 사실을 공개하지 않은 정책 위반으로 판단해 논문을 삭제했다.

또 다른 국제 학술지 '프런티어즈 인 셀 앤 디벨롭멘털 바이올로지'에서는 AI 이미지 생성 솔루션인 미드저니로 만들어낸, 터무니없이 과장된 쥐 이미지가 사용된 것이 발각되어 논문이 철회되기도 했다. 당시 이미지 포렌식 전문가들은 AI의 '생성 채우기(Generative Fill)' 기능으로 1분 내에 가짜 세포 사진 등을 만들어낼 수 있어, 기존의 육안 검증이 사실상 어려워졌다고 경고하기도 했다.

네이처에 따르면 AI를 사용한 가짜 논문이 잇따르면서 2023년에는 연구 논문 중 무려 1만 건 이상이 철회됐다. 이는 챗GPT 등장 이전인 2022년(5380건)의 2배, 2019년(2871건)의 4배에 달하는 수치다.

위기감이 커지자 국제 학술계는 긴급 대응에 나섰다. 네이처와 사이언스는 "생성형 AI에 대해 저자 자격을 인정하지 않으며, AI는 단지 연구 효율을 위한 '도구'로만 활용해야 한다"는 데에 동의했다. AI는 가설 수립이나 결과 해석 등 핵심 연구 행위를 수행할 수 없기 때문이다. 혹여 불가피하게 AI를 사용하는 경우에는 연구 방법 항목에 반드시 명시하여 연구의 투명성과 저자의 진실성을 확보하도록 요구하고 있다.

스프링거 네이처는 아예 자체적으로 탐지 AI인 '제페토(Jepetto)'와 '스냅샷(Snapshot)'을 개발하며 적극적으로 대응하고 있다. 

제페토는 논문 텍스트의 일관성을 분석하여 AI가 생성한 것으로 의심되는 무의미한 글이나 내용을 탐지하고, AI 생성 가능성이 높은 섹션을 표시해 인간 심사자의 검토를 유도한다. 이를 통해 이미 수백 건의 허위 논문 출판을 방지하는 데 기여했다.

스냅샷은 논문 속 이미지의 조작 여부를 확인하는 이미지 무결성 분석 보조 도구로 데이터 조작이 흔한 젤(Gel) 및 블롯(Blot) 이미지의 중복 사용 문제를 집중적으로 탐지하는 데 사용된다. 스프링거 네이처는 이 두 AI 도구가 과학에 대한 신뢰를 회복할 수 있도록 돕는 필수적인 보조 역할을 수행할 것이라고 말했다.

 

'빠른 결과'보다 더 중요한 '느린 고찰'

이러한 위협에도 불구하고 AI는 이미 과학·학술계에 깊이 침투해있다. AI로 얻어지는 '실'보다  '득'이 많은 것도 사실이다.

AI는 수백만 개의 논문을 분석해 아직 개척되지 않은 유망한 연구 주제나 공백 영역을 찾아내 새로운 아이디어를 구상하는 데 도움을 준다. 또한, 까다로운 형식 작업, 인용 정리, 포맷팅 등에서 시간을 절약하여 연구자가 핵심 연구에 집중할 수 있도록 돕는다. 

실제 한국 연구재단 조사에서 연구자들은 AI 활용의 유용성으로 '연구 수행 속도 향상'(67.1%)과 '연구 수행 부담 경감'(57.4%)을 가장 높게 꼽았다. 네이처는 최근 자체 AI 도구 '네이처 리서치 어시스턴트(Nature Research Assistant)'를 공개했다. 150년간 축적된 논문 데이터를 기반으로 새로운 연구 주제 발굴과 문장 교정, 가독성 향상 등을 지원하고 있다.

문제는 바로 이 편리함과 속도에 대한 지나친 의존이다. AI가 논문을 써주는 시대에 기초 연구자 뿐만 아니라 산업계 종사자까지 '검증'과 '비판적 사고'를 멈춰서는 안된다. AI는 연구 결과에 대한 윤리적 책임을 질 수 없기 때문이다. 과학의 본질은 여전히 증명과 검증의 과정에 있으며, 데이터를 검증하고, 가설을 의심하는 것은 여전히 우리의 몫이다.

연구자의 입장에서 논문을 볼 때 '결과(Results)'보다 더 중요한 부분은 '고찰(Discussion)'이라고 생각했다. 결과가 우수한 것도 중요하지만, 이 연구가 이 시점에 왜 중요한지, 이번 연구의 한계는 무엇인지, 따라서 앞으로 어떤 연구가 더 필요한지 학계에 있는 동료들에게 '새로운 방향성'을 제시할 수 있는 것이 '좋은 논문'이라고 생각한다.

연구 실패의 원인이 실험 오류가 아닌 '생각의 부재'로 바뀌지 않도록, 우리는 검증과 비판의 끈을 놓지 말아야한다.

저작권자 © 히트뉴스 무단전재 및 재배포 금지