2024.06.02 (일)

  • 맑음동두천 14.6℃
  • 구름조금강릉 14.2℃
  • 맑음서울 16.7℃
  • 맑음대전 15.9℃
  • 구름많음대구 16.8℃
  • 박무울산 16.6℃
  • 구름많음광주 16.7℃
  • 구름조금부산 17.9℃
  • 구름많음고창 15.4℃
  • 흐림제주 17.9℃
  • 맑음강화 16.5℃
  • 맑음보은 13.1℃
  • 구름많음금산 13.2℃
  • 흐림강진군 17.1℃
  • 구름조금경주시 16.4℃
  • 구름조금거제 17.9℃
기상청 제공

美 연구팀 "GPT 탐지기, 비영어권 글 61% AI로 오판"

토플 에세이 사용 GPT 탐지기 7개에 대한 성능 평가 결과
"챗GPT 등 낮은 난해성으로 텍스트 생성하도록 훈련돼 있어"

 

【 청년일보 】 챗GPT와 같은 생성형 인공지능(AI)이 작성한 글을 찾아내는 GPT 탐지기가 영어를 모국어로 하는 것이 아닌 경우 AI가 작성했다고 오판하는 경향이 있어 사용에 주의해야 한다는 지적이 나왔다.


12일 미국 스탠포드 대학교(Stanford University) 제임스 저우(James Zou) 연구팀은 '패턴스(Patterns)'에서 중국 포럼의 토플(Test of English as a Foreign Language, TOEFL) 에세이(Essay) 91개와 Hewlett Foundation의 ASAP 데이터 세트의 미국 8학년 에세이 88개에 대해 널리 사용되는 GPT 탐지기 7개의 성능을 평가한 결과, 토플 에세이의 절반 이상인 61.3%를 AI가 작성한 것으로 오판한 것으로 나타났다고 밝혔다.


연구팀에 따르면 모든 GPT 탐지기는 사람이 작성한 TOEFL 에세이의 19.8%를 AI가 작성한 것으로 만장일치로 식별했다. 또, 적어도 하나의 탐지기는 TOEFL 에세이의 97.8%를 AI가 생성한 것으로 표시했다.


반면 미국 8학년 학생들이 작성한 에세이의 90% 이상을 인간이 작성한 것으로 정확하게 분류할 수 있었다.

 

 

이에 대해 저우 교수는 "간단한 단어를 사용하는 것보다 복잡하고 화려한 단어를 사용하는 것이 탐지에서 벗어날 확률이 높다"고 설명하며 "챗GPT와 같은 모델은 평범한 사람이 말하는 방식을 더욱 잘 시뮬레이션하기 위해 낮은 난해성으로 텍스트를 생성하도록 훈련됐기 때문"이라고 말했다.


챗GPT와 같은 GPT 기반의 생성형 AI 모델은 최근 상당한 주목을 받고 있다.


출시 후 불과 2개월 만에 ChatGPT는 1억 명 이상의 월 활성 사용자를 확보하는 등 역사상 가장 빠르게 성장하는 소비자 인터넷 애플리케이션 중 하나로 자리매김했다.


다만, 생산성 향상 및 창의성 촉진이라는 놀라운 잠재력에도 불구하고, 생성형 AI는 사람이 작성한 듯한 콘텐츠의 확산과 같은 위험을 내포하고 있다. 이에 가짜 콘텐츠 및 시험 부정행위의 확산으로 이어질 수 있다는 우려도 커지고 있다.


특히 교육자들은 학생들이 업무에서 생성형 AI를 언제 어디서 사용했는지 확인하는 데 점점 더 많은 관심을 기울이고 있다. 그러나 여러 연구에서도 알 수 있듯이 인간이 육안으로 AI 생성 콘텐츠를 탐지하는 데 어려움이 있다.


연구팀은 "AI가 작성한 콘텐츠와 관련된 위험을 완화하기 위해 여러 GPT 탐지기가 개발 및 구현됐지만 제한된 평가로 인해 정확성, 신뢰성 및 효율성이 불확실하다"며 "효과적인 탐지 방법이 필요하다"고 전했다.


이어 "GPT 탐지기의 오판으로 인해 무고한 학생이 피해를 입을까 우려된다"고 덧붙였다.
 


【 청년일보=조성현 기자 】




청년발언대

더보기


기자수첩

더보기

배너
배너
배너
배너