2025.12.12 (금)

  • 구름많음동두천 -5.2℃
  • 흐림강릉 0.7℃
  • 맑음서울 -2.9℃
  • 맑음대전 -3.4℃
  • 흐림대구 -0.4℃
  • 흐림울산 4.0℃
  • 맑음광주 -1.1℃
  • 구름조금부산 5.5℃
  • 구름조금고창 -2.3℃
  • 맑음제주 4.9℃
  • 구름조금강화 -5.1℃
  • 구름조금보은 -4.8℃
  • 흐림금산 -4.9℃
  • 맑음강진군 -2.2℃
  • 흐림경주시 3.3℃
  • 구름조금거제 4.8℃
기상청 제공

"구글 제미나이 넘는 성능으로 'AI 왕좌' 재확인"…오픈AI, GPT-5.2 전격 공개

전문가형 '프로 모드' 신설, 추론·코딩 성능 대폭 향상
연령예측 기반 미성년자 보호 강화…AI 안전성도 UP

 

【 청년일보 】 글로벌 AI 주도권 경쟁이 격화되는 가운데, 오픈AI가 한 달 만에 차세대 모델 'GPT-5.2'를 발표하며 다시 한번 기술 우위를 과시했다. 구글 제미나이3 프로가 높은 벤치마크 점수로 존재감을 키운 직후 등장한 신모델로, 오픈AI의 '속도전' 전략이 본격화됐다는 평가가 나온다.

 

오픈AI는 11일(현지시간) GPT-5.2 시리즈를 공개하며 "전문 지식 작업과 추론 능력을 대폭 강화한 가장 진보된 모델"이라고 소개했다. GPT-5.2는 기존의 '즉답(Instant)'·'사고(Thinking)' 모드에 더해 장시간 깊이 있는 분석을 수행하는 '프로(Professional)' 모드를 새로 도입해 총 3단 구성으로 재편됐다.

 

새 모델은 여러 글로벌 벤치마크에서 두드러진 성능 향상을 보였다.

 

GDPval(44개 전문 직종 능력 평가)에서 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가 수준에 도달했다. 이전 GPT-5(38.8%) 대비 두 배 가까이 오른 수치다.

 

SWE(소프트웨어 엔지니어링 테스트)에서는 80%를 기록해 구글 제미나이3 프로(76.2%)를 처음으로 앞섰다. 클로드 오퍼스 4.5(80.9%)와도 사실상 동급이다.

 

박사급 추론 능력 시험인 HLE 평가에서는 별도 도구 없이 진행한 테스트에선 제미나이에 근소하게 뒤졌지만, 웹 검색 등 도구를 활용한 평가에서는 50%를 기록하며 제미나이(45.8%)를 상회했다.

 

오류 감소도 눈에 띄었다. 내부 실험 기준 GPT-5.2 사고 모드의 환각 오류율은 6.2%로 전작보다 30% 줄었다. 복잡한 문서의 맥락 이해, 그래프·사진·도표 해석 능력, 다단계 프로세스 해결력 등도 개선됐다.

 

오픈AI는 "특히 코딩·수학·장문 분석 등 연속적 사고가 필요한 영역에서 안정성과 신뢰도가 높아졌다"고 평가했다.

 

새 버전에서는 사용자 보호 기능도 강화됐다. 오픈AI는 GPT-5.2에 연령 예측 모델을 적용해 18세 미만 사용자에게 자동으로 안전 콘텐츠 필터링을 제공토록 했다. 정신건강·민감 주제 대응 방식도 조정했으며 부모 통제 기능도 확장했다.

 

GPT-5.2는 이날부터 유료 구독자에게 순차 제공되며, 개발자도 API를 통해 사용할 수 있다. 기존 GPT-5.1은 약 3개월 뒤 서비스가 종료된다.

 

흥미로운 점은 출시 시점이 당초 계획보다 앞당겨졌다는 점이다. 월스트리트저널(WSJ)에 따르면 구글이 제미나이3 프로를 공개하자 샘 올트먼 오픈AI CEO는 사내에 '코드 레드(Code Red)'를 발령하고 전사적 대응을 지시한 것으로 알려졌다. 오픈AI는 내년 1월 또 다른 신규 모델을 내놓을 예정이며, 이후 경보를 해제할 계획이다.

 

AI 기술 패권을 둘러싼 경쟁이 격화되는 가운데, GPT-5.2는 오픈AI가 다시 한 번 '문제 해결형 AI' 분야에서 우위를 점하려는 의지를 분명히 한 신호로 해석된다.
 


【 청년일보=조성현 기자 】




청년발언대

더보기


기자수첩

더보기

배너
배너
배너
배너
배너
배너
배너
배너