2025.09.15 (월)

  • 맑음동두천 25.8℃
  • 구름조금강릉 27.3℃
  • 맑음서울 26.6℃
  • 구름많음대전 25.0℃
  • 흐림대구 22.6℃
  • 흐림울산 23.8℃
  • 구름많음광주 24.8℃
  • 흐림부산 27.2℃
  • 구름조금고창 25.2℃
  • 제주 24.5℃
  • 맑음강화 25.7℃
  • 구름많음보은 24.4℃
  • 구름많음금산 25.9℃
  • 구름많음강진군 26.3℃
  • 흐림경주시 22.1℃
  • 구름많음거제 25.3℃
기상청 제공

'VLM' 최적화 기술 집대성…문현준 세종대 교수, 종합 서베이 논문 발표

Vision-Language AI 모델 5대 핵심 기술 최초로 통합 분석한 종합 서베이 논문 발표

 

【 청년일보 】 세종대학교는 컴퓨터공학과 문현준 교수가 이미지와 텍스트를 동시에 처리하는 'Vision-Language Model(VLM)'의 최적화 기술들을 집대성한 종합 서베이 논문을 저명 국제 학술지 'Information Fusion'에 발표했다고 15일 밝혔다.

 

논문 제목은 'A comprehensive survey of Vision-Language Models: Pretrained models, fine-tuning, prompt engineering, adapters, and benchmark datasets'다.

 

최근 VLM 기술이 급격히 발전했지만, 관련 연구들이 개별 기술에만 초점을 맞춰 분산돼 있어 통합적인 시각을 얻기 어려웠다. 문 교수팀은 이러한 단편적인 접근의 한계를 극복하고자, 2018년부터 올해까지 발표된 115편의 핵심 논문을 체계적으로 분석했다.

 

논문은 VLM 기술을 구성하는 ▲사전 학습 모델 ▲파인튜닝 ▲프롬프트 엔지니어링 ▲어댑터 ▲벤치마크 데이터셋 등 5가지 핵심 요소를 세계 최초로 하나의 통합된 프레임워크로 제시했다. 특히, 전체 모델을 재학습하지 않고도 적은 계산 비용으로 높은 성능을 유지하는 '파라미터 효율적' 방법론의 중요성을 강조했다.

 

이번 논문이 게재된 'Information Fusion' 저널은 세계적인 학술지 평가 지표에서 최상위 수준을 공인받은 학술지다. 학술지 영향력 지표인 임팩트 팩터(IF)가 15.5에 달할 뿐만 아니라, 세계적으로 가장 권위 있는 JCR(Journal Citation Reports) 랭킹에서 컴퓨터 과학 및 인공지능 분야 상위 1.7%에 해당하는 백분위 순위를 기록하며 '상위 1% 저널'로 평가받는다. 또한, 다른 주요 지표인 CiteScore에서도 여러 세부 분야에 걸쳐 모두 상위 1~2%의 압도적인 순위를 차지하고 있어, 해당 분야 최고 권위의 학술지로 인정받고 있다.

 

문현준 교수는 "이번 논문은 다양한 실제 시나리오에 VLM을 최적화하려는 연구자와 실무자들에게 기초적인 자료(foundational resource)를 제공하는 것을 목표로 한다"며 "향후 확장성, 일반화, 편향 등 VLM의 난제들을 해결하고 상징적 추론, 다국어 적응과 같은 새로운 연구 방향을 탐색하는 데 기여하길 바란다"고 말했다.

 

한편, 이번 연구는 한국콘텐츠진흥원(Korea Creative Content Agency)의 지원을 받아 수행됐다.

 


【 청년일보=조성현 기자 】




청년발언대

더보기


기자수첩

더보기

배너
배너
배너
배너