“엔드 투 엔드 기술로 차별화할 것”
네이버클라우드가 글로벌 문자인식 기술 경진대회에서 1위에 오르며 광학문자인식(OCR) 분야 경쟁력을 입증했다. OCR은 멀티모달 거대언어모델(LLM)의 성능 향상에 핵심 역할을 담당하는 중요 기술이다.
9일 정보통신기술(ICT) 업계에 따르면 네이버클라우드는 지난달 16~21일 중국 우한에서 개최된 국제패턴인식학회(IAPR)의 학술 콘퍼런스 'ICDAR(International Conference on Document Analysis and Recognition) 2025'에서 열린 경진대회에서 1위를 차지했다.
IDCAR은 IAPR이 1991년부터 개최한 문서 분석 및 인식 관련 학술 콘퍼런스다. 네이버와 네이버클라우드는 IDCAR에서 2018년, 2019년 2022년에 이어 올해 통산 4번째 1위를 기록했다. 이번 대회에서 네이버클라우드는 스위스 로잔연방공대를 제쳤다.
네이버클라우드는 '역사 지도 텍스트 판독' 영역에서 높은 평가를 받았다. 이 부문은 과거에 만들어진 지도 이미지 속의 복잡한 레이아웃으로 구성된 텍스트를 검출하는 고난도 과제로 구성됐다. 문서 이미지 내 텍스트 및 좌표를 동시에 추출하는 '엔드 투 엔드' 방식의 모델로 높은 문자 인식 기술을 인정받았다.
네이버클라우드 관계자는 "엔드 투 엔드 방식을 적용해 향후 비정형 문서를 판독하고 자유 곡선 형태로 배열된 텍스트도 정확하게 추출할 수 있는 차별화된 OCR 기술을 선보이겠다"며 "글로벌 수준의 기술 노하우를 활용해 비전 AI 기술로 확장할 계획"이라고 말했다.
임성원 기자 sone@dt.co.kr
실시간 주요뉴스
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0