엘리스그룹, AI 문서 분석 솔루션 '헬피 도큐먼트 비전' 출시

[이데일리 김혜미 기자] 엘리스그룹이 복잡한 형태의 문서를 인공지능(AI)이 스스로 분석하고 체계적인 데이터로 바꿔주는 AI 문서 분석 솔루션 ‘헬피 도큐먼트 비전’을 29일 공개했다.

헬피 도큐먼트 비전은 문서 내 단락 뿐 아니라 표, 차트, 수식, 이미지 등 다양한 시각적 요소를 자동으로 분석할 수 있다. 테이블 처리에 극대화한 VLM(Vision Language Model)인 ‘헬피 테이블 비전’을 중심으로 글로벌 최고 수준의 오픈소스 모델들을 결합해 높은 정확도와 처리량을 동시에 확보했다.

헬피 테이블 비전은 글로벌 VLM 벤치마크 나노넷츠에서 업계 1위를 기록했으며 제조 대기업 등 산업 현장에서 활용되는 복잡한 테이블 데이터 분석에 강점이 있다. 일반 모델이 인식하기 어려운 고문서나 근현대사 문서를 수백건 수준의 데이터 학습 만으로 정확히 분석할 수 있으며 수백행에 달하는 긴 엑셀 문서 분석과 차트·그래프의 데이터 복원, 복잡한 수식 기호화 등 정밀한 구조화 데이터를 제공하는 기능도 갖췄다.

엘리스그룹은 기존 상용 솔루션과 성능을 비교한 결과 헬피 도큐먼트 비전이 문서 레이아웃 분석 및 데이터 추출에 평균 9.8초를 소요, 기존 솔루션의 33.6초를 대폭 단축했다고 설명했다. 읽기 순서 추출 정확성과 표·수식 추출 성능, 실행 시간 등 전반적인 문서 이해 성능에서도 우수성을 확인했다는 설명이다.

아울러 헬피 도큐먼트 비전은 사내 데이터와 학습 인프라를 유기적으로 결합해 금융, 의료, 법률 등 도메인별 특수 문서에 맞춘 빠른 최적화가 가능하다. 이를 통해 최근 기업들이 도입하고 있는 RAG(검색증강생성) 및 AI 에이전트 시스템 성능을 높일 수 있다.

엘리스그룹은 이번에 활용한 VLM을 문서 인식 외에 상황 판단 및 행동 수행까지 가능한 ‘시각 언어 행동 모델(VLA)’로 발전시킬 계획이다. VLA는 AI가 복잡한 매뉴얼이나 도면을 보고 실제 산업 현장에서 로봇이나 기계를 정교하게 제어하게 돕는 기술로 물리적 환경에서 AI가 움직이는 ‘피지컬 AI’의 핵심 역할을 하게 된다.