|
이 모델은 DOCX, PDF, PPTX, PNG 등 업무에 사용하는 9가지의 문서를 처리할 수 있을 뿐만 아니라 수식을 인식하거나 이미지를 추출하는 기능도 가지고 있다.
또한 OCR로 데이터를 인식할 때 마크다운 형식을 사용해 기존 데이터보다 크기를 줄일 수 있다.
김성훈 업스테이지 대표는 “Document Parse는 각 기업이 가진 기존 문서를 정확하게 자산화시켜 실제 업무에 효율적으로 적용하는 최적의 도구”라며 “다양한 비즈니스에서 활용돼 업무 혁신을 현실화할 것”이라고 밝혔다.
한편 업스테이지는 2023년 공식적으로 OCR 서비스를 선보인 직후 글로벌 최고 권위의 AI OCR 경진대회인 ‘ICDAR’에서 아마존과 엔비디아 등의 빅테크 기업을 제치고 1위를 차지했다.