“논문도 통했다”…올거나이즈, ACL2026 채택으로 검색증강생성 기술력 입증

[이데일리 김현아 기자] 엔터프라이즈 인공지능(AI) 플랫폼 기업 올거나이즈가 생성형 AI 핵심 기술인 RAG(검색증강생성)의 ‘현실 성능 한계’를 학문적으로 입증하며 글로벌 기술력을 인정받았다.

올거나이즈는 자연어처리(NLP) 분야 최고 권위 학회인 Association for Computational Linguistics(ACL) 2026 메인 컨퍼런스‘에 제출한 논문이 최종 채택됐다고 23일 밝혔다.

ACL은 세계 3대 자연어처리 학회 중 하나로 꼽히며, 엄격한 심사 기준으로 유명하다. 올해 약 1만2000편의 논문이 제출된 가운데 약 19%만 메인 컨퍼런스에 채택됐다.

이번에 채택된 논문 ’RARE(중복 인지 검색 평가 프레임워크)‘는 기업 환경에서의 래그 시스템 평가 방법론을 다룬다. 1저자는 올거나이즈 조한준 엔지니어다.

논문의 핵심은 ’벤치마크와 실제 환경 간 성능 괴리‘다. 기존 RAG 평가는 위키피디아처럼 문서 간 구분이 명확한 환경을 전제로 설계됐지만, 실제 기업 환경은 유사 문서와 중복 정보가 많은 구조여서 동일한 기준으로는 성능을 정확히 반영하기 어렵다는 지적이다.

실험 결과도 이를 뒷받침한다. 일반 환경에서 상위 10개 검색 정확도(PerfRecall@10)이 77.9%에 달한 모델이 실제 환경에서는 금융 도메인 8.5%, 법률 도메인 5.0% 수준까지 떨어지는 것으로 나타났다.

기업들이 체감하는 ’도입 후 성능 저하‘ 현상을 수치로 입증한 것이다.

올거나이즈는 해결책으로 ▲문서를 최소 단위 사실로 분해하는 ’아토믹 팩트 디컴포지션(Atomic Fact Decomposition)‘ ▲평가 데이터 품질을 정제하는 씨알알에프(CRRF·컨센서스 랭크 기반 리시프로컬 퓨전) 기법을 제시했다. 이를 통해 기업은 자사 데이터에 맞는 맞춤형 래그 벤치마크를 구축할 수 있다.

해당 기술은 이미 자사 AI 플랫폼 ’알리(Alli)‘에 적용돼 실제 서비스 환경에서 활용되고 있다. 연구 성과가 논문에 그치지 않고 제품으로 이어졌다는 점에서 의미가 크다.

이창수 올거나이즈 대표는 “현장에서 출발한 문제의식이 학문적으로도 인정받은 사례”라며 “앞으로도 연구와 제품을 연결하는 선순환 구조를 통해 AI 혁신을 이어가겠다”고 말했다.