|
해당 논문에는 디플리가 소리 분석 AI 완성도를 높인 성과가 담겼다. 동일한 소리라도 녹음 장치에 따른 주파수 특성 차이로 분석 정확도가 저하되는 문제에 대한 해결책이다. 독자 개발한 음향 변환 기술을 통해 데이터를 생성하고, 이를 AI 엔진에 학습시킴으로써 일반화 성능(AI가 새로운 데이터를 분석하는 능력)을 기존 대비 5.2%에서 11.5%까지 향상시켰다.
논문에서 소개한 음향 변환 모델은 이미지, 소리, 텍스트 등 콘텐츠가 가진 속성을 변경하는 딥러닝 알고리즘 ‘사이클갠’ 기법이 중심이다. 여기에 독자적인 데이터 증강 기술을 적용해 정교성을 더했다.
디플리는 해당 모델에 다수 녹음 장치의 음향 특성을 학습시키고, 이를 바탕으로 보유한 소리 데이터에 서로 다른 주파수 패턴을 부여했다. 같은 소리라도 다양한 장치에서 녹음한 듯 데이터를 변조하는 것이다. 디플리 소리 분석 AI 엔진은 생성된 데이터를 기반으로 고도화 작업을 거쳐 새로운 환경에서도 높은 정확도를 유지한다.
국제 전기전자공학협회가(IEEE)가 매년 세계 각국에서 주최하는 ICASSP는 세계 최대 음성, 영상, 통신 및 신호처리분야 국제학술대회로 인정받고 있다. 49회를 맞이하는 올해 대한민국에서 처음으로 개최됐다. 애플, 구글, 현대차 등 세계적 기업과 연구자 4000명 이상이 참석해 최신 AI 기술을 공유했다.
이수지 디플리 대표는 “디플리의 소리 분석 인공지능 엔진은 정확도가 세계 최고 수준”이라며 “이번 논문 성과 이후에도 꾸준한 기술 개발을 통해 사회 다양한 곳에서 역할을 다할 수 있는 소리 분석 솔루션 기업으로서 지속 성장하겠다”고 말했다.