“데이터만 쌓아선 범용로봇 못 만든다"···MIT 석학이 제시한 해법은

[이데일리 신영빈 기자] “데이터만으로 사람처럼 똑똑한 로봇을 만들기는 어렵습니다. 로봇은 세계를 이해하고, 목표를 해석하고, 행동 결과를 추론할 수 있어야 합니다.”

로봇 인공지능(AI) 분야 세계적 석학인 레슬리 팩 캘블링 MIT 컴퓨터과학·공학과 파나소닉 석좌교수는 3일 서울 강남구 웨스틴 서울 파르나스에서 열린 ‘글로벌 AI 프론티어 심포지엄 2026’ 기조연설에서 범용 로봇 개발의 핵심 조건으로 ‘합리적 로봇(Rational Robots)’ 접근을 제시했다.

레슬리 팩 캘블링 MIT 컴퓨터과학·공학과 파나소닉 석좌교수가 3일 서울 강남구 웨스틴 서울 파르나스에서 열린 ‘글로벌 AI 프론티어 심포지엄 2026’에서 발표하고 있다. (사진=신영빈 기자)

캘블링 교수는 현재 로봇 기술이 사람처럼 다양한 문제를 유연하게 해결하는 범용 로봇 수준에는 아직 도달하지 못했다고 진단했다. 공장 로봇은 정밀하지만 제한된 환경에 강하고, 로봇청소기 같은 서비스 로봇은 다양한 환경에서 작동하지만 복잡한 작업 수행 능력은 제한적이라는 설명이다.

그는 “오랫동안의 연구 목표는 사람이 현실 세계에서 할 수 있는 일을 로봇도 할 수 있게 만드는 기초 과학을 찾는 것이었다”며 “이를 위해서는 엔지니어링과 데이터가 모두 필요하지만, 둘 중 하나만으로는 충분하지 않다”고 말했다.

특히 그는 최근 로봇 AI 분야에서 확산되는 대규모 데이터 기반 블랙박스 학습 방식의 한계를 지적했다. 관측값을 바로 행동으로 연결하는 방식은 일정 부분 성과를 낼 수 있지만, 현실 세계의 복잡한 상황을 모두 포괄하려면 막대한 데이터가 필요하다는 것이다.

캘블링 교수는 “모델이 복잡하고 유연해질수록 필요한 데이터는 훨씬 더 많이 늘어난다”며 “엔지니어가 완벽한 프로그램을 직접 작성할 수도 없지만, 구조 없는 학습만으로도 지능형 로봇에 도달하기 어렵다”고 강조했다.

그가 제시한 해법은 딥러닝과 고전 로봇공학, 컴퓨터과학의 추론·계획 기법을 결합하는 방식이다. 로봇이 3차원 세계에 대한 명시적 믿음, 인간이 부여한 목표, 행동이 세계에 미치는 영향에 대한 모델을 갖고 가장 효과적인 행동을 추론해야 한다는 의미다.

그는 “우리는 3차원 세계에 존재하며, 세계는 사물로 구성돼 있고, 물리 세계에서 행동의 효과는 국소적”이라며 “로봇은 인간으로부터 다양한 지시를 받을 수 있어야 한다”고 했다. 이어 “로봇이 합리적으로 움직인다는 것은 현재 주변 상황과 목표를 이해하고 각 행동이 가져올 결과를 따져 가장 적절한 선택을 하는 것”이라고 설명했다.

캘블링 교수는 로봇 내부에 구조를 둬야 한다고 주장했다. 로봇이 현재 세계 상태를 모델링하고, 자신의 행동이 세계를 어떻게 바꿀지 예측하며, 목표를 달성하기 위한 계획을 세우는 구조다. 그는 “시각 신호를 처리하는 방식과 언어를 처리하는 방식, 보스턴에서 서울까지 이동 계획을 세우는 방식은 같지 않다”며 기능별 모듈화의 필요성을 강조했다.

기조연설에서는 MIT 연구진의 실험 사례도 소개했다. 로봇이 한 장의 이미지에서 3D 장면을 재구성하고, 물체의 위치와 형태를 파악한 뒤, 물체를 어떻게 잡고 옮길지 계획하는 방식이다. 단순히 눈앞의 물체를 집는 것이 아니라, 목표 달성을 위해 어떤 장애물을 먼저 치워야 하는지까지 추론해야 한다는 설명이다.

그는 테이블 위 커피캡슐을 직사각형 트레이에 넣는 예시를 들며 “세 개의 커피캡슐을 트레이에 넣으려면 먼저 콜라 캔을 치워야 한다는 점을 생각해내야 한다”며 “이를 위해서는 앞을 내다보고 행동의 인과관계를 추론해야 한다”고 말했다. 이어 “이런 깊은 인과 추론은 현재 대부분의 로봇 모델이 아직 잘하지 못하는 부분”이라고 짚었다.

인간 시연 학습도 단순 모방을 넘어야 한다고 봤다. 그는 사람이 주방에서 특정 행동을 보여주며 “내일 이것을 해달라”고 말했을 때, 로봇은 손의 궤적을 그대로 따라 할지, 물체의 최종 상태를 배울지, 시연자의 의도를 추상화해 배울지를 판단해야 한다고 설명했다.

캘블링 교수는 “시연에서 무엇을 배워야 하는지는 잘 정의된 문제가 아니다”라며 “무엇을 배울 수 있는지는 이미 무엇을 알고 있느냐에 달려 있다”고 말했다. 요리 전문가라면 한 번의 시연만 보고도 다른 재료와 환경에서 응용할 수 있지만, 비전문가는 같은 도구와 순서가 아니면 따라 하기 어렵다는 비유도 들었다.

결론적으로 그는 로봇 AI가 ‘데이터냐 구조냐’의 이분법을 넘어야 한다고 강조했다. 많은 데이터와 최소한의 구조로도 언젠가는 많은 것을 학습할 수 있지만, 단기적으로는 인간이 알고 있는 세계의 구조를 시스템에 반영하고 데이터를 효율적으로 쓰는 공학적 접근이 필요하다는 것이다.

캘블링 교수는 “엄청난 데이터와 매우 적은 구조만으로도 언젠가는 무엇이든 학습할 수 있을지 모르지만, 데이터와 구조 사이의 균형을 고민해야 한다”며 “앞으로는 시스템을 신중하게 설계하고 데이터를 최대한 효율적으로 쓰는 방법을 찾아야 한다”고 말했다.