월드랩스의 창립자이자 스탠퍼드 대학교 교수인 페이페이 리(Fei-Fei Li) 교수는 공간 지능(Spatial Intelligence)을 구현하는 핵심 기술로서 월드 모델(World Model)의 필요성을 강력하게 강조하고 있습니다.
🌍 월드 모델의 필요성 강조 이유
리 교수가 월드 모델에 주목하는 주된 이유는 인공지능이 단순한 언어 처리 능력을 넘어 실제 물리 세계를 이해하고 상호작용할 수 있도록 만들기 위해서입니다.
1. 3차원 물리 세계의 이해 (Physical Understanding)
• 언어 모델의 한계 극복: 대규모 언어 모델(LLM)은 텍스트라는 1차원적 데이터에 기반하여 유창한 문장을 생성하지만, 실제 세상의 3차원 공간과 물리 법칙을 이해하는 데는 근본적인 한계가 있습니다. 리 교수는 "언어는 1차원적 신호이지만 실제 세계는 (시간을 포함하면) 4차원"이라고 지적하며, LLM을 "말은 유창하지만 세상 경험이 없는 이야기꾼"에 비유합니다.
• 물리적 지식 내재화: 월드 모델은 비디오, 공간 데이터, 물리적 상호작용 등을 통해 학습하여 환경의 규칙, 역학, 인과관계를 내재화합니다. 이를 통해 공이 왜 튀는지, 물체가 부딪히면 어떻게 될지를 예측할 수 있습니다.
2. 공간 지능 구현 (Unlocking Spatial Intelligence)
• AI의 다음 프론티어: 리 교수는 AI의 다음 주요 변곡점은 공간 지능과 **대규모 월드 모델(LWM)**이라고 말합니다. 공간 지능은 AI가 3차원 공간에서 객체 간의 관계를 인식하고, 생각하며, 움직이고, 창조할 수 있는 능력입니다.
• 지각과 행동의 연결: 월드 모델은 지각(Perception)과 행동(Action) 사이의 다리 역할을 합니다. 단순히 사물을 인식하는 것을 넘어, 실제 환경에서 움직이고, 사물을 조작하고, 새로운 레이아웃을 상상하는 등의 행동을 가능하게 합니다.
3. 계획 및 예측 능력 (Planning and Prediction)
• 내부 시뮬레이션: 월드 모델은 실제 행동을 수행하기 전에 내부적으로 다양한 행동 전략과 그 결과를 시뮬레이션하고 예측할 수 있게 해줍니다. 이는 인간이 무의식적으로 공의 궤적을 예측하거나 다음 행동을 계획하는 방식과 유사합니다.
• 효율적인 학습: 이 내부 시뮬레이션 능력 덕분에, AI는 실제 환경에서의 비용이 많이 들고 느린 시행착오 학습 과정을 획기적으로 줄일 수 있습니다.
✨ 월드랩스의 목표
리 교수가 설립한 월드랩스(World Labs)는 이러한 필요성에 따라 물리적 세계를 인지하고 예측하는 월드 모델 플랫폼을 개발하고 있으며, 그 첫 상용 제품으로 텍스트, 이미지, 비디오 입력을 영속적이고 편집 가능한 3D 환경으로 변환하는 Marble을 출시했습니다.
월드 모델은 로봇 공학, 자율 주행, 제조, 건축, 가상 현실 등 물리적 공간과 상호작용하는 모든 산업에서 혁신을 이끌 핵심 기술로 간주됩니다.
이러한 월드 모델 개발이 대규모 언어 모델(LLM) 구축보다 더 복잡하다고 언급될 만큼, 리 교수는 월드 모델을 AGI(범용 인공지능) 구현을 위한 핵심 축으로 보고 있습니다.
'IT' 카테고리의 다른 글
| 고졸 출신 OpenAI Sora 연구원이 알려주는 진짜 AI 시대 생존 공략집 11가지 (1) | 2025.12.04 |
|---|---|
| 제미나이 3.0(Gemini 3.0) 출시 (0) | 2025.11.20 |
| 📜 논문 리뷰: Continuous Autoregressive Language Model (CALM) (0) | 2025.11.17 |
| Meta가 공개한 ASR의 기술원리 (0) | 2025.11.12 |
| 팔란티어의 온톨로지: RAG와 LLM의 도메인 지식 한계를 넘어서는 혁신 (0) | 2025.11.11 |