AI 선구자 얀 르쿤은 오늘 파리의 VivaTech에서 차세대 개발자들에게 대형 언어 모델(LLM)을 피하라고 조언하며 활발한 토론을 촉발했습니다. “이 분야는 대기업들이 지배하고 있어 여러분이 기여할 여지가 적습니다,”라는 르쿤의 발언이었습니다. “대신 LLM의 한계를 넘는 차세대 AI 시스템에 집중하세요.”
메타의 수석 AI 과학자이자 NYU 교수인 르쿤은 현재 LLM의 단점에 관한 질문에 답변하며, “저는 LLM이 아닌 차세대 AI 시스템을 개발하고 있습니다. ‘저와 경쟁하라’는 의미입니다! 이 문제를 다루는 사람들이 많을수록 결과는 더 좋습니다!”라고 강조했습니다.
그의 메시지에도 불구하고 많은 사용자들은 '차세대 AI'의 정의 및 LLM에 대한 대안에 대해 명확한 설명을 요구했습니다. 개발자, 데이터 과학자 및 AI 전문가들은 X(이전의 트위터)에서 경계 기반 AI, 차별화된 AI, 다중 작업, 다중 모달, 범주적 심층 학습, 에너지 기반 모델, 목적 기반 소형 언어 모델, 특화된 사용 사례, 맞춤형 미세 조정, 상태 공간 모델 및 실체화된 AI를 위한 하드웨어와 같은 다양한 아이디어를 공유했습니다. 일부 사용자는 신경망에서 유망한 발전으로서 Kolmogorov-Arnold Networks(KANs)를 제안하기도 했습니다.
한 사용자는 다음과 같은 다섯 가지 차세대 AI 시스템을 개괄했습니다:
- 다중 모달 AI
- 추론 및 일반 지능
- 실체화된 AI 및 로보틱스
- 비지도 학습 및 자기 지도 학습
- 인공 일반 지능(AGI)
또 다른 사용자는 모든 학생이 다음과 같은 기초를 마스터해야 한다고 조언했습니다:
- 통계 및 확률
- 데이터 정리 및 변환
- 고전적 패턴 인식 (예: 나이브 베이즈, 결정 트리, 랜덤 포레스트)
- 인공 신경망
- 합성곱 신경망
- 순환 신경망
- 생성 AI
반면 일부는 학생들이 LLM에 참여하기에 적절한 시점이라고 주장하며, 애플리케이션이 아직 대체로 탐색되지 않았다고 강조했습니다. 프롬프트, 탈옥 및 접근성에 대해 배울 점이 많다는 것입니다.
비평가들은 르쿤의 발언이 경쟁을 억제하기 위한 것이라며, 메타의 대규모 LLM 개발을 지적했습니다. 한 사용자는 “대기업 AI 책임자가 ‘경쟁하지 마라’고 할 때, 오히려 경쟁하고 싶어진다”고 말했습니다.
객관적 목표 중심 AI와 오픈 소스 시스템의 지지자인 르쿤은 최근 파이낸셜 타임스 인터뷰에서 LLM이 논리적 추론이 부족하며 인간 수준의 지능에 도달할 수 없다고 언급했습니다. “그들은 물리적 세계를 이해하지 못하고 지속적인 기억이 없으며 의미 있게 추론하거나 계층적으로 계획할 수 없습니다,”라고 주장했습니다.
메타는 최근 복잡한 객체 상호작용을 인식하고 이해하기 위해 설계된 비디오 공동 임베딩 예측 아키텍처(V-JEPA)를 소개했습니다. 이 혁신은 르쿤의 고급 기계 지능(AMI)에 대한 비전과 일치합니다.
많은 산업 전문가들이 LLM의 한계에 대한 르쿤의 의견에 공감하고 있으며, AI 채팅 앱 Faune은 그의 통찰을 “놀랍다”고 표현하며 폐쇄 루프 시스템이 큰 경직성에 직면한다고 강조했습니다. “인간처럼 학습하고 적응할 수 있는 AI의 창조자는 아마 노벨상을 받을 것입니다,”라고 그들은 말했습니다.
그 외에도 산업이 LLM에 지나치게 집중하고 있으며, 이는 진정한 발전의 막다른 길이라고 지적하는 사람들이 많습니다. 일부는 LLM을 전화 교환원의 역할에 비유하기도 했습니다.
르쿤은 논란의 인물입니다. 그는 AI의 존재적인 위험에 대해 동료 AI 선구자 제프리 힌턴, 앤드류 응, 요슈아 벤지오와 치열한 논쟁을 벌였으며, 이러한 우려가 과장되었다고 주장합니다.
한 논평자는 힌턴과의 최근 인터뷰를 회상하며, 그가 LLM에 대해 전면 참여를 주장하고 인간과 AI 뇌 간의 밀접한 상관관계를 주장했다고 언급했습니다. “이런 근본적인 disagreement을 지켜보는 것은 매력적입니다,”라고 사용자는 덧붙였습니다.
이런 관점의 충돌은 쉽게 해결되지 않을 것으로 보입니다.