신흥 대형 언어 모델(LLMs)인 OpenAI의 ChatGPT(GPT-4 포함), Claude AI, 그리고 Gemini는 제한된 의사결정 능력을 보여주고 있습니다. 이 글에서는 LLM 의사결정에 대한 최근 연구와 그 미래에 대한 시사점을 탐구합니다.
전통적으로 LLM에서 효과적인 의사결정은 기본 패턴이나 규칙을 인식하고 이를 새로운 상황에 유연하게 적용하는 데 달려 있습니다. 산타페 연구소의 연구에 따르면, ChatGPT를 포함한 LLM은 "기본 개념에 대해 추론하는 데 어려움을 겪는다"고 합니다. 올바른 결정을 내리려면 프롬프트의 맥락과 출력의 잠재적 결과에 대한 깊은 이해가 필요합니다.
LLM의 잘못된 의사결정은 해로운 결과를 초래할 수 있습니다. 예를 들어, 2023년, 국가 섭식 장애 협회는 AI 챗봇 '테사'가 주간 체중 측정 및 500~1,000 칼로리의 칼로리 부족을 권장하는 해로운 조언을 제공하면서 서비스 중단을 결정했습니다. 이로 인해 챗봇은 신속하게 비활성화되었습니다.
LLM은 또한 일반적인 추천을 생성하는 경향이 있습니다. INSEAD의 연구에 따르면, 비즈니스 전략 질문을 제시했을 때 ChatGPT는 종종 협업 및 혁신 문화 촉진과 같은 전통적인 지혜에 의존했습니다. 그러나 비즈니스 전략은 맞춤형 통찰력을 요구하는 복잡한 과정입니다.
비즈니스 전략이나 의료 조언을 위해 LLM을 특별히 훈련하는 것이 이러한 문제를 해결할 수 있다는 반론도 있습니다. 그러나 그들의 맥락 이해를 향상시키는 것은 단순히 데이터셋을 확장하는 것으로 해결될 수 없습니다. 더 많은 데이터를 추가하는 것은 편향을 도입하고 계산 요구를 증가시킬 수 있으며, 이는 의사결정 품질 향상으로 이어지지 않을 수 있습니다.
맥락에 적합한 의사결정 능력 활성화
LLM의 맥락에 적합한 의사결정 훈련은 정교한 접근 방식이 필요합니다. 현재 기계 학습 연구에서 제안하는 두 가지 고급 전략은 LLM의 의사결정을 인간의 인지 과정처럼 향상시킬 방법을 모색합니다. 첫 번째인 AutoGPT는 자가 반성적 메커니즘을 사용하여 출력을 계획하고 검증합니다. 두 번째인 사고의 나무(Tree of Thoughts, ToT)는 전통적인 선형 추론에서 벗어나 효과적인 의사결정을 촉진합니다.
AutoGPT는 자율적으로 모델을 생성, 평가 및 조정하여 특정 목표를 달성하도록 설계되었습니다. 최근에 AutoGPT는 의사결정 과정에 전문가 모델을 통합하는 '추가 의견' 전략을 포함하는 개선이 이루어졌습니다. 이 통합은 LLM이 다양한 전문가 분석에서 관련 정보를 활용할 수 있게 하여, 체계적인 '생각-추론-계획-비판' 접근 방식을 통해 결정 결과를 개선합니다.
전문가 모델로 보강된 LLM이 효과적으로 구현된다면, 인간보다 더 많은 정보를 처리할 수 있으며, 이는 더욱 정보에 기반한 결정을 내릴 수 있음을 시사합니다. 그러나 AutoGPT는 제한된 맥락 창을 갖고 있어 무한 상호작용 루프를 초래할 수 있는 단점이 있습니다. 모든 관련 정보를 처음에 제공하는 것이 대화 중 점진적으로 데이터를 주입하는 것보다 더 나은 결과를 줄 수 있습니다.
사고의 나무로 인간 인지 모사
사고의 나무(ToT) 프레임워크는 LLM의 정확성을 향상시키기 위해 인간의 인지 과정을 모방하는 또 다른 유망한 방법을 제공합니다. 인간의 의사결정은 종종 여러 가지 시나리오를 생성하고 평가하는 과정을 포함합니다. ToT는 AutoGPT 접근법과 유사하게 LLM의 선형 추론 오류를 식별합니다. 실험에서 ToT는 퍼즐 및 창의적 작문과 같은 작업을 완수하는 데 있어 LLM이 자연어 지침을 따르는 능력을 측정합니다.
LLM의 전통적인 선형 추론은 '사고의 연쇄'로 나타나며, 이는 순차적인 의사결정 과정을 구분합니다. 그러나 ToT는 LLM의 자기 비판 능력을 향상시키고 다양한 추론 경로를 탐구하고자 합니다. 예를 들어, 24 게임에서 사고의 연쇄는 24에 도달하기 위해 다양한 수학적 연산을 식별하는 데 어려움을 겪었고, 이로 인해 낮은 정확도를 보였습니다. 반면 ToT는 여러 결과를 평가할 수 있는 능력 덕분에 동일한 작업에서 74% 정확도를 기록했습니다.
만약 LLM이 일관되게 판단력을 향상시킬 수 있다면, 향후 인간과 AI 간의 전략적 의사결정 협력이 현실이 될 수 있습니다. ToT의 응용은 코딩, 데이터 분석, 로봇공학 등 다양한 분야로 확장되며, AutoGPT는 일반 지능을 향해 나아가고 있습니다.
학계의 연구가 발전함에 따라, LLM의 인지적 의사결정을 향상시키기 위한 혁신적인 전략들이 등장하고 있습니다. 방대한 데이터를 효율적으로 분석할 수 있는 LLM의 고유한 능력을 고려할 때, 성공적인 발전이 이루어진다면 LLM이 향후 몇 년 내에 인간의 의사결정 능력에 필적하거나 이를 초과할 수 있을 것입니다.