대형 언어 모델(LLM), 항상 큰 것이 더 나은가?
구글 클라우드의 데이터, 분석 및 AI 전략과 아웃바운드 제품 관리 부문 전무 이사인 야스민 아흐마드(Yasmeen Ahmad)는 최근 VB Transform에서 이 주제에 대한 통찰력을 공유했습니다. 그녀의 명쾌한 대답은? "예, 그리고 아니오."
대형 LLM은 일반적으로 더 나은 성능을 보이지만, 그 성과가 무한하지는 않습니다. 아흐마드는 특정 도메인 데이터로 훈련된 소형 모델이 대형 모델보다 우수할 수 있음을 강조했습니다. "데이터는 핵심입니다." 그녀는 산업 중심 정보가 모델을 강화하는 방법을 언급했습니다.
이런 접근 방식은 기업 내에서 창의성, 효율성 및 포용성을 촉진합니다. 접근이 어려웠던 데이터를 활용함으로써 조직은 직원들을 혁신적인 방식으로 참여시킬 수 있습니다.
"생성 AI는 기계가 창출할 수 있는 것들의 지평을 넓히고 있습니다." 아흐마드는 말했습니다. "기술과 마법의 경계를 흐리게 하여 우리가 마법이라 여기는 것을 재정의할 수 있습니다."
새로운 AI 기반의 필요성
특정 기업 환경 내에서 LLM을 효과적으로 훈련시키기 위해서는 두 가지 핵심 기술이 필요합니다: 파인튜닝과 검색 증강 생성(RAG). 파인튜닝은 LLM이 "귀사의 비즈니스 언어"를 이해하도록 돕고, RAG는 문서와 데이터베이스와 같은 다양한 소스의 실시간 데이터에 모델을 연결합니다.
"이것은 재무 분석, 위험 분석 등을 위한 정확한 답변을 가능하게 합니다." 아흐마드는 설명했습니다.
LLM의 진정한 강점은 비디오, 텍스트, 이미지와 같은 다양한 데이터 유형을 처리할 수 있는 멀티모달 능력에 있습니다. 기업 데이터의 80~90%가 멀티모달이라는 점에서 아흐마드는 이 정보를 효과적으로 활용하는 것이 중요하다고 강조했습니다.
구글 연구에 따르면, 멀티모달 데이터를 활용할 경우 고객 경험이 20~30% 향상되며, 기업이 고객 감정과 시장 트렌드에 대한 제품 성과를 평가하는 능력을 강화했습니다.
"더 이상 단순한 패턴 인식만이 아닙니다." 아흐마드는 말했습니다. "LLM은 이용 가능한 모든 데이터에 접근하여 우리 조직의 복잡성을 이해할 수 있습니다."
전통적인 기업들은 멀티모달 정보를 처리하는 데 어려움을 겪는 구식 데이터 인프라 문제에 직면해 있습니다. AI의 미래는 이러한 복잡성을 처리할 수 있도록 구축된 새로운 기반이 필요합니다.
대화형 AI: 상호작용의 역할
아흐마드는 성공적인 LLM에 있어 질문-응답 상호작용의 중요성도 강조했습니다. 비즈니스 데이터와 대화하는 것이 매력적이지만, 도전 과제가 따릅니다.
예를 들어, 동료에게 다음 분기의 판매 예측을 요청할 때 맥락을 제공하지 않으면 그들의 답변은 모호할 수 있습니다. LLM도 마찬가지로 정확한 응답을 제공하기 위해서는 의미적 맥락과 메타데이터가 필요합니다.
인간의 분석은 질문을 정제하고 명확성을 얻기 위한 왕복 대화를 포함하는 경우가 많습니다. 마찬가지로 LLM도 고립된 일회성 상호작용에서 벗어나 "차세대 대화형 AI"로 진화해야 합니다.
"개인 데이터 사이드킥으로 생각해보세요." 그녀는 제안했습니다. 이 tireless worker는 사려 깊은 대화를 나누며 쿼리에서 투명성을 제공하여 사용자가 결과를 신뢰할 수 있도록 합니다.
아흐마드는 "행위적 AI"의 출현을 언급했습니다. 결정 내리고 목표를 추구할 수 있는 시스템으로, 이러한 모델은 작업을 하위 작업으로 나누고 전략적 사고 능력을 발전시켜 인간의 사고 과정을 모방합니다.
실시간 기능이 발전함에 따라 이러한 발전이 이전에는 유례없이 빠르게 이루어지고 있습니다. "미래는 이미 도래하였고, 새로운 비즈니스 형태가 생겨나고 있습니다." 아흐마드는 마무리했습니다. "우리는 이 기술이 가능하게 할 수 있는 것의 시작에 불과합니다."