생성형 AI가 등장한 지 1년이 지나면서, 기술자들은 대규모 언어 모델(LLM)의 사람과 유사한 응답 능력에 매료되었습니다. 기술 분야의 주요 발전은 시간이 지나면서 점차 축소되는 경향을 보입니다. 메인프레임은 클라이언트-서버 모델로 발전했고, PC는 모바일 컴퓨팅 수요에 대응하기 위해 태블릿과 스마트폰과 협력했습니다. 생성형 AI 소프트웨어에서도 비슷한 경향이 나타나고 있습니다. 핵심 추진력은? 작고 강력한 생성형 AI 서비스를 소형 기기에 배포하는 것입니다. 이는 10년 전 애플리케이션이 모바일화된 방식과 유사합니다.
모델 소형화의 추세는 적절한 모델 선택을 담당하는 IT 리더들에게 혼란을 가중시키고 있습니다. 다행히도 소형 언어 모델(SLM)을 선택하기 위한 전략적 프레임워크가 있습니다.
LLM과 SLM 비교
먼저, LLM과 SLM의 차이를 명확히 해야 합니다. 두 모델을 구분하는 보편적인 기준은 없습니다. LLM은 보통 수천억 개의 파라미터로 이루어져 있으며, 이는 훈련 과정에서 학습된 가중치와 편향을 포함합니다. 반면, SLM은 수억에서 수백억 개의 파라미터를 갖습니다.
LLM은 텍스트, 이미지, 오디오, 비디오 등 다양한 콘텐츠를 생성하고 복잡한 자연어 처리(NLP) 작업을 수행할 수 있지만, 이를 운영하기 위해 상당한 서버 용량과 스토리지, GPU가 필요합니다. LLM은 높은 비용이 수반되므로 환경, 사회, 지배구조(ESG) 준수를 고려할 때 일부 조직에서는 선택이 어려울 수 있습니다.
반면, SLM은 자원을 적게 소비하면서도 놀라운 성능을 보여주며, 특정 벤치마크에서 LLM과 경합할 수 있습니다. 맞춤화가 가능하여 데이터 세트에 따라 훈련하거나 검색 결과를 향상시키는 등 특정 작업에 최적화할 수 있습니다. 많은 경우, SLM은 온프레미스 배포에 적합합니다.
소형 모델에 대한 트렌드는 하이퍼스케일러와 스타트업 사이에서 확산되고 있으며, 노트북부터 스마트폰까지 모바일 기기를 위해 설계된 소형 모델이 다수 출시되고 있습니다. 주목할 만한 예로는 Google이 12월에 발표한 Gemini 라인과 Mistral AI의 Mixtral 8x7b 모델, Microsoft의 Phi-2 모델이 있습니다. 2월에는 Google의 Gemma 모델이 소개되었습니다.
적절한 모델 선택
LLM과 SLM 중 선택은 요구되는 파라미터 수와 예산에 따라 달라집니다. SLM이 귀하의 조직에 적합한지 판단하기 위한 가이드는 다음과 같습니다:
1. 비즈니스 필요 평가: 고객 지원을 위한 새로운 챗봇 또는 판매 및 마케팅을 위한 콘텐츠 생성 등 해결하고자 하는 구체적인 문제를 식별합니다. 사용 사례를 이해하는 것이 중요합니다.
2. 시장 조사: 현재 인력, 프로세스, 기술을 토대로 다양한 모델을 탐색하여 최적의 모델을 찾습니다. 크기, 작업 관련 성능 지표 및 훈련 및 미세 조정을 위한 데이터 품질을 고려합니다. 확장성과 보안이 요구 사항을 충족하는지 확인합니다.
3. 모델 비교 테스트 실행: 선호하는 SLM을 테스트하여 모델의 정확성, 일반화, 해석 가능성 및 속도를 평가합니다. 각 차원에서의 강점과 약점을 파악합니다.
4. 자원 요구 사항 평가: 조직의 서버, 스토리지, GPU 필요성과 비용을 평가합니다. 비즈니스 성과와 관련된 출력을 분석하기 위해 가시성과 AIOps를 구현할 필요성을 고려합니다.
5. 배포 전략 수립: 선택한 SLM을 기존 시스템에 통합하기 위한 포괄적인 전략을 개발하며, 보안 및 데이터 개인 정보를 다루고 유지 관리 및 지원 계획을 수립합니다. 공용 모델을 선택하는 경우 신뢰할 수 있는 지원을 보장하고, 오픈 소스를 선택하는 경우에는 최신 정보를 유지합니다.
마무리
생성형 AI 환경은 빠르게 진화하고 있습니다. 중요한 발전을 놓치지 않기 위해 정보를 유지하는 것이 필수적입니다. 귀하의 비즈니스에 맞춘 올바른 모델, 인프라 및 전략을 선택하는 데 도움을 줄 수 있는 파트너 생태계가 점점 더 확장되고 있습니다. 적합한 파트너와 협력하여 직원과 고객을 위한 최적화된 생성형 AI 서비스를 구현할 수 있습니다.
협력하고 혁신할 준비가 되셨나요? Dell APEX for Generative AI가 귀하의 운영에 AI를 원활하게 통합하는 데 어떻게 도움이 되는지 알아보십시오.