오늘, Google DeepMind는 2B 및 7B 파라미터로 제공되는 새로운 오픈 소스 AI 모델인 Gemma의 출시를 발표했습니다. 이러한 모델은 최근 공개된 Gemini 모델에 사용된 동일한 연구 및 기술을 활용합니다.
Gemma는 사전 학습(pre-trained) 및 지침 조정(instruction-tuned) 버전으로 제공되며, 사용 조건이 너그러운 상업적 라이선스와 책임 있는 생성 AI(toolkit)를 포함합니다. 또한 Google DeepMind는 주요 프레임워크인 JAX, PyTorch, TensorFlow(Keras 3.0 포함)와 호환되는 추론 및 감독된 미세 조정(SFT) 도구 체인을 제공합니다. 개발자는 즉시 사용할 수 있는 Colab 및 Kaggle 노트북에 접근할 수 있으며, Gemma는 Hugging Face, MaxText, NVIDIA NeMo와 호환됩니다. 사전 학습 및 지침 조정 모델은 노트북, 워크스테이션 또는 Google Cloud에서 실행할 수 있으며, Vertex AI와 Google Kubernetes Engine을 통한 배포 옵션도 제공됩니다.
NVIDIA는 Gemma의 성능을 향상시키기 위해 Google과 협력하여 모든 NVIDIA AI 플랫폼, 특히 로컬 RTX AI PC에서 최적화를 강화했습니다.
Google의 개발자 X 부사장 겸 총괄 매니저인 Jeanine Banks는 Gemma 모델이 TensorFlow, JAX와 같은 도구와 PaLM2, AlphaFold 모델을 바탕으로 한 Google의 오픈 소스 기술에 대한 헌신의 연속성을 나타낸다고 언급했습니다. 그녀는 Gemini 모델 개발 중, 개발자들이 작업 흐름의 다양한 단계에서 오픈 모델과 API를 동시에 활용한다는 통찰을 강조했습니다. "우리는 API와 오픈 모델을 모두 제공하여, 커뮤니티를 위한 가장 폭넓은 기능을 제공하고자 합니다,"라고 Banks는 말했습니다.
Google DeepMind의 제품 관리 이사인 Tris Warkentin은 Gemma를 다른 모델과 함께 평가할 포괄적인 벤치마크를 공개할 것이라고 발표했으며, 이는 OpenLLM 리더보드에서 접근할 수 있습니다. "우리는 NVIDIA 및 Hugging Face와 협력하여 모든 공개 벤치마크가 이러한 모델에 대해 수행되도록 할 것입니다,"라고 그는 말하며 개발 과정에서의 투명하고 커뮤니티 중심의 접근에 대한 자부심을 표현했습니다.
Gemma는 '설계상 책임이 있는' 모델로 설명됩니다. Warkentin은 이 모델들이 안전성을 보장하기 위해 광범위한 평가를 거쳤다고 강조했습니다. Google DeepMind 블로그 게시물은 Gemma가 AI 원칙에 부합하며, 훈련 데이터셋에서 개인 정보를 필터링하는 자동화 기법을 통합하고, 사람 피드백으로부터 강화 학습(RLHF)을 통해 책임 있는 행동을 촉진하도록 설계되었다고 상세히 설명했습니다. 철저한 평가가 이루어지며, 수동의 레드 팀(red teaming) 및 자동화된 적대적 테스트가 포함되어 모델의 위험 프로필을 평가했습니다.
Warkentin은 책임 있는 AI를 구축하는 데 있어 열린 생태계의 중요성을 강조했습니다. “우리는 전 세계의 개발자와 연구자들의 다양한 관점이 효과적인 피드백과 안전 시스템 강화에 필수적이라고 믿습니다,”라고 그는 말했습니다. “이러한 피드백과 커뮤니티와의 소통 통합이 이 프로젝트의 가치를 높이는 핵심입니다.”