일론 머스크, 실시간 데이터와 향상된 효율성, 유머를 갖춘 xAI의 새로운 LLM 'Grok' 소개

지난 주, xAI가 일부 사용자에게 첫 번째 AI 제품에 대한 접근을 허용하겠다고 발표한 후, 창립자 일론 머스크는 일요일 아침에 대중에게 AI를 공개했습니다. 이 제품은 머스크 특유의 엉뚱한 유머와 함께 실시간 정보 제공 및 높은 효율성을 자랑합니다.

이 AI의 이름은 "Grok"으로, OpenAI의 GPT 및 Anthropic의 Claude 2와 경쟁하기 위해 설계된 대형 언어 모델(LLM)입니다. 머스크는 2023년 11월 5일 오전 1시경 X 플랫폼에서 Grok의 출시를 발표했습니다.

xAI 웹사이트에 따르면, Grok은 현재 미국의 제한된 수의 사용자에게 제공되고 있습니다. 사용자는 조기 접근을 위해 대기자 목록에 등록할 수 있으며, X 계정이 필요합니다. Grok 사용 비용은 언급되지 않았습니다.

웹사이트는 Grok의 개발 과정을 설명하며, 프로토타입 모델 "Grok-0"는 330억 개의 데이터 파라미터로 훈련되었습니다. 비교하자면, 메타의 LLaMA 2는 700억 개의 파라미터를 가지고 있으며, OpenAI의 이전 GPT-3.5 모델은 약 200억 개의 파라미터를 가집니다. 특히 xAI는 Grok-0이 "LLaMA 2 성능에 근접하지만 훈련 자원은 절반만 사용한다"고 주장합니다.

xAI 팀은 Grok의 추론 및 코딩 능력을 상당히 향상시켜 Grok-1을 개발하였으며, 이는 Grok 챗봇의 "최전선 LLM"으로 OpenAI의 GPT가 ChatGPT를 구동하는 것과 유사합니다.

xAI는 Grok의 성능 차트를 제공하여 중학교 수학(GSM8k), 객관식 질문(MMLU), 파이썬 코드 완성(HumanEval), LaTeX로 작성된 수학 문제(MATH) 등 네 가지 기계 학습 벤치마크에서 Grok의 우수성을 보여주었습니다. xAI 사이트는 Grok이 "ChatGPT-3.5를 포함한 같은 계산 클래스의 모든 모델을 능가"하며, GPT-4와 같은 대규모 데이터셋으로 훈련된 모델에만 뒤처진다고 설명합니다. 이는 xAI의 LLM 훈련 효율성의 빠른 발전을 강조합니다.

xAI의 웹사이트에서는 Grok을 "은하수를 여행하는 히치하이커를 위한 안내서"를 모델로 삼았다고 소개하고 있습니다. 이 작품은 더글라스 애덤스의 1970년대 라디오 드라마 및 풍자적 SF 시리즈로, Grok은 거의 모든 질문에 답하면서 유머와 반항심을 가미하는 것을 목표로 하고 있습니다.

11월 3일, 머스크는 Grok의 유머러스한 질문에 대한 답변을 공유하며 "코카인을 만드는 방법"에 대한 풍자적인 단계별 가이드를 언급했습니다. 이 게시물에는 "농담이에요! 진짜로 코카인을 만들려고 시도하지 마세요."라는 명확한 면책 조항이 있었습니다.

머스크는 별도의 게시물에서 Grok의 시니컬한 성격을 강조하며, 그의 성격 형성에 영향을 미쳤음을 암시했습니다.

Grok의 독특한 기능 중 하나는 X 플랫폼을 통한 실시간 정보 접근입니다. 머스크는 아침 게시물에서 Grok의 정보 검색 능력을 일반 모델과 비교하였으며, 조 로건과의 최신 인터뷰에서 특정 질문에 대한 정확한 답변을 제시했습니다.

xAI가 Grok 훈련을 위해 X 플랫폼의 데이터를 어떻게 활용하는지는 불확실하지만, 머스크는 전에 OpenAI의 플랫폼 접근을 제한했었습니다. 이는 그가 OpenAI에 초기 참여한 후 내부 갈등으로 인해 그 사업에서 물러났다는 점에서 특히 아이러니합니다.

머스크의 최신 게시물은 Grok이 조기 베타 단계를 지나 X 프리미엄+ 구독자 모두에게 제공될 계획임을 나타내며, 롤아웃 일정은 제공되지 않았습니다. Grok의 기능을 빠르게 공유하는 것은 11월 6일에 예정된 OpenAI의 DevDay 컨퍼런스에서 새로운 AI 기능을 공개할 계획에 발맞추기 위한 것으로 보입니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles