새로운 대형 언어 모델(LLM)이 출시된 지 한 달도 안 되어 OpenAI의 GPT-4를 능가한 것으로 보입니다. Anthropic이 개발한 Claude 3.5 Sonnet 챗봇은 주요 제3자 벤치마크 테스트에서 업계를 선도하며, 이전 Claude 모델보다 더 빠르고 비용 효율적이라고 주장합니다. 그러나 새로운 모델을 출시하고 우수성을 주장하는 것과 실제로 사용자들이 성능 향상을 경험하는 것은 다릅니다. (Google Gemini 가족, 주목하세요: 일부 지표에서 OpenAI의 이전 주력 모델인 GPT-4를 능가한다고 하지만, 실제 사용 경험은 다르게 나타납니다.)
대조적으로, Claude 3.5 Sonnet은 출시 이후 큰 주목을 받았으며, AI 인플루언서와 파워 유저들이 긍정적인 경험을 온라인에 공유하고 있습니다. 그들은 오늘날 "가장 지능적인" LLM이라 불리는 이 모델의 인상적인 기능을 보여주고 있습니다.
코딩 기술 향상 및 제품 제작
기업 AI 인플루언서 Allie K. Miller는 X에서 Claude 3.5 Sonnet이 스크린샷만으로 완전한 플레이 가능한 게임을 30초 만에 제작했다고 강조했습니다. 또한, @TestingCatalog News의 정보 계정은 Claude 3.5 Sonnet과 함께 도입된 “Artifacts” 놀이터를 통해 챗봇이 설계한 완전 기능의 웹 폼을 위한 실제 코드를 실행하는 능력을 보여주었습니다. 이 모델은 1995년 영화 헥서에서 영감을 받은 이미지를 재현하기도 했습니다.
EverArt의 창립자 Pietro Schirano는 X에서 Claude 3.5 Sonnet과 Maestro 툴의 조합이 “AGI의 불꽃”을 보여준다고 언급했습니다.
Anthropic 직원의 Claude 3.5 Sonnet 지지
모델의 지지자인 Anthropic 개발자 관계 리더 Alex Albert는 Claude 3.5 Sonnet의 코딩 능력 및 자동으로 풀 리퀘스트를 수정하는 기술이 성장하고 있다고 트윗했습니다. 그는 LLM이 1년 내에 상당 비율의 코드를 생성할 수 있을 것이라고 제안했습니다. 유사하게, Anthropic 기술 직원 Maggie Vo는 X에서 Claude 3.5 Sonnet이 이제 “내 업무의 절반을 처리하고… 더할 나위 없이 기쁘다”고 공유했습니다.
OpenAI의 압박
Claude 3.5 Sonnet이 GPT-4를 능가하고 경쟁력 있는 가격을 제시함에 따라 OpenAI는 자사의 모델이 제공하는 가치를 정당화해야 하는 압박이 커지고 있습니다. Wharton School의 Ethan Mollick 교수는 Artifacts 기능을 OpenAI의 GPT-4 코드 해석기와 비교했습니다. 사용자 @kimmonismus는 OpenAI가 "AGI를 지나치고 있다"고 주장하며, 경제적으로 가치 있는 업무에서 인간을 초월하는 AI 개발 목표에 대한 우려를 표명했습니다. 그들은 아직 구현되지 않은 새로운 음성 모달리티와 같은 추가 GPT-4 기능을 발표한 회사에 비판을 가했습니다.
제한 사항
Claude 3.5 Sonnet에 대한 열정에도 불구하고 비평가들은 여전히 기본 인지 작업, 예를 들어 틱택토를 하는 데 어려움을 겪고 있다고 지적했습니다. 기술 저널리스트 Timothy B. Lee(@binarybits)는 모델이 때때로 유머러스한 오류를 범하며 75센트가 100페니보다 더 가치가 있다고 잘못 언급한 스크린샷을 공유했습니다.
전반적으로 Claude 3.5 Sonnet은 Anthropic과 LLM 생태계에 있어 중요한 발전을 나타냅니다. 일부 문제는 여전히 남아있지만, 이 모델은 현재의 컴퓨팅 자원에 의해 가속화되고 있는 AI 기술의 발전을 보여줍니다.