OpenAI 사장, GPT-4o로 생성한 첫 번째 이미지를 공개하다

OpenAI의 회장 그렉 브록먼이 최근 자신의 X 계정에서 회사의 새로운 GPT-4o 모델이 생성한 첫 공개 이미지를 공유했습니다. 이 이미지는 OpenAI 로고가 새겨진 검은색 티셔츠를 입은 사람이 칠판에 글을 쓰고 있는 모습입니다. 칠판에 적힌 내용은 “모달리티 간 전이. P(text, pixels, sound)를 하나의 대규모 자기회귀 변환기로 직접 모델링한다고 가정해 보자. 장단점은 무엇일까?"입니다.

월요일에 출시된 GPT-4o 모델은 이전 GPT-4 계열(GPT-4, GPT-4 Vision, GPT-4 Turbo)을 개선하여 더 빠른 처리 속도, 비용 절감, 오디오 및 비주얼과 같은 다양한 입력에서의 정보 유지 능력을 향상시켰습니다.

OpenAI는 GPT-4o를 멀티미디어 토큰으로 훈련함으로써 오디오 및 비주얼 데이터를 먼저 텍스트로 변환할 필요성을 없앴습니다. 이를 통해 모델이 이러한 미디어 형식을 직접 분석하고 해석할 수 있어, 이전의 여러 상호 연결된 모델에 의존했던 GPT-4 모델보다 더 매끄럽고 효율적인 작업 수행이 가능해졌습니다.

이번 새로운 이미지는 2023년 9월에 출시된 OpenAI의 DALL-E 3가 생성한 이미지와 비교했을 때, GPT-4o 모델이 품질, 포토리얼리즘, 텍스트 정확성 면에서 큰 개선을 보여줍니다. 현재 GPT-4o의 원주율 이미지 생성 기능은 일반 대중에게 공개되지 않았습니다. 브록먼은 그의 게시물에서 "팀이 이 기능을 세계에 선보이기 위해 열심히 노력하고 있다"고 언급했습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles