구글, 텍스트를 이미지로 변환하는 궁극의 모델 '이미지인 3' 공개 - 현재 비공식 미리보기 중

Home AI 뉴스 구글, 텍스트를 이미지로 변환하는 궁극의 모델 '이미지인 3' 공개 - 현재 비공식 미리보기 중

구글이 텍스트-이미지 모델인 Imagen 3의 인상적인 업데이트를 출시할 예정입니다. 이 새로운 모델은 향상된 세부 사항, 개선된 자연어 이해 능력 및 우수한 텍스트 렌더링을 제공합니다. 현재 ImageFX에서 일부 제작자를 위한 비공식 미리보기로 제공되며, 개발자는 대기 리스트에 등록할 수 있습니다. 또한, Imagen 3는 Vertex AI에 통합될 것으로 기대됩니다.

"이번에 발표하는 것은 우리가 만든 가장 진보된 이미지 생성 모델입니다"라고 구글 딥마인드의 수석 연구 이사인 더글라스 에크가 회사의 I/O 개발자 콘퍼런스에서 언급했습니다. "Imagen 3는 더 많은 포토리얼리즘, 풍부한 디테일, 그리고 시각적 아티팩트나 왜곡을 현저히 줄입니다. 이 모델은 대화형 방식으로 프롬프트를 이해하며, 제공하는 창의성과 세부사항이 많을수록 출력이 더 향상됩니다. 또한, Imagen 3는 긴 프롬프트에서 미세한 요소를 통합하는 데 뛰어나며, 텍스트 렌더링에 있어 우리의 최선의 노력을 보여줍니다. 이는 이미지 생성 모델의 공통된 도전 과제입니다."

이번 발표는 구글이 Imagen 2를 Vertex AI에서 널리 공개한 지 6개월 만에 이루어졌으며, 이는 4월에 텍스트-라이브 기능을 출시한 이후입니다. OpenAI의 DALL-E, 미드저니, 어도비의 파이어플라이, 메타의 AI, 마이크로소프트의 디자이너와 같은 AI 이미지 생성 도구의 치열한 경쟁에서 앞서 나가는 것은 구글에게 매우 중요합니다.

하지만 구글의 이 여정에는 도전도 있었습니다. 올해 초, 회사는 AI가生成한 이미지가 일부 비평가들에 의해 "너무 각성적"이라고 비난받은 바 있습니다. 이러한 이미지에는 미국 건국 아버지들과 흑인 남성, 제2차 세계대전 독일 군인과 흑인 남성 및 아시아 여성의 모습이 포함되었습니다. 구글은 이 실수를 인정했으며, CEO 순다르 피차이는 블룸버그와의 인터뷰에서 사과를 재확인했습니다.

Imagen 3의 발표는 구글 I/O에서 선보인 여러 흥미로운 업데이트 중 하나로, 새로운 비디오 생성 모델인 Veo의 출시도 포함됩니다.

구글, OpenAI의 소라와 경쟁할 놀라운 새 생성형 AI 비디오 모델 'Veo' 공개

OpenAI의 새로운 GPT-4o 모델 이해하기: 개발자를 위한 함의와 기회