구글은 자사의 Bard AI 챗봇을 개선하여 OpenAI의 ChatGPT와의 경쟁력을 강화하고 있습니다. Sundar Pichai의 지휘 아래, 구글은 이미지 생성 기능을 추가하며 자사의 Imagen 2 AI 모델과 더 발전된 Gemini Pro 버전을 선보였습니다. 이러한 업데이트는 사용자들에게 Bard의 AI 기능을 폭넓게 이용할 수 있는 기회를 제공하며, 새로운 무료 AI 이미지 생성 도구를 포함하고 있습니다.
Jack Krawczyk, Bard의 제품 책임자는 블로그 게시물에서 "이 업데이트는 Bard를 대규모 창작 프로젝트부터 일상 활동에 이르기까지 보다 효율적이고 글로벌하게 접근 가능한 AI 파트너로 자리매김하게 합니다."라고 밝혔습니다. 또한 구글은 오늘부터 ImageFX라는 또 다른 이미지 생성기를 테스트하고 있습니다.
다국어 지원을 갖춘 Gemini Pro
한 달 전, 구글은 Gemini AI 모델을 나노(모바일용), 프로(중간 응용 프로그램용), 울트라(최고의 성능을 자랑하는 언어 모델) 세 가지 버전으로 소개했습니다. 울트라 버전은 올해 말 출시될 예정이며, GPT-4보다 더 발전된 모델로 예상됩니다. 초기 비교 결과 Gemini Pro는 OpenAI의 오래된 GPT-3.5 Turbo에 비해 뒤처질 수 있다는 평가를 받았습니다. 이러한 상황은 구글이 생성 AI 경쟁 환경에서 능력을 입증하는 데 어려움을 겪을 수 있다는 것을 의미합니다. 지난 달 Bard에 배포된 세밀하게 조정된 Gemini Pro는 영어만 지원했습니다.
오늘 공개된 새로운 AI 기능들은 이러한 격차를 해소하기 위한 것입니다. Bard의 최신 버전은 40개 이상의 언어—한국어, 스페인어, 타밀어, 이탈리아어, 러시아어 포함—를 지원하며, 230개 이상의 국가와 지역에서 사용할 수 있습니다. 이는 더 많은 사용자가 이해력, 요약, 추론, 코딩에 대한 Gemini Pro의 고급 기능에 접근할 수 있도록 합니다.
Bard의 Imagen 2: ChatGPT Plus와 DALL-E 3와의 경쟁
가장 흥미로운 발전 중 하나는 Imagen 2 모델을 사용한 AI 이미지 생성의 도입입니다. 이는 텍스트 프롬프트로부터 고품질의 포토리얼리스틱 이미지를 생성하도록 설계되었으며, Bard는 OpenAI의 ChatGPT Plus와 직접 경쟁하는 위치에 놓이게 됩니다. Krawczyk는 "원하는 내용을 간단히 설명하세요—예를 들어 ‘서핑보드를 타는 개의 이미지를 생성해 주세요’와 같이— 그러면 Bard가 다양한 시각적 자료를 생성하여 당신의 개념을 실현할 것입니다."라고 설명했습니다.
테스트 중에 Bard는 약 30-40초 만에 이미지를 생성하며 일정한 품질을 보여주었습니다. 그러나 유명인을 포함한 이미지를 필터링하는 기준에 따라 이미지 생성에 실패한 경우도 있었습니다. 현재 도구의 초기 테스트에 따르면 비율 변경이나 비영어 프롬프트 사용은 지원하지 않고 있습니다.
AI 생성 미디어의 저작권 문제 해결을 위해, 구글 Bard는 사용자가 생성된 콘텐츠에 대한 데이터 보호 및 저작권 관련 법적 문제를 신고할 수 있도록 하고, 폭력적이거나 불쾌감을 주는, 성적으로 노골적인 콘텐츠에 대한 제한을 두고 있습니다. 또한 구글은 DeepMind의 SynthID를 사용하여 생성된 이미지의 픽셀에 디지털 식별 워터마크를 삽입하여 AI 생성 시각 자료와 인간 아티스트가 생성한 자료를 구분할 수 있게 했습니다.
ImageFX를 통한 새로운 기능 개선
Bard와 함께, 구글은 Imagen 2를 기반으로 한 ImageFX를 탐색하고 있습니다. 현재 구글의 실험 앱 AI 테스트 키친에서 사용할 수 있는 ImageFX는 사용자가 제안을 받거나 프롬프트를 강화할 수 있는 "표현적 칩"을 통해 창의성을 고취합니다. 이 기능은 Ideogram과 같은 다른 창작 도구에서 찾을 수 있는 기능과 유사합니다. AI 테스트 키친은 텍스트 프롬프트와 표현적 칩으로 최대 70초의 곡을 생성할 수 있는 MusicFX, 작사자와 창작 작가를 위한 TextFX와 같은 혁신적인 프로젝트도 호스팅합니다.