구글 바드, 이미지 생성 기능 강화 및 ChatGPT와 경쟁하기 위한 고급 제미니 프로 출시

Home AI 뉴스 구글 바드, 이미지 생성 기능 강화 및 ChatGPT와 경쟁하기 위한 고급 제미니 프로 출시

구글은 자사의 Bard AI 챗봇을 개선하여 OpenAI의 ChatGPT와의 경쟁력을 강화하고 있습니다. Sundar Pichai의 지휘 아래, 구글은 이미지 생성 기능을 추가하며 자사의 Imagen 2 AI 모델과 더 발전된 Gemini Pro 버전을 선보였습니다. 이러한 업데이트는 사용자들에게 Bard의 AI 기능을 폭넓게 이용할 수 있는 기회를 제공하며, 새로운 무료 AI 이미지 생성 도구를 포함하고 있습니다.

Jack Krawczyk, Bard의 제품 책임자는 블로그 게시물에서 "이 업데이트는 Bard를 대규모 창작 프로젝트부터 일상 활동에 이르기까지 보다 효율적이고 글로벌하게 접근 가능한 AI 파트너로 자리매김하게 합니다."라고 밝혔습니다. 또한 구글은 오늘부터 ImageFX라는 또 다른 이미지 생성기를 테스트하고 있습니다.

다국어 지원을 갖춘 Gemini Pro

한 달 전, 구글은 Gemini AI 모델을 나노(모바일용), 프로(중간 응용 프로그램용), 울트라(최고의 성능을 자랑하는 언어 모델) 세 가지 버전으로 소개했습니다. 울트라 버전은 올해 말 출시될 예정이며, GPT-4보다 더 발전된 모델로 예상됩니다. 초기 비교 결과 Gemini Pro는 OpenAI의 오래된 GPT-3.5 Turbo에 비해 뒤처질 수 있다는 평가를 받았습니다. 이러한 상황은 구글이 생성 AI 경쟁 환경에서 능력을 입증하는 데 어려움을 겪을 수 있다는 것을 의미합니다. 지난 달 Bard에 배포된 세밀하게 조정된 Gemini Pro는 영어만 지원했습니다.

오늘 공개된 새로운 AI 기능들은 이러한 격차를 해소하기 위한 것입니다. Bard의 최신 버전은 40개 이상의 언어—한국어, 스페인어, 타밀어, 이탈리아어, 러시아어 포함—를 지원하며, 230개 이상의 국가와 지역에서 사용할 수 있습니다. 이는 더 많은 사용자가 이해력, 요약, 추론, 코딩에 대한 Gemini Pro의 고급 기능에 접근할 수 있도록 합니다.

Bard의 Imagen 2: ChatGPT Plus와 DALL-E 3와의 경쟁

가장 흥미로운 발전 중 하나는 Imagen 2 모델을 사용한 AI 이미지 생성의 도입입니다. 이는 텍스트 프롬프트로부터 고품질의 포토리얼리스틱 이미지를 생성하도록 설계되었으며, Bard는 OpenAI의 ChatGPT Plus와 직접 경쟁하는 위치에 놓이게 됩니다. Krawczyk는 "원하는 내용을 간단히 설명하세요—예를 들어 ‘서핑보드를 타는 개의 이미지를 생성해 주세요’와 같이— 그러면 Bard가 다양한 시각적 자료를 생성하여 당신의 개념을 실현할 것입니다."라고 설명했습니다.

테스트 중에 Bard는 약 30-40초 만에 이미지를 생성하며 일정한 품질을 보여주었습니다. 그러나 유명인을 포함한 이미지를 필터링하는 기준에 따라 이미지 생성에 실패한 경우도 있었습니다. 현재 도구의 초기 테스트에 따르면 비율 변경이나 비영어 프롬프트 사용은 지원하지 않고 있습니다.

AI 생성 미디어의 저작권 문제 해결을 위해, 구글 Bard는 사용자가 생성된 콘텐츠에 대한 데이터 보호 및 저작권 관련 법적 문제를 신고할 수 있도록 하고, 폭력적이거나 불쾌감을 주는, 성적으로 노골적인 콘텐츠에 대한 제한을 두고 있습니다. 또한 구글은 DeepMind의 SynthID를 사용하여 생성된 이미지의 픽셀에 디지털 식별 워터마크를 삽입하여 AI 생성 시각 자료와 인간 아티스트가 생성한 자료를 구분할 수 있게 했습니다.

ImageFX를 통한 새로운 기능 개선

Bard와 함께, 구글은 Imagen 2를 기반으로 한 ImageFX를 탐색하고 있습니다. 현재 구글의 실험 앱 AI 테스트 키친에서 사용할 수 있는 ImageFX는 사용자가 제안을 받거나 프롬프트를 강화할 수 있는 "표현적 칩"을 통해 창의성을 고취합니다. 이 기능은 Ideogram과 같은 다른 창작 도구에서 찾을 수 있는 기능과 유사합니다. AI 테스트 키친은 텍스트 프롬프트와 표현적 칩으로 최대 70초의 곡을 생성할 수 있는 MusicFX, 작사자와 창작 작가를 위한 TextFX와 같은 혁신적인 프로젝트도 호스팅합니다.

선거 딥페이크 분석하는 UC 버클리 교수: 오늘날 디지털 시대의 허위 정보와의 전쟁

앨런 인공지능 연구소, AI 개발의 '중대한 변화'를 이끌 '진정한 오픈 소스' LLM 공개

Most people like

LabEx

170.5K

최첨단 AI 기술과 실습 Lab이 결합된 인터랙티브 학습 플랫폼을 만나보세요. 여러분의 기술과 지식을 효과적으로 강화하는 역동적인 교육 경험에 참여해 보세요. 오늘 학습의 미래를 탐험해보세요!

코딩 AI Code Assistant

Korus

16.8K

혁신적인 AI 기반 음악 창작 플랫폼을 소개합니다. 이 플랫폼은 음악 작곡 및 제작 방식을 혁신적으로 변화시킬 것입니다. 최첨단 도구는 인공지능의 힘을 활용하여 창작 과정을 간소화하며, 모든 수준의 음악가에게 즉각적인 영감과 독특한 작곡을 제공합니다. 기술과 예술이 완벽하게 결합된 사용자 친화적인 플랫폼으로 음악적 잠재력을 열어주고 무한한 가능성을 탐험하세요. 경력 있는 전문가든 시작하는 단계의 음악가든, 저희 AI 음악 창작기는 여러분의 사운드를 향상시키고 작업 흐름을 개선할 것입니다. 오늘 음악 창작의 미래에 합류하세요!

음악 창작 NFTs

录咖

94.6K

AI 기반 음향 및 영상 처리 플랫폼: 콘텐츠 창작과 편집의 효율성 및 정밀도 향상 인공지능 기술의 급속한 발전과 함께, 음향 및 영상 처리 플랫폼은 콘텐츠 창작 분야를 전례 없는 방식으로 변화시키고 있습니다. AI 기반 도구는 자동으로 편집하고 화질을 향상시키며 오디오 품질을 최적화하여 창작자의 작업 효율성을 크게 높여줍니다. 소셜 미디어, 비디오 제작, 실시간 방송 등 다양한 분야에서 이러한 플랫폼은 사용자에게 지능적인 솔루션을 제공하여 콘텐츠 창작을 더 쉽고 효율적으로 만듭니다. AI 기반 음향 및 영상 처리 플랫폼을 탐색하여 여러분의 창작 경험을 향상시켜 보세요.

음성 및 비디오 처리 AI Video Recording

AIApply

AlApply: 인공지능 기반 구직 도구

AI 구직 도구 Resume Builder

Find AI tools in YBX