OpenAIが無料のGPT-4oモデルとデスクトップ用ChatGPTをリリース

本日、OpenAIの春のアップデートイベントで、最高技術責任者のミラ・ムラティ氏が、画期的なマルチモーダル大規模言語モデル「GPT-4o(GPT-4 Omni)」を発表しました。このモデルは、数週間以内に無料のChatGPTユーザーが利用可能になります。また、新たにmacOS用のデスクトップChatGPTアプリが登場し、後にWindows版も提供される予定です。これにより、ユーザーはウェブやモバイルアプリを超えてプラットフォームにアクセスできます。

「GPT-4oは音声、テキスト、視覚を統合的に処理します」とムラティ氏は説明し、ユーザーがChatGPTスマートフォンアプリを通じてリアルタイムの動画を受け入れ分析する能力を強調しましたが、この機能はまだ一般提供されていません。「これは魔法のように感じますが、理解を深めて直接体験していただきたい」と彼女は付け加えました。

新しいモデルはリアルタイムで音声応答を行い、音声や映像の入力からユーザーの感情を検出し、さまざまな感情を表現するために声のトーンを調整します。競合するAIスタートアップHumeの技術に似ています。デモ中、プレゼンターがGPT-4o搭載のChatGPTにドラマの増すストーリーを語るように依頼したところ、迅速に対応しました。中断されるとそれを自動的に認識し、しっかり聞いてから続けます。

OpenAIは、GPT-4oの能力を示すデモ動画を共有し、音声入力に対する応答時間はわずか232ミリ秒、平均320ミリ秒であると述べました。これは人間の会話の応答時間に匹敵します。OpenAIは、「GPT-4o以前は、ボイスモードで2.8秒(GPT-3.5)や5.4秒(GPT-4)の遅延がありました。このことが、GPT-4がトーンや複数の話者、背景音を十分に認識できない原因でした」と説明しました。

GPT-4oでは、すべての入力と出力が一つのエンドツーエンドのニューラルネットワークによって処理され、テキスト、視覚、音声が統合されて豊かなインタラクションを実現します。さらに、画像の複数の視点を生成し、3Dオブジェクトに変換することも可能です。

しかし、OpenAIはGPT-4oや新しいモデルのオープンソース化を発表していません。ユーザーは、OpenAIのウェブサイトやAPIを通じてモデルの能力を探索できますが、カスタマイズのための基盤モデルの重みにはアクセスできません。これは共同創業者エロン・マスクからの批判の声が上がっている部分です。

GPT-4oの登場により、無料のChatGPT体験が大幅に向上します。これまではテキストのみのGPT-3.5モデルに制限されていた無料ユーザーは、画像や文書の解析、ウェブブラウジング、データ分析、カスタムGPT、ユーザーの好みを保持するメモリストレージといった高度な機能にアクセスできるようになります。

ライブデモでは、プレゼンターがGPT-4o搭載のChatGPTに対して、リアルタイムでイタリア語と英語の間で言葉を翻訳する様子が示されました。さらに、OpenAIは「ChatGPTは現在、サインアップ、ログイン、ユーザー設定のために50以上の言語をサポートしています」と発表しました。加えて、GPT-4oは共有された画像を理解し議論するのに優れており、一貫したAIアートキャラクターを生成する能力があります。これは多くの既存のAIアート生成ツールが達成できなかった成果です。

当初、GPT-4oは有料サブスクライバー向けに利用可能となり、徐々に無料ユーザーへと展開されていきます。「まずはChatGPT PlusとTeamユーザーから始まります。エンタープライズへのアクセスも近日中に実施予定です。無料ユーザーには使用制限があります」とOpenAIは述べました。

ソーシャルメディアでは、「テキストと画像入力」が本日APIで導入され、音声と動画機能が数週間以内に展開されることが確認されました。このAPIはGPT-4 Turboの半額で提供され、速度が2倍、サードパーティ開発者向けのコール制限も増加します。

OpenAIのCEOサム・オルトマン氏は、会社の進化する使命について考えを述べました。「私たちの目標は社会的利益のためのAIを創造することでしたが、今や他者が革新できるようにするAIを開発し、全員に利益をもたらすことが求められています」とのことです。

オルトマン氏はブログで、「私たちの主な使命は、手頃な価格で強力なAIツールを提供することです。そして、ChatGPTを通じて無料で世界最高のモデルを提供できることを誇りに思います」と語りました。

新しいChatGPTデスクトップアプリは段階的にリリースされ、まずはmacOS用が登場し、その後にWindows用が提供される予定です。ムラティ氏によれば、現在1億人以上がChatGPTを利用しており、100万を超えるカスタムGPTが作成されています。イベントは26分と短く、一部のデモがぎこちない印象を与えましたが、間もなく登場する技術はユーザー体験を向上させ、以前のバージョンよりも自然で強力なインターフェースを提供することが期待されています。

Most people like

Find AI tools in YBX