アップルの研究者が発表した画期的なAIシステム：GPT-4を超える革新技術とは

Home AIニュースアップルの研究者が発表した画期的なAIシステム：GPT-4を超える革新技術とは

Appleの研究者たちは、音声アシスタントの命令理解と応答能力を大幅に向上させることを目的としたAIシステム「ReALM（Reference Resolution as Language Modeling）」を開発しました。この最新の研究論文では、ReALMが大規模な言語モデルを活用して、参照解決の課題に取り組む様子が紹介されています。

ReALMは、画面上の曖昧な参照を解釈し、文脈に基づいて対話を理解することに優れています。これにより、デバイスとのやり取りが直感的かつ自然になります。参照解決は自然言語理解の重要な要素であり、ユーザーが会話中に代名詞や間接的な参照を使っても混乱を招かないようにします。しかし、デジタルアシスタントにとって、さまざまな言語的手がかりや視覚情報を処理することは複雑な課題でした。

ReALMは、この複雑なプロセスを単純な言語モデルタスクに変換し、会話内の視覚要素についての理解を深めます。ReALMはテキスト表現を通じて画面の視覚的レイアウトを再構築し、画面上のエンティティとその位置を分析して、画面の内容と構造を反映するテキストフォーマットを生成します。Appleの研究者たちは、特にファインチューニングされた言語モデルが、OpenAIのGPT-4を含む従来の手法よりも参照解決タスクで優れた結果を示すことを発見しました。

この技術の進歩により、ユーザーは画面に表示された内容に基づいてデジタルアシスタントと効率的に対話できるようになり、詳細な説明をする必要がなくなります。これにより、ナビゲーション情報を運転中に提供したり、障害を持つユーザーにとってよりシンプルで正確な間接的相互作用を可能にするなど、音声アシスタントの用途が拡大します。

最近、Appleは人工知能に関連するいくつかの研究を発表しました。その中には、テキストと視覚情報をシームレスに統合するための大規模言語モデルのトレーニング手法が含まれており、先月公開されました。6月に開催予定のWWDCカンファレンスでは、Appleが新たなAI機能の数々を発表することへの期待が高まっています。

生成AI投資の急増：アメリカが世界をリード、中国は特許出願でトップ

アップルの戦略的AI提携：バイドゥが中国版iPhone 16向けに革新的なAI機能を導入

Most people like

SubTranslateAI.com

26K

AI駆動のプラットフォームによる動画アクセシビリティの向上今日のデジタル社会では、動画のアクセシビリティを確保することが多様な視聴者の関与にとって重要です。私たちの革新的なAIプラットフォームは、動画コンテンツを自動的にキャプション、トランスクリプト、翻訳を生成することで変革し、聴覚障害者や非母国語話者を含むすべての人々にアクセス可能にします。全ての視聴者のためにメディアの可能性を解き放ち、動画コンテンツを普遍的にアクセス可能にする取り組みにご参加ください。

AIによるビデオ翻訳 Translate

Gliglish

614.9K

Gliglishは、手頃な価格で会話力とリスニング力を向上させるために設計された革新的なAI語学教師です。Gliglishで効果的な言語学習を体験し、あなたの可能性を今日から解き放ちましょう！

言語学習 Large Language Models (LLMs)

Mercor

146.8K

私たちの高度なAIプラットフォームをご紹介します。これは、従業員の調達、審査、支払いをシームレスに行うために特別に設計されています。最先端の技術で採用プロセスを向上させ、効率的かつ労力をかけずに適切な人材を見つけることができます。革新的なソリューションを活用することで、従業員の支払い管理がこれまでになく簡単になり、競争の激しい市場でビジネスを成功させることができます。

AI採用プラットフォーム AI Interview Assistant

Suno AI Music Generator

220.4K

音楽制作の力を解き放とう。Suno AIは、ユニークな音やメロディを簡単に生成できる革新的なツールです。経験豊富な音楽家でも初心者でも、Suno AIはあなたの音楽のアイデアを現実のものにするための使いやすいプラットフォームを提供します。この最先端の技術があなたの創造性をどのように刺激し、音楽制作の体験を飛躍的に向上させるかを発見してください。今日、Suno AIで音楽の未来を取り入れよう！

AI音楽生成器 AI Music Generator

Find AI tools in YBX