ChatGPTを越えて:2023年におけるラマとオープンソースAIの台頭

2023年、驚くべきAIの物語の主役は、毛深いラクダかもしれません。Metaが2月に発表したLlamaは、AI研究の風景を一新する大規模言語モデル (LLM) であり、7月には商用版Llama 2、8月にはCode Llamaが登場しました。私は、Llamaがその最大のストーリーであると主張します。

「何それ? ChatGPTが2023年の最大のAIストーリーに決まってる!」と反発の声が聞こえてきそうです。確かに、OpenAIのChatGPTは2022年11月30日にリリースされ、2月には1億人のユーザーを達成したことで、生成AIを一般文化に浸透させました。

しかし、私の見解では、ChatGPTは間違いなく生成AIの革命的存在です。Forresterのアナリスト、ローワン・カラン氏が指摘した通り、それは「生成AI周辺の火を灯したスパーク」をもたらしました。

2023年の2月、MetaがLlamaを発表したことは重要な瞬間でした。これは、最初の本格的な無料オープンソースのLLMであり、オープンソースAIを巡る議論はこの年を通じて続いています。他のテクノロジー大手やLLM企業、政策立案者たちは、オープンソースアクセスを持つAIモデルの安全性とセキュリティの検証を行い、コストのかかる計算の課題と相まってオープンソースAIへの関心が高まりました。

Metaによれば、Llamaのリリース以来、オープンソースAIコミュニティはHugging Faceプラットフォーム上で7,000を超える派生モデルを作成し、KoalaやVicuna、Alpacaなどの著名なモデルが誕生しました。他のオープンソースモデル(Mistral、Hugging Face、Falconなど)も存在しますが、Llamaは大手テクノロジー企業のデータとリソースに支えられた初めてのものです。

ChatGPTは2023年の大ヒット映画「バービー」に例えられ、Llamaとそのオープンソースの仲間たちは、持続可能な影響をもたらすスピンオフに満ちた広大なマーベル宇宙のような存在です。このトレンドは「より現実的で影響力のある生成AIアプリケーションを生み出し、分野のオープンソースの基盤をさらに固めることにつながります」と、ドミノデータラボのデータサイエンス戦略責任者ケル・カールソン氏は語りました。

オープンソースAIの長期的影響

ChatGPTは、クローズドで独占的なモデルの時代を告げました。OpenAIは、2015年にオープンリサーチイニシアチブとして設立されましたが、2023年には方針を転換しました。共同創設者イリヤ・サツケバーは、競争と安全性の懸念から研究を共有したことが誤りだったとThe Vergeに語りました。

一方、MetaのチーフAI科学者ヤン・ルカン氏は、Llama 2の商業リリースを推奨し、大規模言語モデルはオープンであり続けるべき重要なインフラと強調しました。カールソン氏はChatGPTとLlamaの比較は単純ではないとし、Llama 2はオープンソースの性質と商用ライセンスにより革命的であると指摘しました。

Llamaのインパクトは、ChatGPTによって築かれた基盤から生まれていると、Otherside AIのCEOマット・シューマー氏は言います。「Llamaとその後の発展なしに、昨年設立された企業は数百に及びます。」と語りました。

元NeevaのCEOスリダル・ラマスワミ氏は、Llama 2を真に能力のあるオープンソースAIモデルとして称賛し、一部企業がAI機能を独占する可能性があると指摘しましたが、MetaはLlamaを公開しました。

Llamaの初期リークとその反響

2月に発表されたLlamaは、70億から650億パラメータまでの多様なモデルサイズが特徴でした。Llamaの13Bモデルは、多くのNLP基準でGPT-3よりも優れた性能を示し、その最大モデルはPaLMやChinchillaと肩を並べました。初めはMetaは、スタンフォード大学のAlpacaプロジェクトなど、選ばれた学者と研究者にモデルウェイトを提供しました。

しかし、4chanでのリークにより、世界中の開発者がGPTレベルのLLMにアクセスできるようになり、派生版が急増しました。7月にはMetaがLlama 2を商業利用のために無料で提供し、MicrosoftがAzureクラウドサービスに統合しました。

AI規制に関する議論が高まる中、6月にはアメリカ合衆国の上院議員がLlamaのリークに関して懸念を表明し、様々な有害活動への悪用の可能性を指摘しました。それでも、MetaはオープンソースAIへのコミットメントを強化しました。6月の会議で、マーク・ザッカーバーグはMeta製品全体への生成AIの統合を強調し、「オープンサイエンスに基づくアプローチ」への献身を再確認しました。

Meta: オープンリサーチの擁護者

Metaは常にオープンリサーチを擁護してきました。特に、PyTorchフレームワークを中心にエコシステムを構築することで、そのコミットメントを示しています。2023年の終わりが近づく中、Metaは公益のためのオープンリサーチを推進するファンダメンタルAIリサーチ(FAIR)イニシアチブの10周年を祝います。

MetaのAI研究副社長ジョエル・ピノー氏は、2017年にオープンサイエンスへのコミットメントが理由でMetaに参加したと述べました。「オープンサイエンスへのコミットメントこそ、私が他を探すことなくここに参加した理由です」と反映しています。

しかし、ピノー氏はオープンリサーチの動機に変化があったことにも注意を促します。初期の目的は研究の質を向上させることでしたが、最近の進展はAIエコシステム全体の生産性を飛躍的に高め、多くのスタートアップに代替モデルを提供しています。

それでも、Metaは常にオープンリリースを保証するわけではなく、各プロジェクトはリスクと利益の緻密な分析を経て実施されています。

Llamaに対する考察: 精度重視

MetaのFAIR研究者であるアンジェラ・ファン氏は、Llamaモデルの開発には慎重な基盤づくりがあったことを強調しました。「技術はまだ発展段階ですが、興味深いツールを作成し、アプリ間での一貫した統合が可能です」と述べています。

Metaは、Llamaを活用する開発者コミュニティやスタートアップからのフィードバックを継続的に求めており、今後のバージョンを改善する方向で取り組んでいます。ファン氏は、Llamaの開発における精度と慎重な準備の重要性を強調しました。「大きな突破口を求めるだけでなく、時間をかけて多くの小さなタスクを効果的に実行することが重要です。」

オープンソースAIの推進

Togetherの共同創設者で、RedPajamaデータセットの開発で知られるビプル・ヴェッド・プラカシュ氏は、LlamaとオープンソースAIが2023年のゲームチェンジャーであるという考えに賛同しています。広範な企業ネットワークの中で高品質なモデルを開発することで、コストが分散され、スタートアップはモデル構築の負担を軽減できるのです。

しかし、規制当局がオープンソースAIの監視を始める中、モデルへのアクセスを保護する必要性が強調されています。最近のイギリスでの安全サミットでは、高度なAIシステムのリスクに対する懸念が重要なテーマとなりました。

それでも、オープンソースAIの支持者たち(ルカン氏やGoogle Brainの共同創設者アンドリュー・ング氏を含む)は、「オープンAIは解毒剤であり、毒ではない」との声明を発表しました。

継続する議論: Llama vs. ChatGPT

LlamaとChatGPTの論争は、専門家の間で議論を呼び起こし続けています。一部の人々はChatGPTが今年の主役であると断言する一方で、他の人々はLlamaの影響がAIにおける変革的な変化の前触れであると見ています。

RelationalAIのML研究副社長ニコラオス・ヴァシログル氏は、「間違いなくChatGPTはゲームチェンジャーです」と述べ、そのエンジニアリングと運用効率を賛美しました。TravelAIのCEOジョン・リオティエ氏も同様の見解を示し、日常ユーザーにAIを身近にしたChatGPTの役割を強調しました。

一方、AtlasのCEOベン・ジェームズ氏は、LlamaがChatGPTとは異なる形で研究とイノベーションを revitalized したことを指摘し、持続的な影響を持つと示唆しました。

結局のところ、両モデルはAIの風景に豊かな貢献をしています。ChatGPTが生成AIへの広範な興味を呼び起こした一方で、Llamaはその未来の影響を形作る位置にいます。カラン氏が述べたように、2023年の生成AIの現象はChatGPTが無ければ実現しなかったでしょうが、革新的なアプリケーションへの熱意はオープンソースコミュニティによって大いに後押しされることでしょう。

長期的には、独占モデルとオープンソースモデルが共存するでしょう。しかし、Llama 2のような広く採用されたオープンソースモデルがなければ、生成AIの風景は大幅に未発展でニッチなものにとどまるでしょう。このエキサイティングな分野の重要な進展において、オープンソースコミュニティは極めて重要な役割を果たしています。

Most people like

Find AI tools in YBX