Google PaLM 2 と OpenAI GPT-4 の違いは何ですか?どちらが優れているでしょうか?

Google PaLM 2 と OpenAI GPT-4 の違いは何ですか?どちらが優れているでしょうか?

Google は、2023 年 5 月 10 日の Google I/O 2023 で次世代の Pathways 言語モデル (PaLM 2) を発表しました。新しい大規模言語モデル(LLM)は、前身モデル(PaLM)に比べて多くの改良が施されており、最終的には最大のライバルであるOpenAIのGPT-4に対抗できるモデルになる可能性があります。

しかし、Google はどの程度改善したのでしょうか? PaLM 2 は Google が期待していた差別化要因となるのでしょうか。さらに重要なのは、類似した機能が多数あるにもかかわらず、PaLM 2 は OpenAI の GPT-4 とどう違うのでしょうか。

グーグル

PaLM 2 対 GPT-4: パフォーマンスの概要

PaLM 2 には、前バージョンに比べて新しい機能と改善された機能が搭載されています。 GPT-4 と比較した PaLM 2 の独自の利点の 1 つは、サイズが小さいため、オンボード処理能力がそれほど高くない特定のアプリケーションに適していることです。

これらのさまざまなサイズの動物には、それぞれヤモリ、カワウソ、バイソン、ユニコーンと呼ばれるミニチュアがあり、ヤモリが最も小さく、次にカワウソ、バイソン、そして最後にユニコーンが最も大きくなります。

Google はまた、WinoGrande と DROP は GPT-4 よりも推論能力が向上しており、ARC-C では WinoGrande がわずかな差でリードしていると主張している。 ただし、PaLM と SOTA に関しては、全体的に大幅な改善が見られます。

Google の 91 ページに及ぶ PaLM 2 研究論文 [PDF] によると、PaLM 2 は数学も得意だそうです。 しかし、Google と OpenAI がテスト結果を構築した方法により、2 つのモデルを直接比較することは困難です。 Google は、おそらく PaLM 2 のパフォーマンスが GPT-4 ほど良くなかったため、いくつかの比較を省略しました。

MMLUでは、GPT-4のスコアは86.4、PaLM 2のスコアは81.2でした。同じことが HellaSwag にも当てはまり、GPT-4 は 95.3 点を獲得しましたが、PaLM 2 は 86.8 点にしか達しませんでした。また、ARC-E では、GPT-4 と PaLM 2 はそれぞれ 96.3 と 89.7 を獲得しました。

PaLM 2 シリーズの最大モデルは PaLM 2-L です。 正確なサイズはわかりませんが、最大の PaLM モデルよりもはるかに小さいですが、より多くのトレーニング コンピューティングが使用されていることはわかっています。 Google によれば、PaLM には 5,400 億個のパラメータがあるため、「大幅に小さい」 PaLM 2 には 100 億から 3,000 億個のパラメータがあるはずです。 これらの数値は、Google が PaLM 2 論文で述べた仮定に基づいているだけであることに留意してください。

この数が 1000 億に近いかそれ以下であれば、PaLM 2 のパラメータは GPT-3.5 よりも小さくなる可能性があります。 おそらく 1,000 億未満のモデルが GPT-4 に追いつくことができ、一部のタスクでは GPT-4 を上回ることさえあることを考えると、これは印象的です。 GPT-3.5 は当初 PaLM を含めすべてを圧倒しましたが、PaLM 2 は完全に回復しました。

GPT-4とPaLM 2のトレーニングデータの違い

Google はまだ PaLM 2 トレーニング データセットのサイズを公表していないが、同社の研究論文では、新しい LLM トレーニング データセットははるかに大きいと報告されている。 OpenAI は GPT-4 のリリース時に同じアプローチを採用し、トレーニング データセットのサイズについては何も主張しませんでした。

グーグルパルム2

しかし、Google は数学、論理、推論、科学のより深い理解に重点を置きたいと考えており、つまり PaLM 2 のトレーニング データの大部分はこれらのトピックに重点が置かれています。 Google は論文の中で、PaLM 2 の事前トレーニング コーパスは、Web ドキュメント、書籍、コード、数学、会話データなど、複数のソースで構成されており、少なくとも PaLM と比較すると全体的に改善されていると述べています。

PaLM 2 の会話スキルも、より優れた文脈理解と翻訳機能を実現するために 100 を超える言語でモデルがトレーニングされていることを考えると、別次元のレベルにあるはずです。

GPT-4 のトレーニングデータが確認されたことに関して、OpenAI は、公開されているデータとライセンス供与されたデータを使用してモデルをトレーニングしたと述べました。 GPT-4 の研究ページには、「データは、数学の問題に対する正解と不正解、弱い推論と強い推論、矛盾した発言と一貫した発言の Web 規模のデータセットであり、多種多様なイデオロギーやアイデアを表しています」と記載されています。

GPT-4 に質問すると、さまざまな応答が生成されますが、そのすべてがクエリに関連するわけではありません。 ユーザーの意図に合わせるために、OpenAI は強化学習と人間からのフィードバックを使用してモデルの動作を微調整します。

これらのモデルの正確なトレーニング データはわからないかもしれませんが、トレーニングの意図は非常に異なっていたことはわかっています。 このトレーニング目的の違いが、実際の展開において 2 つのモデルにどのような違いをもたらすかは、待って確認する必要があります。

PaLM 2 および GPT-4 チャットボットとサービス

両方の LLM にアクセスする最初のポータルは、それぞれのチャットボット (PaLM 2 の場合は Bard、GPT-4 の場合は ChatGPT) を使用します。 ただし、GPT-4 は ChatGPT Plus の有料版であり、無料ユーザーは GPT-3.5 にしかアクセスできません。 一方、Bard は誰でも無料で利用でき、180 か国で利用できます。

ただし、GPT-4 に無料でアクセスできないというわけではありません。 Microsoft の Bing AI Chat は GPT-4 を使用しており、完全に無料で誰でも利用でき、この分野で Google の最大のライバルである Bing Search に次ぐ存在です。

Google I/O 2023 では、PaLM 2 と生成 AI の統合によって、Google ドキュメント、スプレッドシート、スライド、Gmail、そしてこの検索大手が提供するほぼすべてのサービスに表示される AI 機能によって、Google Workspace エクスペリエンスがどのように向上するかについての発表が数多くありました。 さらに、Google は、PaLM 2 が Android や YouTube を含む 25 を超える Google 製品に統合されていることを確認しました。

対照的に、マイクロソフトはすでに、Microsoft Office スイートのプログラムとその多くのサービスに AI 機能を導入しています。 現在、AI戦争で激突している2つのライバル企業の類似製品で、これら2つのLLMを体験することができます。

しかし、GPT-4 は非常に早い時期に登場し、Google がオリジナルの Bard で犯した多くの間違いを慎重に回避したため、サードパーティの開発者、スタートアップ、および GPT-4 を導入したいほぼすべての人にとって事実上の LLM になりました。 これまでのところ、彼らのサービスには有能な AI モデルが存在します。

開発者が PaLM 2 に切り替えたり、少なくとも試したりしないということではありませんが、この点に関しては Google はまだ OpenAI に追いつく必要があります。 PaLM 2 は有料 API にロックされているのではなくオープンソースであるため、GPT-4 よりも広く採用される可能性があります。

PaLM 2 は GPT-4 と競合できますか?

PaLM 2 はまだ非常に新しいため、GPT-4 と競合できるかどうかはまだわかりません。 しかし、Google が約束したことすべてと、それを広めるために採用することを決定した積極的なアプローチを考慮すると、PaLM 2 は確かに GPT-4 に匹敵すると思われます。

ただし、GPT-4 は依然として非常に有能なモデルであり、前述のように、多くの比較で PaLM 2 を上回っています。 そうは言っても、PaLM 2 の複数の小型モデルは、議論の余地のない利点をもたらします。 Gecko 自体は軽量で、オフラインでもモバイル デバイスで動作できます。 つまり、PaLM 2 は、GPT-4 の使用が難しい可能性のある、まったく異なるクラスの製品やデバイスをサポートできるということです。

AI競争が激化

PaLM2 の登場により、AI の覇権をめぐる競争が激化しています。PaLM2 は GPT-4 の最初の強力なライバルとなる可能性があるからです。 「Gemini」と呼ばれる新しいマルチモーダルAIモデルもトレーニング中であり、Googleはこの分野で減速する兆候を見せていない。

<<:  NetEase Cloud Music APP (Android ミュージック プレーヤー) v7.2.22 広告なしバージョン

>>:  Acme CAD コンバーター (CAD コンバーター) v8.10.6.1560

推薦する

Notepad Next (高速で軽量なテキストエディタ) v0.10 中国語グリーンバージョン

Notepad Next は、Windows 10 オペレーティング システム用の高速で軽量なテキス...

WipeFile (無料ファイル削除ツール) v3.6 中国語無料版

WipeFile は、コンピューター上の機密ファイルを完全に削除し、他人による復元や使用を防ぐことが...

スクリーンセーバーファクトリー(スクリーンセーバー制作ツール)v7.10.0.78 ポータブル版

Screensaver Factory は強力なスクリーンセーバー作成ツールです。豊富な機能と柔軟な...

HEIC ファイル形式とは何ですか? iPhone ではなぜこの形式が使用されるのでしょうか?

iPhoneをお持ちですか? デバイス上の写真が JPEG や PNG 形式ではなく、HEIC と...

PS Hash(ファイルハッシュ値検証ツール)v1.0 グリーン中国語版

PSHash は、ファイルのチェックサム値を比較してファイルの整合性と一貫性を確保するために使用でき...

オフライン エクスプローラー (オフライン ブラウジング ツール) Enterprise v8.6.0.4988 ポータブル版

オフライン エクスプローラーは、Web サイト全体または特定の Web ページをローカル コンピュー...

ネットワーク プロファイル名チェンジャー (ネットワーク構成の変更) v1.4

Network Profile Name Changer は、ネットワーク構成名を変更するために使...

Icecream Image Resizer (イメージリサイザー) v2.14 多言語ポータブル版

Icecream Image Resizer は、画像のサイズとファイル サイズをすばやく調整できる...

CpuFrequenz (CPU 周波数検出ツール) v4.39 多言語ポータブル版

CpuFrequenz は、ユーザーが CPU の動作周波数を監視できるように特別に設計された、小型...

Adobe Photoshop(Photoshop アクティベーションフリー版)2018-2024 直接インストール クラック版

Adobe Photoshop は、Adobe 社が開発した画像処理ソフトウェアであり、画像処理の業...

JPEGsnoop (JPEG 形式ファイルデコードツール) v1.8.0a グリーン中国語版

JPEGsnoop は JPEG 画像ファイルを分析するためのツールです。画像ファイルに関する詳細な...

ブラック ミス ウーコン ピクセル エディション v0.4.0 中国語 グリーン エディション

現在最も人気のゲームは、間違いなく『Black Myth: Wukong』です。この国産初の3A傑作...

理想的なビデオ編集ソフトウェアを入手するにはどうすればよいでしょうか?株式購入ガイド

すべてのビデオ編集ツールが互いに競合していると思われるかもしれませんが、そうではありません。 Ado...

BurnAware Pro (CD 書き込みソフトウェア) v18.5 多言語ポータブル版

BurnAware 中国語クラック版はディスク書き込みソフトウェアです。このディスク書き込みツールボ...

RdViewer リモコン公式オリジナルバージョン丨最新バージョンダウンロード丨バージョン番号 6.6.9

RdViewer は非常に使いやすいリモート コントロール ソフトウェアです。P2P ネットワーク...