GoogleのGemini AIはOpenAIとMicrosoftのGPT-4を狙っている

先週、Googleは新たなAI、いや、むしろ新たな大規模言語モデル「Gemini」を発表しました。Gemini 1.0モデルには3つのバージョンがあります。Gemini Nanoは特定のデバイスでのタスクに最適で、Gemini Proはより幅広いタスクに最適なオプションです。そしてGemini Ultraは、Google最大の言語モデルであり、最も複雑なタスクにも対応します。

GoogleがGemini Ultraの発表で特に強調した点は、言語モデルの能力を測定するために最も一般的に使用される32のテストのうち30で、この言語モデルがOpenAIのGPT-4の最新バージョンを上回ったことです。テストは、読解力や様々な数学の問題から、Pythonのコード作成や画像分析まで、あらゆるものを網羅しています。テストによっては、2つのAIモデルの差はわずか数十分の1パーセントポイントだったのに対し、最大10パーセントポイントの差があったものもありました。

グーグル

しかし、Gemini Ultraの最も印象的な成果は、おそらく大規模マルチタスク言語理解（MMLU）テストにおいて人間の専門家を破った初の言語モデルであることです。このテストでは、数学や物理学から医学、法律、倫理に至るまで、57の異なる分野における問題解決課題にGemini Ultraと専門家が取り組みました。Gemini Ultraは90.0%のスコアを達成しましたが、比較対象となった人間の専門家は「わずか」89.8%のスコアでした。

Geminiのリリースは段階的に行われます。先週、GoogleのチャットボットBardが改良版の言語モデルの使用を開始したことを受け、Gemini Proが一般公開されました。また、Gemini NanoはGoogle Pixel 8 Proスマートフォンの様々な機能に組み込まれています。Gemini Ultraはまだ一般公開の準備ができていません。Googleによると、現在セキュリティテスト中で、少数の開発者やパートナー、そしてAIの責任とセキュリティの専門家とのみ共有されています。しかし、来年初めにBard Advancedがリリースされた際には、Gemini Ultraを一般公開する予定です。

Microsoftは、Gemini UltraがGPT-4に勝てるというGoogleの主張に対し、GPT-4に同じテストを再度実行させ、今回はプロンプトや入力をわずかに変更することで反論しました。Microsoftの研究者は11月に、Medpromptと呼ばれる手法に関する研究を発表しました。これは、言語モデルにプロンプトを入力することでより良い結果を得るための、様々な戦略を組み合わせたものです。ChatGPTから返される回答やBingの画像作成ツールから得られる画像は、言葉を少し変えるだけでわずかに異なることに気づいたことがあるかもしれません。このコンセプトは、はるかに高度なものですが、Medpromptの背後にあるアイデアです。

マイクロソフト

Medpromptを使用することで、MicrosoftはGoogleが以前に強調した30のテストのうち、多くのテストにおいてGPT-4をGemini Ultraよりも優れたパフォーマンスにすることに成功しました。その中にはMMLUテストも含まれており、Medprompt入力を使用したGPT-4は90.10%のスコアを獲得しました。将来、どの言語モデルが優位に立つかはまだ分かりません。AIの王座をめぐる戦いは、まだまだ終わらないのです。

この記事はスウェーデン語から英語に翻訳され、元々はpcforalla.seに掲載されていました。

この記事はもともと当社の姉妹誌 PC för Alla に掲載され、スウェーデン語から翻訳およびローカライズされました。