Latest evidence-based health information
Vision

AMDの強力なAIチップがついにWindows PCで利用可能に

AMDの強力なAIチップがついにWindows PCで利用可能に
AMDの強力なAIチップがついにWindows PCで利用可能に

AMDのハードウェアチームは、Ryzen AI MaxやThreadripperといった強力なチップでAI推論の新たな定義を試みてきました。しかし、ソフトウェアに関しては、PC分野では同社の存在感は薄れていました。しかし、AMD幹部によると、状況は変わりつつあるとのことです。

AMDが木曜日に開催した「Advancing AI」イベントでは、InstinctシリーズをはじめとするエンタープライズクラスのGPUに焦点が当てられました。しかし、AMDが同様に頼りにしているのは、おそらく耳にする機会が少ないROCmと呼ばれるソフトウェアプラットフォームです。AMDは本日、ROCm 7をリリースします。同社によると、ROCm 7はソフトウェアだけでAI推論を3倍に高速化できるとのことです。そして、ついにWindows版も登場し、NVIDIAのCUDA覇権に挑みます。

Radeon Open Compute (ROCm) は、AMD の AI コンピューティング向けオープンソフトウェアスタックで、AI ワークロードを実行するためのドライバーとツールが含まれています。数週間前に起きた Nvidia GeForce RTX 5060 の騒動を覚えていますか?ソフトウェアドライバーがなければ、Nvidia の最新 GPU はまるで生気のないシリコンの塊でした。

当初、AMDも同じ苦境に陥っていました。NVIDIAのような企業のような無限の資金力がない状況で、AMDはクライアントPCではなく、ROCmとエンタープライズGPUを大企業に優先させるという選択をしました。AIソリューショングループのコーポレートバイスプレジデント、ラミン・ローン氏はこれを「痛い点」と呼び、「ROCmはクラウドGPUに注力していましたが、エンドポイントでは必ずしもうまく機能していませんでした。そこで、これを修正しているところです」と述べています。

AMD RocM

マーク・ハックマン / ファウンドリー

今日の世界では、単に最高の製品を出荷するだけでは必ずしも十分ではありません。製品にコミットする意思のある顧客やパートナーを獲得することが不可欠です。だからこそ、元マイクロソフトCEOのスティーブ・バルマーはステージ上で「開発者、開発者、開発者!」と叫んだのです。ソニーがプレイステーションにブルーレイドライブを搭載した際、映画スタジオはライバルのHD-DVDフォーマットにはないほどの、この新しいビデオフォーマットの普及に貢献しました。

AMDのローン氏は、AI開発者もWindowsを好んでいることに遅ればせながら気づいたと述べた。「当初は、ソフトウェアをWindowsに移植するためのリソースを基本的に割かないという決断でしたが、今では開発者が実際にWindowsを非常に重視していることに気づいています」と彼は語った。

ロアン氏によると、ROCmは2025年第3四半期にプレビュー版のPyTorchでサポートされ、7月にはONNX-EPでサポートされる予定だという。

パフォーマンスよりも存在感が重要

これはつまり、AMDプロセッサがAIアプリケーションにおいてより大きな存在感を持つようになることを意味します。つまり、Ryzen AIプロセッサを搭載したノートPC、Ryzen AI Maxチップを搭載したデスクトップPC、あるいはRadeon GPUを搭載したデスクトップPCをお持ちであれば、AIアプリケーションを活用する機会が増えるということです。例えば、PyTorchは、Hugging Faceの「Transformers」のような人気AIモデルが動作する機械学習ライブラリです。これは、AIモデルがRyzenハードウェアを活用することがはるかに容易になることを意味します。

ROCm は、Red Hat (2025 年後半)、Ubuntu (同)、SuSE などの「インボックス」 Linux ディストリビューションにも追加される予定です。

Roane 氏はまた、Ryzen AI 300 ノートブックから Threadripper プラットフォームに至るまで、各 AMD プラットフォームが実行できるモデル サイズについて有益なコンテキストを提供しました。

AMD RocM

マーク・ハックマン / ファウンドリー

…しかし、パフォーマンスも大幅に向上します

ROCm 7がもたらすAIパフォーマンスの向上は目覚ましく、Llama 3.1 70Bでは3.2倍、Qwen2-72Bでは3.4倍、DeepSeek R1では3.8倍のパフォーマンス向上が見込まれます。(「B」は10億単位のパラメータ数を表します。パラメータ数が多いほど、一般的に出力品質は高くなります。)今日、これらの数字はこれまで以上に重要になっています。Roane氏によると、推論チップはトレーニング用プロセッサよりも急速な成長を見せています。

(「トレーニング」は、ChatGPTやCopilotなどの製品で使用されるAIモデルを生成します。「推論」は、AIを実際に使用するプロセスを指します。言い換えれば、AIに野球に関するあらゆることを学習させるようにトレーニングするかもしれません。ベーブ・ルースがウィリー・メイズより優れていたかどうかを尋ねるとき、それは推論を使用していることになります。)

AMD RocM

マーク・ハックマン / ファウンドリー

AMDは、改良されたROCmスタックは前世代と同等、つまり約3倍のトレーニング性能を実現したと述べています。さらに、AMDは、新しいROCmソフトウェアを搭載した自社製MI355Xが、DeepSeek R1モデルにおいて、8ビット浮動小数点精度でNVIDIA B200を1.3倍上回る性能を発揮すると述べました。

繰り返しになりますが、パフォーマンスは重要です。AIでは、できるだけ多くのAIトークンをできるだけ早く生成することが目標ですが、ゲームではポリゴンやピクセルが目標となります。開発者に、既にお持ちのAMDハードウェアを活用できる機会を提供することは、開発者とAMD双方にとってメリットのあることです。

AMDに欠けているのは、LLM、AIアートなど、ユーザーにAIの利用を促すための消費者向けアプリケーションです。IntelはAI Playgroundを公開しており、Nvidiaは(技術は所有していませんが)サードパーティ開発者と共同で独自のアプリケーションLM Studioを開発しました。AI Playgroundの便利な機能の一つは、利用可能なすべてのモデルがIntelのハードウェア向けに量子化(つまりチューニング)されていることです。

Roane氏によると、Ryzen AI MaxのようなAMDハードウェア向けにも同様に調整されたモデルが存在するとのことだ。ただし、ユーザーはHugging Faceなどのリポジトリにアクセスして自分でダウンロードする必要がある。

ロアン氏はAIプレイグラウンドを「良いアイデア」と評した。PCWorld.comの質問に答えて、同氏は「今のところ具体的な計画はないが、間違いなく私たちが進みたい方向だ」と述べた。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.