Latest evidence-based health information
Apps

現代のビジネスPCのパフォーマンス評価

現代のビジネスPCのパフォーマンス評価
現代のビジネスPCのパフォーマンス評価

PC購入の決定には多くの要素が関係しますが、パフォーマンスは依然としてあらゆる規模の企業にとって最大の関心事です。多くの企業は、自社のニーズに最適なシステムを決定するために、パフォーマンスベンチマークを活用しています。しかし、これらのベンチマークだけではパフォーマンスの全体像を把握できない場合があります。ベンチマークはプロフェッショナル向けアプリケーションに基づいていますか?それとも主にコンシューマー向けワークロードに基づいていますか?環境条件はどのようなものでしたか?この記事では、ベンチマークを用いて最新のビジネスPCのパフォーマンスを評価する際に考慮すべき重要な点、そして現在そして将来のニーズに最適なシステムを選択する方法について解説します。 

PCパフォーマンスを測定する昔ながらの方法

従来、企業はプロセッサ周波数やキャッシュサイズといった様々な物理仕様を用いてPCパフォーマンスの基準を設定してきました。しかし、このアプローチには2つの問題があります。まず、同じ周波数で動作するプロセッサが2つあっても、基盤となる実装の効率性(「クロックあたりの命令数」(IPC)で測定される)によってパフォーマンスが大きく異なる可能性があります。2つ目の問題は、ほとんどの最新プロセッサでは周波数が一定ではないことです。これは特にノートPCのプロセッサに当てはまり、熱対策によって周波数が制限されます。また、実行されるタスクの種類、タスクの継続時間、使用されるコア数などによっても周波数は大きく変化します。                                                                                        

実世界テストによるパフォーマンス評価

現代のアプリケーションは非常に複雑で、基盤となるアルゴリズムやデータアクセスパターンが多岐にわたります。そのため、プロセッサの測定効率、つまりIPCは、アプリケーション間、さらにはワークロード間でも大きく異なることがよくあります。多くのアプリケーションには、画面へのグラフィック表示、ストレージやネットワークからのデータの読み取りといった機能が含まれています。これらのワークロードでは、CPUパフォーマンスは重要ですが、考慮すべき唯一の要素ではありません。

新しいPCのパフォーマンスを評価する最良の方法の一つは、実環境テストを実施することです。つまり、実際のユーザーに実際の作業環境で日常的なタスクを実行させ、実環境のデータを用いてもらうのです。こうしたユーザーの体験は、将来の満足度とより相関性が高く、公開されているベンチマークよりも正確です。しかし、このアプローチには欠点がないわけではありません。評価に時間がかかること、測定するワークロードを決定するのが難しいこと、そして一貫性、信頼性、そして偏りのない方法でパフォーマンスを測定するのが難しいことなどが挙げられます。

個々のユーザーテストの次に良いアプローチは、社内開発者がユーザーからの意見を取り入れ、ユーザーの優先度に合わせた方法でアプリケーションのパフォーマンスを測定するための「カスタム」スクリプトを作成することです。このアプローチは、パフォーマンス測定の一貫性を向上させ、再現性のある結果を提供します。しかし、これは依然として相当な作業であり、異なる世代のPC間で維持するのが難しい場合があります。

代わりに、多くの企業はシステムパフォーマンスの評価に業界標準のPCベンチマークの結果を利用しています。単一のベンチマークを使用するのではなく、複数のベンチマークから総合スコアを作成することで、企業はより広い範囲でパフォーマンスを把握できます。

図 1 は、PC パフォーマンスを評価する 3 つの異なるアプローチ (ベンチマーク、アプリケーション スクリプト、ユーザー評価) を比較し、結果がビジネスとの関連性のレベルにどのように影響するかを示しています。 

AMD 簡易図3 PC 評価戦略 1.2 Arrow BW

図1 – PC評価戦略

優れたベンチマークとはどのようなものでしょうか?

PCのパフォーマンス評価には、「合成ベンチマーク」と「アプリケーションベースベンチマーク」の2種類のベンチマークが一般的に使用されています。どちらのベンチマークも意思決定プロセスにおいて有用ですが、個々のベンチマークには望ましくない特性が見られる場合が多くあります。こうした特性は、複数のベンチマークを組み合わせて使用​​することで、より広範かつ信頼性の高いパフォーマンスの全体像を把握するという一般的な原則に従うことで軽減できます。

優れたベンチマークは、可能な限り透明性が高く、ベンチマークのテスト対象とそのテスト方法が明確に説明されている必要があります。アプリケーションベースのベンチマークの場合、これにより、購入者は使用されているワークロードが自社の用途に適合しているかどうかを把握できます。十分な透明性がなければ、テストが特定のアーキテクチャを他のアーキテクチャよりも強調するために選択されているのではないかという疑問が生じる可能性があります。

アプリケーションベースのベンチマークはすべて同じではない

アプリケーションベースのベンチマークにおけるテストは、組織にとって最も関連性の高いワークロードを表す必要があります。例えば、ベンチマークの30~50%が商用環境ではほとんど使用されないアプリケーションから取得されている場合、そのスコアはおそらく関連性がありません。図2のベンチマークは主にコンシューマータイプのワークロードに基づいており、オフィスアプリケーションの使用率は低いです。したがって、このベンチマークはほとんどの商用組織にとって有用ではない可能性があります。

AMD fig1 ベンチマーク構成 ラージピース bw

図2 – 商用環境に適さないベンチマーク構成

アプリケーションベースのベンチマークの中には、市販アプリケーションのパフォーマンスを測定するものもありますが、組織に導入されているアプリケーションのバージョンを反映していない、あるいはソフトウェアベンダーによる最新のパフォーマンス最適化が反映されていない場合があります。そこで、合成ベンチマークが役立ちます。

プラットフォームのパフォーマンスポテンシャルの評価

アプリケーションベースのベンチマークとは異なり、合成ベンチマークは特定のプラットフォームの全体的なパフォーマンスポテンシャルを測定します。アプリケーションベンチマークは、プラットフォームが特定のアプリケーションの特定のバージョンに対してどの程度最適化されているかを示しますが、必ずしも新しいアプリケーションのパフォーマンスを予測するのに適しているわけではありません。例えば、多くのビデオ会議ソリューションは、仮想背景の使用などの機能を実行するために複数のCPUコアを使用しています。プラットフォームのマルチスレッド機能を測定する合成ベンチマークは、プラットフォームがこれらの新しい機能をどの程度うまく提供できるかを予測するために使用できます。

合成ベンチマークでは、狭い範囲のパフォーマンス指標の使用を避けることが重要です。同じファミリーであっても、個々のプロセッサは、小さなコードの処理方法さえも異なる場合があります。合成ベンチマークスコアは、複数の個別のテストで構成され、異なるワークロードを実行するより多くのコード行を実行する必要があります。これにより、プラットフォームのパフォーマンスをより広い視点で捉えることができます。

マルチタスクのベンチマークは難しい

アプリケーションベンチマークでは、現代のマルチタスクオフィスワーカーのデスクトップワークロードをシミュレートするのが困難です。複数のアプリケーションを同時に実行すると、一度に1つのアプリケーションだけをテストするよりもテストエラーの許容範囲が大きくなるためです。プラットフォームの生のマルチスレッド処理能力を測定する合成アプリケーションは、今日のマルチタスクユーザーの要求を的確に表す指標となります。

ベストプラクティスとしては、アプリケーションベースのベンチマークスコアと合成ベンチマークスコアの両方を併せて検討することが挙げられます。幾何平均を用いてスコアを組み合わせることで、異なるベンチマークのスコアスケールの違いを考慮できます。これにより、現在使用されているアプリケーションを考慮し、将来を見据えた上で、特定のプラットフォームにおけるパフォーマンスを最も正確に把握できます。

その他の重要な考慮事項

ベンチマークはシステム評価において重要な要素です。しかし、これらの強力なツールにはいくつかの重要な限界があります。

  • 測定されたベンチマーク パフォーマンスは、オペレーティング システム (OS) とアプリケーションのバージョンによって異なる場合があります。これらのバージョンが環境で使用されているものと一致していることを確認してください。
  • バックグラウンドタスク、室温、仮想化ベースセキュリティ(VBS)の有効化といったOS機能など、その他の条件もスコアに影響を与える可能性があります。繰り返しになりますが、これらの条件が全て同じであり、導入環境と合致していることを確認してください。
  • 一部のユーザーは、ベンチマークでカバーされていない比較的ニッチなアプリケーションや機能を使用している可能性があります。ベンチマークスコアにユーザー測定を加味し、合成ベンチマークスコアとの相関関係を調べることを検討してください。

測定誤差に注意

いかなる測定にも「測定誤差」、つまりテストごとにどれだけの誤差が生じるかという幅が存在します。ほとんどのベンチマークでは、測定時間の制限、OSのバックグラウンドタスクにおけるわずかな変化による「バタフライ効果」など、様々な要因によって3~5%程度の測定誤差が生じます。この誤差を克服する方法の一つは、結果を5回測定し、最高スコアと最低スコアを除外し、残りの3つのスコアの平均を取ることです。

購買依頼書において要件を設定する際には、測定誤差を考慮することが重要です。スコアXがユーザー満足度と高い相関関係にある場合、購買依頼書ではスコアが[X-イプシロン, イプシロン]の範囲内にあることを規定する必要があります。ここでイプシロンは既知の測定誤差です。イプシロンが不明な場合は、目標スコアの3~5%の範囲内であると想定するのが妥当です。

結論

パフォーマンスを正しく評価することは、一元的な作業ではありません。組織が自社のニーズに最適なシステムを判断するために活用できる手法はいくつかあります。狭いベンチマークスコアを使用すると誤った結論に至る可能性がありますが、パフォーマンスの全体像を把握するには、アプリケーションベースと合成ベンチマークの両方を幅広く検討する必要があります。

あらゆる評価における最終かつ最良のステップは、ユーザーグループに実際の作業環境でシステムを「試用」させることです。ベンチマークやアプリケーションスクリプトでシステムのスコアがどれほど優れていても、ユーザーがその体験に満足する必要があります。ベンチマーク、アプリケーションスクリプト、組織的なトライアルなど、どのような方法でパフォーマンスを測定する場合でも、AMD Ryzen PRO 4000シリーズプロセッサーは、今日のユーザーを満足させる新たなレベルの速度と効率性を提供します。今日のコンピューティング要件に対応できるノートPCのパフォーマンスと、将来のビジネスニーズにも対応できるパワーを実現する方法を学びましょう。

AMD Ryzen PRO プロセッサーが組織のパフォーマンス ニーズを満たす方法の詳細については、https://www.amd.com/en/processors/laptop-processors-for-business または https://www.amd.com/en/ryzen-pro をご覧ください。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.