「GPUさえ良ければ快適」——その思い込みが、あなたのPCの性能を30%以上ドブに捨てているかもしれません。
RTX 5090という50万円超の怪物GPUを積んでも、CPUが追いつかなければGPU使用率はわずか52%。逆にCPUだけハイエンドでも、レイトレーシングの膨大な計算はCPUの数千倍の効率を持つGPUでなければ処理できません。
本記事では、1フレームが画面に届くまでの「16.6ミリ秒の攻防」を実測データで分解し、GPUとCPUのバランスが取れた「正解の構成」を用途別に提示します。
1. 1フレームが画面に届くまで——16.6msのリレー
ゲームで「60fps」が出ている時、PCの中では1秒間に60回、CPUとGPUの間で精密なリレーが行われています。1フレームに許された時間はわずか16.6ミリ秒。この中でCPUとGPUが「何を」担当しているのかを分解します。
CPUの仕事:「世界のルール」を計算する
- ゲームロジック:敵AIの判断、プレイヤー入力の反映、当たり判定。オープンワールドでは数千オブジェクトの物理演算をシングルスレッドが処理
- ドローコール生成:「このポリゴンを、このテクスチャで、この位置に描け」というGPUへの命令書を作成。この速度がCPUの最重要指標
- アセット管理:SSDからテクスチャを読み込み、メインメモリからVRAMへの転送を制御
GPUの仕事:「映像」に変換する
- 頂点シェーダー:3Dモデルの頂点を画面上の2D座標に変換
- ラスタライズ:ベクターデータをピクセルの集合に変換
- ピクセルシェーダー + レイトレーシング:各ピクセルの色・質感・光の反射を物理計算
- DLSS 4:AIが過去フレームから中間フレームを生成し、滑らかさを劇的に向上
MSFS 2024:1フレームのタイムライン分析
Core i7-14700KF + RTX 5070 Ti環境での実測データです。
| 処理フェーズ | 担当 | 時間 (ms) | 内容 |
|---|---|---|---|
| 入力 / スクリプト | CPU | 2.5 | ユーザー入力、スクリプト実行 |
| AI / 交通ロジック | CPU | 4.0 | 航空機AI、地上車両の挙動 |
| 物理 / 衝突判定 | CPU | 3.5 | 機体の物理挙動、気流計算 |
| ドローコール生成 | CPU | 4.0 | 膨大な地形の描画命令 |
| ジオメトリ / ラスタ | GPU | 2.0 | 3Dモデル配置、ピクセル変換 |
| シェーディング / RT | GPU | 6.5 | 質感、雲、ライティング |
| DLSS / 出力 | GPU | 1.1 | AIフレーム生成、画面出力 |
| 合計 | 混成 | 23.6 | ≒ 42fps(CPU側が律速) |
💡 なぜGPUが速くても42fpsしか出ないのか?
CPU側の合計が14.0ms、GPU側が9.6ms。CPUの処理が終わらなければGPUにバトンが渡りません。GPUがいかに高速でも、14.0ms(≒71fps)が上限。これが「CPUボトルネック」の正体です。
2. CPUボトルネック——50万円のGPUを殺す「中位CPU」の罠
RTX 5090は前世代比20〜50%の性能向上を果たしましたが、この性能を引き出すにはCPU側にも相応の「命令発行速度」が必要です。
実測データ:RTX 5090にCore i5を組むとどうなるか
| 解像度 | CPU | GPU使用率 | 平均fps | 状態 |
|---|---|---|---|---|
| 1080p | Ryzen 9 9950X3D | 85% | 310 | 軽微なCPU制限 |
| 1080p | Core Ultra 5 250K | 52% | 195 | 深刻なボトルネック |
| 4K | Ryzen 9 9950X3D | 99% | 115 | GPUフル稼働 |
| 4K | Core Ultra 5 250K | 92% | 108 | ほぼGPU限界 |
1080pではGPU使用率がわずか52%。50万円超のRTX 5090の性能の半分が眠っている状態です。Core i5のドローコール生成速度が限界に達し、GPUは「次の命令」を待ち続けています。
なぜ「4Kではボトルネックが出にくい」のか?
- 1080p(200万ピクセル):GPUが瞬時に描き終わる → CPUに「次の命令」を高速で要求 → CPUのシングルスレッドが天井に
- 4K(830万ピクセル):GPUが1枚の絵に4倍の時間がかかる → CPUはゆっくり準備すれば追いつく → ボトルネックが発生しにくい
ただし2026年はRTX 5090があまりに高速なため、4KでもCPUボトルネックが発生するケース(MSFS 2024やRTSゲーム)が増加しています。
3. AI推論の「帯域の壁」——GPUだけでは動かない
ローカルLLMや画像生成AIでは、GPUのTensorコアが演算の主体ですが、データの流れがパフォーマンスの真の規定打です。
| 構成 | モデル | 接続 | 推論速度 | ボトルネック |
|---|---|---|---|---|
| RTX 5090 (32GB) | Llama 3.1 70B Q4 | VRAM内完結 | 45 TPS | GPUメモリ帯域 |
| RTX 5070 Ti (16GB) | Llama 3.1 70B Q4 | PCIe→RAM | 1.8 TPS | PCIe/メモリ帯域 |
VRAMに収まらないモデルをメインRAMにオフロードすると、推論速度は1/25に低下。DDR5の帯域(約80GB/s)はGPUメモリ(RTX 5090で約1.8TB/s)の22分の1しかないためです。ローカルLLMの詳しいスペック要件はこちら。
4. クリエイティブソフト——「GPU全振り」が失敗するケース
After Effects:シングルスレッドの絶対領域
AEの2Dエフェクト(ブラー、変形、カラー補正)は「直前の処理が終わらなければ次に進めない」シーケンシャル処理。コア数よりシングルコアのクロックがプレビュー速度を決定します。RTX 5090を積んでもCPUが旧世代なら、タイムラインのスクラブは改善されません。
Blender:レンダリングはGPU、操作はCPU
- Cycles(パストレーシング):計算の9割以上がGPU。RTX 5090のOptiXで数十倍高速化 → GPU性能が正義
- ビューポート操作・シミュレーション:ボーン変形、流体演算はCPU領域。GPUだけ盛ると「描画は綺麗だが操作が1fps」の事態に
Premiere Pro / DaVinci Resolve:協調の美学
- タイムライン再生:Intel Quick Sync Videoが低遅延再生のカギ
- エフェクト適用:GPU CUDAコアが全力稼働
- 書き出し:CPU+GPU協調で最速に
5. 用途別「正解の組み合わせ」2026年版
| 用途 | 推奨CPU | 推奨GPU | BTO価格帯 |
|---|---|---|---|
| ゲーム特化 | Ryzen 7 9800X3D | RTX 5070 Ti | 38〜42万円 |
| 映像編集 | Core Ultra 7 270K+ | RTX 5080 | 50〜60万円 |
| 3DCG / VFX | Core Ultra 9 285K | RTX 5090 | 85〜100万円 |
| AI / LLM | Ryzen 9 9950X3D | RTX 5090 (32GB) | 110万円〜 |
| コスパ重視 | Core Ultra 5 250K+ | RTX 5060 Ti | 22〜26万円 |
💰 予算配分の黄金比
GPU 45〜50% / CPU 15〜20% / メモリ・ストレージ 20% / 電源・冷却 10〜15%。GPUに70%以上を割いてCPUをエントリーにすると、GPU性能の30%以上をドブに捨てる結果に。
最終結論
- GPUだけ良くてもダメ:CPUが描画命令を発行し終えなければ、GPUは何も描けない。宝の持ち腐れ
- CPUだけ良くてもダメ:レイトレーシングや830万ピクセルの計算は、CPUの数千倍の効率を持つGPUでなければ現実的な時間で処理不能
- 正解:目標とする解像度で、CPU・GPU両方が100%使い切れるバランス構成を選ぶこと