GPU
グラフィック処理ユニット(GPU)は、ディスプレイデバイスへの出力のためのフレームバッファ内の画像の作成を加速するために、メモリを迅速に操作および変更するように設計された専門の電子回路です。
GPUは並列処理を実行するように設計されており、大規模なデータセットと複雑な計算を伴うタスクに非常に効率的です。汎用コンピューティングとシーケンシャルタスクに最適化されたCPUとは異なり、GPUはグラフィックスレンダリング、機械学習、科学シミュレーションに固有のマトリックス演算と並列ワークロードの処理に優れています。数千の小さなコアで構成されており、複数の操作を同時に処理できるため、計算集約型のアプリケーションのパフォーマンスが大幅に向上します。
AIインフラストラクチャのコンテキストでは、GPUは機械学習モデルのトレーニングと実行に不可欠です。並列処理機能により、モデルのトレーニングが高速化され、研究者やエンジニアがより迅速に反復し、モデルをより効率的に展開できます。 AIの成長に伴い、GPUの需要が急増し、GPUテクノロジーの進歩とAIワークロードに最適化された特殊なハードウェアの開発につながっています。
graph LR
Center["GPU"]:::main
Rel_asic["asic"]:::related -.-> Center
click Rel_asic "/terms/asic"
Rel_asus_rog["asus-rog"]:::related -.-> Center
click Rel_asus_rog "/terms/asus-rog"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 理解度チェック
🧒 5歳でもわかるように説明
GPU(ジーピーユー)は、たくさんの作業員が同時に、大きな絵を描く仕事を分担して、ものすごい速さでこなすようなものです。だから、絵や動画を作るのが、何でもできるけど一人で働く作業員([CPU](/ja/terms/cpu)のこと)よりもずっと速いんです。
🤓 Expert Deep Dive
CPUとGPUのアーキテクチャ上の違いは、そのコア設計思想にあります。CPUは、少数の強力なコア、大容量キャッシュ、複雑な制御ロジックを備え、逐次処理における低レイテンシとタスク切り替えを優先します。一方、GPUは、ストリーミングマルチプロセッサ(SM)にグループ化された数千のシンプルなコアを備え、並列処理における高スループットを優先します。各SMには、テクスチャマッピングやレイトレーシングなどのタスク向けの専用ユニットとともに、多数のCUDAコア(NVIDIA)またはストリームプロセッサ(AMD)が含まれています。多数のコアに効率的にデータを供給するため、GPUのパフォーマンスにはメモリ帯域幅が不可欠であり、高帯域幅メモリ(HBM)またはGDDRバリアントが採用されています。ディープラーニングにおいては、NVIDIA GPU向けのCompute Unified Device Architecture(CUDA)は、並列コンピューティングプラットフォームおよびプログラミングモデルを提供し、基盤となるハードウェアを抽象化することで、開発者が汎用コンピューティング(GPGPU)のためにGPUパワーを活用できるようにします。トレードオフとしては、消費電力、発熱、そして大規模並列アーキテクチャ向けのプログラミングの複雑さが挙げられます。TPUなどの専用AIアクセラレータは、特定のMLワークロードに対してさらなる最適化を提供し、特定のタスクにおいてはエネルギー効率でGPUを上回る場合もあります。