HPC:バンド幅ボトルネックの問題
メモリバンド幅が必要な問題
- 流体計算、気象予報
- QCD(Quantom Chromo Dynamics)
- FFT
- 遠距離相互作用を伴う粒子シミュレーション
課題
CPUの実効演算性能(non-cache-aware FLOPS)に比べて、メモリバンド幅、I/Oバンド幅が極端に低い。つまり、Byte/FLOPが低い。レジスタ・キャッシュ容量と比べてはるかに大きなデータを扱うため。
- かつてのベクトル機 4Byte/FLOP
- 現在のコモディティ機 0.25Byte/FLOP
- QCDで必要な目安 2.5Byte/FLOP
外部I/Oのバンド幅が相対的に小さい
PCI-Express Gen2 x16で、理論ピーク 10GB/s。最高性能DDRメモリの数分の1。