2024-03-04から1日間の記事一覧

性能評価:FMA

C++言語で記述したプログラムと、アセンブリ言語で記述した関数を利用したときの性能差を検証してみましょう。

FMA

AVX-512はFMA(fused multiply-add、 融合積和)命令を実装しています。FMA命令を数式にしたものを以下に示します。 a × b + k 式が表すように、積と和が合体した演算です。性能が向上すだけでなく、丸め(浮動小数点数で正確に表せない値を近い値にする)が…