- 【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
118 :デフォルトの名無しさん[]:2015/05/14(木) 07:59:10.95 ID:CyZl9DuQ - >>117
>AとBは逐次の処理になる これはどういう意味でしょう? AとBが内部的には必ず両方とも実行されてしまうと言うことでしょうか?
|
- 【C++】高速化手法【SSE】
926 :デフォルトの名無しさん[]:2015/05/14(木) 08:02:29.60 ID:CyZl9DuQ - http://wiki.epii.jp/%E3%81%9D%E3%81%AE%E4%BB%96/FLOPS%E7%AE%97%E5%87%BA%E6%B3%95
↑を見ると、 [SandyBridge以降] ・SIMD 演算器を 256 ビットに増強 (AVX)。 ・FMA 命令も定義されているが現時点 (2013/01/27) で未実装。 ・FLOPS (DP) = (SIMD: 4) ✕ (積和: 2) ✕ (コア数) ✕ (クロック周波数) [Haswell 以降] ・256 ビット長の FMA 演算器を二基搭載。 ・FLOPS (DP) = (SIMD: 8) ✕ (積和: 2) ✕ (コア数) ✕ (クロック周波数) となっていますが、レジスタは256ビットのままなのに、 SIMD のところが 4 から 8 に増えたのはどうしてですか?
|
- 【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
119 :デフォルトの名無しさん[]:2015/05/14(木) 09:14:40.23 ID:CyZl9DuQ - Intel系CPUの場合、確か cmov などという命令は、bool 値が1の時だけ
転送するのだったと思います。そういう命令は無いんでしょうか? 仮に何かあったとして、CUDA や OpenCL でどうやってそのような 「専用命令」を生成する事は可能でしょうか?
|
- 【C++】高速化手法【SSE】
928 :デフォルトの名無しさん[]:2015/05/14(木) 16:20:50.20 ID:CyZl9DuQ - >>927
アセンブラで ・・・ mov xxx,yyy FMA命令1 ;F1 FMA命令2 ;F2 ・・・ みたいな場合、F1とF2が1クロックで同時実行できることがあると?
|