トップページ > プログラム > 2015年05月14日 > CyZl9DuQ

書き込み順位&時間帯一覧

6 位/175 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000111000000100000004



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
【C++】高速化手法【SSE】

書き込みレス一覧

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
118 :デフォルトの名無しさん[]:2015/05/14(木) 07:59:10.95 ID:CyZl9DuQ
>>117
>AとBは逐次の処理になる

これはどういう意味でしょう?
AとBが内部的には必ず両方とも実行されてしまうと言うことでしょうか?
【C++】高速化手法【SSE】
926 :デフォルトの名無しさん[]:2015/05/14(木) 08:02:29.60 ID:CyZl9DuQ
http://wiki.epii.jp/%E3%81%9D%E3%81%AE%E4%BB%96/FLOPS%E7%AE%97%E5%87%BA%E6%B3%95

↑を見ると、
[SandyBridge以降]
・SIMD 演算器を 256 ビットに増強 (AVX)。
・FMA 命令も定義されているが現時点 (2013/01/27) で未実装。
・FLOPS (DP) = (SIMD: 4) ✕ (積和: 2) ✕ (コア数) ✕ (クロック周波数)

[Haswell 以降]
・256 ビット長の FMA 演算器を二基搭載。
・FLOPS (DP) = (SIMD: 8) ✕ (積和: 2) ✕ (コア数) ✕ (クロック周波数)

となっていますが、レジスタは256ビットのままなのに、
SIMD のところが 4 から 8 に増えたのはどうしてですか?
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
119 :デフォルトの名無しさん[]:2015/05/14(木) 09:14:40.23 ID:CyZl9DuQ
Intel系CPUの場合、確か cmov などという命令は、bool 値が1の時だけ
転送するのだったと思います。そういう命令は無いんでしょうか?
仮に何かあったとして、CUDA や OpenCL でどうやってそのような
「専用命令」を生成する事は可能でしょうか?
【C++】高速化手法【SSE】
928 :デフォルトの名無しさん[]:2015/05/14(木) 16:20:50.20 ID:CyZl9DuQ
>>927
アセンブラで
   ・・・
   mov xxx,yyy
   FMA命令1    ;F1
   FMA命令2    ;F2
   ・・・

みたいな場合、F1とF2が1クロックで同時実行できることがあると?


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。