- 【GPGPU】くだすれCUDAスレ part6【NVIDIA】
986 :デフォルトの名無しさん[sage]:2014/11/16(日) 11:43:22.74 ID:yrnRny97 - ブロックとスレッドを同じ数だけ使って
1/(blockIdx.x-threadIdx.x)^2 という計算をしようと思うのですが、途中でゼロ除算が出て来てしまいます ですがGPU計算で条件分岐を使ってしまうと処理が重くなると聞きました 条件分岐を使用せずにゼロ除算を回避する方法はありますか?
|
- 【GPGPU】くだすれCUDAスレ part6【NVIDIA】
989 :デフォルトの名無しさん[sage]:2014/11/16(日) 16:42:21.54 ID:yrnRny97 - >>988
ありがとうございます この演算の後に__syncthread()があるので、出来る限りゼロ除算側のパスの内容を簡略化しようと思うのですが 可能ならゼロ除算側のパスの中を空にしてしまうのが一番の高速化なのでしょうか? もう一つ、If文より三項演算子の方が良いと言うのは構造が単純だからでしょうか?
|
- 【GPGPU】くだすれCUDAスレ part6【NVIDIA】
991 :デフォルトの名無しさん[sage]:2014/11/16(日) 20:52:57.82 ID:yrnRny97 - >>990
ありがとうございます 前半は大した質問ではないので大丈夫です 三項演算子ってGPU計算ではすごく便利なんですね
|
- 【GPGPU】くだすれCUDAスレ part6【NVIDIA】
992 :デフォルトの名無しさん[sage]:2014/11/16(日) 20:55:48.07 ID:yrnRny97 - >>990
一応前半の部分の説明を言っておくと どうしても条件文を使わなければいけない場合は、その中の処理を出来る限り単純化すべきですか? という意味でした、説明不足でした
|