- 【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
854 :デフォルトの名無しさん[sage]:2016/03/05(土) 14:14:59.66 ID:oAjMaO0h - つーかまともな話しようとすると団子認定されるのは書き込む気を無くさせるためなのだろうか。
技術的な話をすると内容がどうでも団子にされるから、そういう話が理解できないのと、ある意味団子崇拝が酷いのだろうな。
|
- 【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
859 :デフォルトの名無しさん[sage]:2016/03/05(土) 17:17:05.46 ID:oAjMaO0h - ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。
|
- C++相談室 part123 [無断転載禁止]©2ch.net
171 :デフォルトの名無しさん[sage]:2016/03/05(土) 19:47:02.21 ID:oAjMaO0h - >>170
だからそういう話だろう。
|
- C++相談室 part123 [無断転載禁止]©2ch.net
178 :デフォルトの名無しさん[sage]:2016/03/05(土) 20:41:10.45 ID:oAjMaO0h - 実際変わるよねぇ
VSだと。
|
- 【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
865 :デフォルトの名無しさん[sage]:2016/03/05(土) 22:00:09.02 ID:oAjMaO0h - 基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法 状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
|
- 【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
869 :デフォルトの名無しさん[sage]:2016/03/05(土) 22:24:17.32 ID:oAjMaO0h - cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。 scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス1つ計算すればすむのに無駄だなぁと。 で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。 まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
|
- C++相談室 part123 [無断転載禁止]©2ch.net
187 :デフォルトの名無しさん[sage]:2016/03/05(土) 22:52:37.60 ID:oAjMaO0h - 文の終端記号
文法上そうなっている。 変数定義構文だから。 配列がどういう記述をしているかはわからないが、enumでもいけるだろ。 namespaceは要らないのよね。
|