トップページ > プログラム > 2016年03月05日 > oAjMaO0h

書き込み順位&時間帯一覧

4 位/192 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000000010010110307



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
C++相談室 part123 [無断転載禁止]©2ch.net

書き込みレス一覧

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
854 :デフォルトの名無しさん[sage]:2016/03/05(土) 14:14:59.66 ID:oAjMaO0h
つーかまともな話しようとすると団子認定されるのは書き込む気を無くさせるためなのだろうか。
技術的な話をすると内容がどうでも団子にされるから、そういう話が理解できないのと、ある意味団子崇拝が酷いのだろうな。
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
859 :デフォルトの名無しさん[sage]:2016/03/05(土) 17:17:05.46 ID:oAjMaO0h
ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。
C++相談室 part123 [無断転載禁止]©2ch.net
171 :デフォルトの名無しさん[sage]:2016/03/05(土) 19:47:02.21 ID:oAjMaO0h
>>170
だからそういう話だろう。
C++相談室 part123 [無断転載禁止]©2ch.net
178 :デフォルトの名無しさん[sage]:2016/03/05(土) 20:41:10.45 ID:oAjMaO0h
実際変わるよねぇ
VSだと。
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
865 :デフォルトの名無しさん[sage]:2016/03/05(土) 22:00:09.02 ID:oAjMaO0h
基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法

状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
869 :デフォルトの名無しさん[sage]:2016/03/05(土) 22:24:17.32 ID:oAjMaO0h
cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。

scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス1つ計算すればすむのに無駄だなぁと。

で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。

まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
C++相談室 part123 [無断転載禁止]©2ch.net
187 :デフォルトの名無しさん[sage]:2016/03/05(土) 22:52:37.60 ID:oAjMaO0h
文の終端記号
文法上そうなっている。
変数定義構文だから。

配列がどういう記述をしているかはわからないが、enumでもいけるだろ。

namespaceは要らないのよね。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。