必死チェッカーもどきプログラム > 2016年03月05日 > oAjMaO0h

トップページ > プログラム > 2016年03月05日 > oAjMaO0h

書き込み順位＆時間帯一覧

4 位/192 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
4 位/192 ID中	書き込み数	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	0	0	1	0	1	1	0	3	0	7

使用した名前一覧	書き込んだスレッド一覧
デフォルトの名無しさん	【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net C++相談室 part123 [無断転載禁止]©2ch.net

書き込みレス一覧

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
854 ：デフォルトの名無しさん[sage]：2016/03/05(土) 14:14:59.66 ID:oAjMaO0h: つーかまともな話しようとすると団子認定されるのは書き込む気を無くさせるためなのだろうか。
技術的な話をすると内容がどうでも団子にされるから、そういう話が理解できないのと、ある意味団子崇拝が酷いのだろうな。

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
859 ：デフォルトの名無しさん[sage]：2016/03/05(土) 17:17:05.46 ID:oAjMaO0h: ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。

C++相談室 part123 [無断転載禁止]©2ch.net
171 ：デフォルトの名無しさん[sage]：2016/03/05(土) 19:47:02.21 ID:oAjMaO0h: >>170
だからそういう話だろう。

C++相談室 part123 [無断転載禁止]©2ch.net
178 ：デフォルトの名無しさん[sage]：2016/03/05(土) 20:41:10.45 ID:oAjMaO0h: 実際変わるよねぇ
VSだと。

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
865 ：デフォルトの名無しさん[sage]：2016/03/05(土) 22:00:09.02 ID:oAjMaO0h: 基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法

状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
869 ：デフォルトの名無しさん[sage]：2016/03/05(土) 22:24:17.32 ID:oAjMaO0h: cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。

scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス１つ計算すればすむのに無駄だなぁと。

で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。

まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。

C++相談室 part123 [無断転載禁止]©2ch.net
187 ：デフォルトの名無しさん[sage]：2016/03/05(土) 22:52:37.60 ID:oAjMaO0h: 文の終端記号
文法上そうなっている。
変数定義構文だから。

配列がどういう記述をしているかはわからないが、enumでもいけるだろ。

namespaceは要らないのよね。

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。