トップページ > 自作PC > 2007年03月19日 > S1Hq1JIe

書き込み時間帯一覧

時間01234567891011121314151617181920212223Total
書き込み数9000000000000000000000009



使用した名前一覧書き込んだスレッド一覧
分託君CPUアーキテクチャについて語れ 7

書き込みレス一覧

CPUアーキテクチャについて語れ 7
237 :分託君[sage]:2007/03/19(月) 00:00:52 ID:S1Hq1JIe
>>235
それは、stride accessやlist経由のrandam access時の
cache hitが見込めない上、
line転送なんてバンドの無駄だから要らない
ってところが目的の命令ではないかな?
SIMDでの大量データ処理と結びつけられる?
CPUアーキテクチャについて語れ 7
238 :分託君[sage]:2007/03/19(月) 00:04:32 ID:S1Hq1JIe
邪推だけど「ベクトルloadッぽい命令も追加しておけば
なんかの役に立つかもね」くらいのノリじゃないかと思うんだ。
cache archでは。
CPUアーキテクチャについて語れ 7
240 :分託君[sage]:2007/03/19(月) 00:11:05 ID:S1Hq1JIe
>>239
んなことないよ、cache archで性能出すなら
とことん連続にデータ並べてline転送早めに発行して
in cache でブチ回して実効性能をピークに近づける。
stride/listは極力排除、除去できなければ性能は地を這うから
CPUアーキテクチャについて語れ 7
242 :分託君[sage]:2007/03/19(月) 00:22:38 ID:S1Hq1JIe
そう。
得に最終計算結果のstoreでは皮肉にもキャッシュ汚染回避が主目的に使われる。
cache archでは、memory直接見に行ったら、
ハイそこまーでよ、だから。
CPUアーキテクチャについて語れ 7
243 :分託君[sage]:2007/03/19(月) 00:23:57 ID:S1Hq1JIe
ということを考えて最初の疑問を書いただけ。
おやすみノシ
CPUアーキテクチャについて語れ 7
244 :分託君[sage]:2007/03/19(月) 00:26:33 ID:S1Hq1JIe
あ、あとSMPでのmemory同期のからみもあって
cacheにのこさないstoreを使うこともある。
でもこれは出だしのSIMDとは全然別の話し。寝る
CPUアーキテクチャについて語れ 7
246 :分託君[sage]:2007/03/19(月) 00:37:56 ID:S1Hq1JIe
並べさえすればhard prefetchちょっとは効くしね
streamが少なければ…
ーみつをー
CPUアーキテクチャについて語れ 7
248 :分託君[sage]:2007/03/19(月) 00:43:05 ID:S1Hq1JIe
連続ならline alignはそれほど影響ないと思うんだけど…
どのみちline転送がバンド一杯ひたすら繰り返されるわけだし。
いけね寝なきゃ…
CPUアーキテクチャについて語れ 7
249 :分託君[sage]:2007/03/19(月) 00:50:59 ID:S1Hq1JIe
ただし、softパイプがtiming合っていれば
ーみつをー


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。