トップページ > プログラム > 2017年09月14日 > l0W4QyGB

書き込み順位&時間帯一覧

31 位/181 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000000000000010012



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
【C++】高速化手法【SSE】2 [転載禁止]©2ch.net

書き込みレス一覧

【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
243 :デフォルトの名無しさん[sage]:2017/09/14(木) 20:07:50.27 ID:l0W4QyGB
rep movsbが糞速い
https://srad.jp/~miyuri/journal/569822/
>>REP MOVSはマイクロコードで実装されていて、最初にコピーサイズを見て適するコピーアルゴリズムを決めるセットアップ処理を行なってから
>>実際のコピー処理を始めるようになっている。そのため小さいサイズのコピーではセットアップ時間のオーバーヘッドが無視できないが
>>コピーサイズ(適度に大きいサイズ)とアラインメントの要件とプロセッサの世代の条件を満たすとそこそこの性能が出る。

>>プロセッサの世代によって展開されるマイクロプログラムが変わり最適化の度合いも変わってくると。
>>第1世代Core i以降のプロセッサのREP MOVSのマイクロコードは比較的速い。
デコード済みの命令をキャッシュ出来るようになったから、マイクロコード展開命令でも最適化が行われるようになってるみたいだよ。
【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
246 :デフォルトの名無しさん[sage]:2017/09/14(木) 23:27:05.22 ID:l0W4QyGB
>>238
キャッシュ可な領域はキャッシュライン単位でDRAMの読み書きが行われるはずだから
キャッシュは関係ないでしょ。


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。