必死チェッカーもどきプログラム > 2017年09月14日 > l0W4QyGB

トップページ > プログラム > 2017年09月14日 > l0W4QyGB

書き込み順位＆時間帯一覧

31 位/181 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
31 位/181 ID中	書き込み数	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1	0	0	1	2

使用した名前一覧	書き込んだスレッド一覧
デフォルトの名無しさん	【C++】高速化手法【SSE】2 [転載禁止]©2ch.net

書き込みレス一覧

【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
243 ：デフォルトの名無しさん[sage]：2017/09/14(木) 20:07:50.27 ID:l0W4QyGB: rep movsbが糞速い
https://srad.jp/~miyuri/journal/569822/
＞＞REP MOVSはマイクロコードで実装されていて、最初にコピーサイズを見て適するコピーアルゴリズムを決めるセットアップ処理を行なってから
＞＞実際のコピー処理を始めるようになっている。そのため小さいサイズのコピーではセットアップ時間のオーバーヘッドが無視できないが
＞＞コピーサイズ(適度に大きいサイズ)とアラインメントの要件とプロセッサの世代の条件を満たすとそこそこの性能が出る。
＞
＞＞プロセッサの世代によって展開されるマイクロプログラムが変わり最適化の度合いも変わってくると。
＞＞第1世代Core i以降のプロセッサのREP MOVSのマイクロコードは比較的速い。
デコード済みの命令をキャッシュ出来るようになったから、マイクロコード展開命令でも最適化が行われるようになってるみたいだよ。

【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
246 ：デフォルトの名無しさん[sage]：2017/09/14(木) 23:27:05.22 ID:l0W4QyGB: >>238
キャッシュ可な領域はキャッシュライン単位でDRAMの読み書きが行われるはずだから
キャッシュは関係ないでしょ。

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。