- 【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
243 :デフォルトの名無しさん[sage]:2017/09/14(木) 20:07:50.27 ID:l0W4QyGB - rep movsbが糞速い
https://srad.jp/~miyuri/journal/569822/ >>REP MOVSはマイクロコードで実装されていて、最初にコピーサイズを見て適するコピーアルゴリズムを決めるセットアップ処理を行なってから >>実際のコピー処理を始めるようになっている。そのため小さいサイズのコピーではセットアップ時間のオーバーヘッドが無視できないが >>コピーサイズ(適度に大きいサイズ)とアラインメントの要件とプロセッサの世代の条件を満たすとそこそこの性能が出る。 > >>プロセッサの世代によって展開されるマイクロプログラムが変わり最適化の度合いも変わってくると。 >>第1世代Core i以降のプロセッサのREP MOVSのマイクロコードは比較的速い。 デコード済みの命令をキャッシュ出来るようになったから、マイクロコード展開命令でも最適化が行われるようになってるみたいだよ。
|