トップページ > 自作PC > 2008年08月17日 > C0ppS6h9

書き込み順位&時間帯一覧

7 位/3408 ID中時間01234567891011121314151617181920212223Total
書き込み数00000000001000000574334128



使用した名前一覧書き込んだスレッド一覧
,,・´∀`・,,)っ
AMDの次世代CPUについて語ろう 第22世代
CPUアーキテクチャについて語れ 11
Atomで自作 6枚目

書き込みレス一覧

AMDの次世代CPUについて語ろう 第22世代
876 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 10:23:14 ID:C0ppS6h9
TLBエラッタのパッチ当てたらベンチマークでタイムが2倍【伸びた】CPUがあったけどアレなんだっけな
CPUアーキテクチャについて語れ 11
217 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 17:06:27 ID:C0ppS6h9
>>213
それ、クロックレンジまでおもっきし回帰するんだが。
FP積和で4clkは流石だったがパイプライン段数を11段に増やした7450ですら
2GHzすら越えた実績がない。

Intelに限ればATOMでも単精度命令のレイテンシは3以上。
CPUアーキテクチャについて語れ 11
221 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 17:36:04 ID:C0ppS6h9
レイテンシ1で?
どんなアーキテクチャだよ。

そもそもP5とP6パイプの段数の差の大部分はデコードやスケジューリングであって
Executeステージの深さは10年前から変わってない。

妄想甚だしい。

CPUアーキテクチャについて語れ 11
223 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 17:40:15 ID:C0ppS6h9
浮動小数命令をレイテンシ1でこなしてたアーキテクチャを示せよ。
低能マコの指摘するPentiumですらfaddで3。

「1サイクル」の意味をレイテンシのことだと勘違いしてたとしか思えんし
認めればこれ以上恥の上塗りにならねーぞ
CPUアーキテクチャについて語れ 11
225 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 17:49:10 ID:C0ppS6h9
ああIEEE754非準拠ならいけるなんてのは論外な。
7450はvfaddもvfmaddもレイテンシ4。G5では8
CPUアーキテクチャについて語れ 11
226 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 17:52:46 ID:C0ppS6h9
日本語の「Intelアーキテクチャ最適化リファレンスマニュアル」にPen1〜Pen3まで載ってるが。

プリフィクスバイト食わせると必ずストールするし(笑)
CPUアーキテクチャについて語れ 11
228 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:01:44 ID:C0ppS6h9
黙れ透明あぼーん
CPUアーキテクチャについて語れ 11
232 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:13:12 ID:C0ppS6h9
ちなみにAMD次世代22の#408に貼ったia32_opt.pdfそのものなんだが、
どういう発想で、より高クロックのLarrabeeでFPの加減算がレイテンシ1で済む
なんて妄想に至ったのか理解に苦しむな
CPUアーキテクチャについて語れ 11
235 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:24:01 ID:C0ppS6h9
つかP5のfadd/fsub/fmulはレイテンシっていうよりスループットクロックを含め消費クロックが3だ。
fxchで並列化・パイプライン化なんてテクニックはPProからだし。

1TFを叩き出すパイプラインの構造はPPro以降のそれからの逆輸入だろう。
P5に倣ってるのは非対称のパイプラインくらいだろ。
CPUアーキテクチャについて語れ 11
237 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:34:57 ID:C0ppS6h9
お前の妄言そこら中に貼ってやるだろうな。まあ気にしないんだろうけど。
マコタみたいな恥がない奴って最強だな。
IA32でFP加減算・乗算を3クロック未満のレイテンシでこなせたものは
未だかつて「ない」。
CPUアーキテクチャについて語れ 11
239 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:42:23 ID:C0ppS6h9
バカ丸出しだな


LarrabeeがIA以外の何だっての?
Pentiumの応用であることを根拠にFP演算は低レイテンシだと言ってみたり

そのPentiumが1クロックサイクルでFP演算をこなせないことを指摘したら話題そらしか。
厚顔無恥ってうらやましいよwwww
CPUアーキテクチャについて語れ 11
241 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:48:27 ID:C0ppS6h9
まあいいよ
どのみち命令のレイテンシは短いに越したことはない

それはそれで、
単精度演算のレイテンシ6clkもかかるCell-SPUのコーディングテクが役に立たないことが示される
CPUアーキテクチャについて語れ 11
242 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 18:54:43 ID:C0ppS6h9
同じインオーダのAtomもHT使うことでかろうじて浮動小数演算の性能悪化を食い止めてるのが現実。

CPUアーキテクチャについて語れ 11
243 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 19:03:13 ID:C0ppS6h9
レジスタ8本(x64で16本だが)でレイテンシ3かそれ以上の命令を
スケジューリングするのは何のハード支援もなしでは現実問題無理。
OoO・レジスタリネームを削除した代わりに用意された
命令インターリーブの手段がHTだ。
CPUアーキテクチャについて語れ 11
248 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 19:19:51 ID:C0ppS6h9
>>245
SIMDレジスタが1スレッドで128本でもあるならそうしたいところだが、
ModRMを引きずる限り8本、REXつけて16本がいいところ。

まあ引きずると決まったわけではないが、それはそれで
レガシーSSEの延長でもVEXエンコーディングでもない命令セットをどこのOpcode空間に定義するのよって問題も。
CPUアーキテクチャについて語れ 11
250 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 19:35:43 ID:C0ppS6h9
いやメモリ間オペレーションは代々x86の伝統だし。
デコーダを複雑にもできないはずなのでModRM+SIB+DISPによるメモリアクセスを踏襲する可能性大。
必然的にレジスタは各8本ないし16本。
マスクレジスタは別にあるのかもしれないけど。
CPUアーキテクチャについて語れ 11
252 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 19:48:01 ID:C0ppS6h9
AVXで真の4オペランド使えてるんだが。メモリオペランドがソース限定なのもAVXの仕様。

VEXエンコーディングを使う可能性高いな。
ほかにOpcode余ってるのは64ビットでUD化された命令空間だけ。
CPUアーキテクチャについて語れ 11
253 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 20:06:14 ID:C0ppS6h9
ああx64はXMMレジスタに引数を積むとかSSE2までの存在を前提に
ABIが定義されてるから、SSEのOpcodeを潰すという対応は無しね。
逆に言うとLarrabeeでも最低SSE2までは実行できると考えられ。
CPUアーキテクチャについて語れ 11
256 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 20:37:06 ID:C0ppS6h9
>フォワーディングネットワーク
これ予約機構のことかね?
Intel用語ではActive Register FileといってP6アーキのレジスタリネーミング機構の特徴の一つです。

結局LarrabeeはP5じゃないって言いたいんだな。
CPUアーキテクチャについて語れ 11
260 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 20:49:03 ID:C0ppS6h9
まあ確かに有るね。
実レジスタファイルへの書き込みまでのサイクルには言及した覚えはないので
どのみちFUCKヲタの一人相撲に違いない
CPUアーキテクチャについて語れ 11
262 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 21:29:24 ID:C0ppS6h9
いやそもそもP5って何十もレジスタあったっけ?

つか#248966でいう何ページ目にかかれてることを論じてるの?
CPUアーキテクチャについて語れ 11
263 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 21:36:43 ID:C0ppS6h9
・Cellのスケーラビリティ
・PentiumはFP加減算1サイクル

流石に負けでいいよいろんな意味で彼は1等賞(笑)だろ
CPUアーキテクチャについて語れ 11
264 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 21:45:41 ID:C0ppS6h9
>>204とかさ
addpsはレイテンシ3サイクルかかると言ってる傍で
「加減算は1サイクルで済むす(笑)」

日本語通じないバカって素敵。

結局彼はx86を知らない
CPUアーキテクチャについて語れ 11
266 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 22:20:55 ID:C0ppS6h9
おい1サイクルの件、逃げずに見苦しく弁解しろよ。

・ROBはIntel専門用語
・AtomはSMTではない

一等賞大好きだな
何冠王になればいいんだよ負ッケオタ
Atomで自作 6枚目
749 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 22:23:10 ID:C0ppS6h9
高い産業用を個人で買うとか本末転倒な楽しみ方があるさ
CPUアーキテクチャについて語れ 11
269 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 22:39:48 ID:C0ppS6h9
>>267
ModRMは1バイト見ただけでSIB・DISPの有無および長さを判別できるから
実はそれなりに合理的。
基本命令がx86なのに別のフォーマットを用意する方がかえってデコーダが複雑になる。


あと命令長を判別しやすいのってフロントエンドの負担軽減のためには大事だからね。
AVXのVEXプリフィクスはModRMまでの命令長が即特定できるから結果的にデコーダにも優しい。
CPUアーキテクチャについて語れ 11
270 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 22:58:17 ID:C0ppS6h9
あ、要素単位で別々のアドレスにロード・ストアする命令については
かのレポートにSIMDレジスタの各要素値を使う的なことが書いてあるので、
ModRM+SIB+DISPの拡張は不要かと思われる。
従来IAと変えないといけないのはむしろLSUだ。

マスクストアってVMASKMOVPSの512ビット版なんじゃないかと思ったり。
AMDの次世代CPUについて語ろう 第22世代
895 :,,・´∀`・,,)っ[sage]:2008/08/17(日) 23:12:53 ID:C0ppS6h9
なんというオカルトスレ


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。