トップページ > 自作PC > 2007年04月19日 > 6E1sFwXl

書き込み時間帯一覧

時間01234567891011121314151617181920212223Total
書き込み数26100000000000000000121316



使用した名前一覧書き込んだスレッド一覧
・∀・)っ-○◎●AMDの次世代CPUについて語ろう 第9世代
Intelの次世代CPUについて語ろう 28

書き込みレス一覧

Intelの次世代CPUについて語ろう 28
364 :・∀・)っ-○◎●[sage]:2007/04/19(木) 00:26:08 ID:6E1sFwXl
直接明示する資料はなかったと思うが、断言に値するヒントならいくらか出てる。
SSE4は1〜2バイトOpcode領域は3byte Opcode領域を使う。
2バイト領域は既にほぼ枯渇してるから。
そうすると、レジスタ間オペレーションでも5バイトだ。

4issueには16バイトのフェッチ帯域は既に狭い。
なのに、より命令長の新命令を50も追加する。
必然的にフェッチ幅は拡大せざるを得ない。

Super Shuffle Engineだったっけな。
複雑デコーダで複数μOPsに分解して処理してたのが
単純デコーダでデコードできるようになってる。
やっぱりフェッチ帯域の拡大の需要が出てくる。

逆にいうと、ここを改善しないと根本的な性能改善は無理。
AMDだって「SSEの性能向上ために32バイト化した」って明言してる。
Intelがヘマしてくれるという希望的観測をやりたい人じゃないなら
ここは確信を持つべきだね。
Intelの次世代CPUについて語ろう 28
366 :・∀・)っ-○◎●[sage]:2007/04/19(木) 00:40:57 ID:6E1sFwXl
根拠に基づく推論と言ってくれ
Intelの次世代CPUについて語ろう 28
371 :・∀・)っ-○◎●[sage]:2007/04/19(木) 01:00:41 ID:6E1sFwXl
>>368
pshufb mm0, mm1を1クロックで実現するのは既にMeromで実現してるが
それは別の技術だと思いこみたいのですか?w

Meromアーキだと
たとえば、XMMのシャッフル命令は、Meromは64ビット単位(上位QWと下位QWで並列動作)の
シャッフル2回、バイトローテート1回、論理和1回の複数μOPsからなるので、
デコードに複雑デコーダをを経由しないといけない。

SSSE3の水平加減算もこの効率の悪いシャッフル操作に依存した実装だから
デコーダがネックになる。フェッチ帯域がボトルネックの一つなのは前々からだが、
そのウェイトが相対的に大きくなかっただけ。
AMDの次世代CPUについて語ろう 第9世代
877 :・∀・)っ-○◎●[sage]:2007/04/19(木) 01:04:51 ID:6E1sFwXl
SSE4使ってるのこれ?
こないだのIntelのプレゼン見る限りでも既存命令のブーストがかなり凄いよ。
Intelの次世代CPUについて語ろう 28
374 :・∀・)っ-○◎●[sage]:2007/04/19(木) 01:09:35 ID:6E1sFwXl
>>373
逆に聞くが、この前言ってたVPERMの特許云々は回路規模の問題か?
Intelの次世代CPUについて語ろう 28
378 :・∀・)っ-○◎●[sage]:2007/04/19(木) 01:20:16 ID:6E1sFwXl
>>377
「回路規模の問題」っていま自分で認めてたのになに支離滅裂なことを。
VPERMの特許が必要としたら、pshufbを実装したMeromの時点でそうなってるはずだ。
Intelの次世代CPUについて語ろう 28
379 :・∀・)っ-○◎●[sage]:2007/04/19(木) 01:24:50 ID:6E1sFwXl
>>375
destのバイト要素のMSBが立ってれば0がセットされる性質を利用すれば
2回のpshufbとのいくつかのSIMD整数演算を組み合わせれば
それっぽい動きは出来る。

まあ、性能はアレだが。
Intelの次世代CPUについて語ろう 28
383 :・∀・)っ-○◎●[sage]:2007/04/19(木) 01:53:45 ID:6E1sFwXl
俺もWolfdaleの一番廉価な奴買うに留まりそうだ。

PS3はあと2、3台買いそうな勢いだが。
Cellクラスタの指令系統に必要な性能ってむしろGbE周りかな
Intelの次世代CPUについて語ろう 28
386 :・∀・)っ-○◎●[sage]:2007/04/19(木) 02:40:15 ID:6E1sFwXl
Freescaleは知らないけど(てか本当に出るのか?)
P.A.semiのは970のISA互換じゃなかったっけ
Cellもそうだが。
AMDの次世代CPUについて語ろう 第9世代
901 :・∀・)っ-○◎●[sage]:2007/04/19(木) 20:52:26 ID:6E1sFwXl
>>899
L1を倍増ってwwww


あんた頭悪いね。どこにそんなこと書いてるよ
Intelの次世代CPUについて語ろう 28
396 :・∀・)っ-○◎●[sage]:2007/04/19(木) 21:00:02 ID:6E1sFwXl
たとえばさ
palignr xmm10, [rsi+rbx+0x12345678], 5

REX+66hプレフィックス+3バイトオペコード++ ベース・オフセット+4byteディプレースメント+imm8

さて命令サイズいくつ?
これでSuper Shuffle Engineの性能生かせる?

フェッチ帯域が16バイトのままだと思いたがる方が、電波でしかない。
AMDの次世代CPUについて語ろう 第9世代
906 :・∀・)っ-○◎●[sage]:2007/04/19(木) 21:59:40 ID:6E1sFwXl
オペトロンって坂村OSの新バージョンか?
Intelの次世代CPUについて語ろう 28
401 :・∀・)っ-○◎●[sage]:2007/04/19(木) 22:22:45 ID:6E1sFwXl
なんでこの人SMTが悪名高いと思いこんでるのかな
頭悪いのかな
Intelの次世代CPUについて語ろう 28
403 :・∀・)っ-○◎●[sage]:2007/04/19(木) 23:00:26 ID:6E1sFwXl
Meromではバイトシフトと64ビットシャッフルはポートが別個だから同時実行できる。
もし1個に統合されたとしたら、ものによってはMeromより性能が落ちることになるが
シャッフルユニットとバイトシフトユニットは別個にあるかもしれない。
palignrはシフトのほうだろうけど。

ちなみにPPC970は4issueパイプラインだが、フェッチ帯域は4byte×4の倍の、32byte。
その意味、4命令を取り込むのすら十分な幅がないMeromの16バイトっていろんな意味で異常。
消費電力を抑えるためにわざとリミッタ掛けたのかな?
Intelの次世代CPUについて語ろう 28
408 :・∀・)っ-○◎●[sage]:2007/04/19(木) 23:43:11 ID:6E1sFwXl
はいはい妄想乙
Intelの次世代CPUについて語ろう 28
410 :・∀・)っ-○◎●[sage]:2007/04/19(木) 23:51:46 ID:6E1sFwXl
しかしoooはマジでヴァカだな


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。