トップページ > 自作PC > 2009年12月20日 > Zm+GEAOX

書き込み順位&時間帯一覧

18 位/3158 ID中時間01234567891011121314151617181920212223Total
書き込み数00101000000100521000003317



使用した名前一覧書き込んだスレッド一覧
,,・´∀`・,,)っ-○○○
Intelの次世代CPUについて語ろう 41
AMDの次世代CPUについて語ろう 第31世代
Core i7 が Atom に駆逐された件

書き込みレス一覧

Intelの次世代CPUについて語ろう 41
878 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 02:34:20 ID:Zm+GEAOX
GPU側のほうこそ
Intelの次世代CPUについて語ろう 41
881 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 04:46:29 ID:Zm+GEAOX
AVX以外はNehalemそのものの正統進化だよ
Intelの次世代CPUについて語ろう 41
884 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 11:48:34 ID:Zm+GEAOX
>>883
出落ちパネェ
Intelの次世代CPUについて語ろう 41
885 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:17:03 ID:Zm+GEAOX
>>871
ソフトが出てくるかはさておき、Larrabee統合プロセッサを出す最初で最後の機会は
後にも先にもHaswellじゃねーのかな。
3世代目から市場投入と言ってるから45nmが1世代として丁度22nmだし
Sandy BridgeでのGMA統合(L3フルアクセス)はその布石でしょ。

というか、ソフト側が対応しないとリソースを持て余すって意味ではAMDも同じなので
泣いてもらう方向で。
方向としてはみんな同じじゃね?
この程度の並列度すら使いこなせないならGPGPUなんかもっと無理だし。
AMDの次世代CPUについて語ろう 第31世代
407 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:26:06 ID:Zm+GEAOX
>>341
これは流石に・・・
つーか、__intel_fast_memcpyのコードのスループットはガチ

>>352
ストリング命令は流石に今時使わないでしょ。
AMDの次世代CPUについて語ろう 第31世代
409 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:36:02 ID:Zm+GEAOX
ICCってそんなに速くないよ。SIMD周りだけは速いケースが多いけど。
AMDの次世代CPUについて語ろう 第31世代
411 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:41:15 ID:Zm+GEAOX
Bulldozerに関してはAMD独自命令使わないと半分程度しか性能発揮できないような設計になってるから
そういう意味で言いがかりは通用しない


AMDの次世代CPUについて語ろう 第31世代
413 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:53:22 ID:Zm+GEAOX
読む価値無し
AMDの次世代CPUについて語ろう 第31世代
421 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 15:34:59 ID:Zm+GEAOX
>>415
確かにIntelコンパイラの吐くコードだとAVX使うとかえって性能落ちそうな箇所があるよ。

俺の予想だとvbroadcasts{s,d} は鬼門
Intelの場合ロードユニットに128ビットまでのブロードキャスト機能が組み込まれてるので
128ビットだけならシャッフルユニットを使わずにブロードキャストできる。
256ビットのロードはvinsertf128相当のμOPでおk。

[A]
↓Load (with Broadcast)
[A A A A]
↓Permute 256
[A A A A A A A A]

このへんは謹製シミュレータで確認した。 


しかしBulldozerはバックエンドは旧Bulldozerとほとんど変わってない(内部128ビットのまんま)
バックエンドがAVXに最適化されてないとすると
スカラ値をロードしてシャッフルユニットで各要素にコピー、
さらにそれをYMM上位にコピーで、合計3マイクロオペレーション。

A
↓Load scalar
[A * * *]
↓Permute 128
[A A A A]
↓Move (to YMM upper)
[A A A A][A A A A]

というわけで256ビット単位で処理すると単純に128ビットの2倍+αのスループットサイクルを要する。
Intelの次世代CPUについて語ろう 41
888 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 15:46:23 ID:Zm+GEAOX
GMAのシェーダユニットはSandy Bridge世代でも12〜16SP程度。
GeForce 9400Mに勝てるかどうかのレベルなのでGPGPU以前の問題。
というかCPU 1コアの方が速い。

Sandy Bridge世代でとるべきパフォーマンス戦略は、頂点シェーディングをGMAにやらせないことだ。
ドライバレベルで仮想化すればどっちで動いてるかはアプリからは区別する必要はない。






関係ないけどライトニングさんはエロい
AMDの次世代CPUについて語ろう 第31世代
424 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 16:08:59 ID:Zm+GEAOX
Pentium Mすら認識しなかったのにぶち切れて、スタートアップルーチンとか完全に自分で書いてたが
他のコンパイラの質がよくなったのでICC自体使わなくなった


AMDの次世代CPUについて語ろう 第31世代
434 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 22:21:21 ID:Zm+GEAOX
>>432
それこそAMD XOP非対応だぞ、と。
Intelの次世代CPUについて語ろう 41
890 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 22:29:23 ID:Zm+GEAOX
6コア12スレッドのSandybridgeを買えば良いじゃん。
DDR3 3ch欲しいだろ?
Intelの次世代CPUについて語ろう 41
891 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 22:56:45 ID:Zm+GEAOX
>Larrabee失敗の主要因がドライバの糞さなんだが、

何故そういえる?
ソフトがどれだけ頑張ろうがハードウェアの特性は変わらん。
ヘンにプログラマブルにするより固定機能積んだ方が速いという従来GPUのパラダイムが
覆らなかったが故のこと。
Intelの次世代CPUについて語ろう 41
893 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 23:04:58 ID:Zm+GEAOX
汎用スループットコンピューティングがやりたい人は別にゲームがやりたいわけじゃない。
Intelの次世代CPUについて語ろう 41
896 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 23:40:57 ID:Zm+GEAOX
ほぼEpic Games
Core i7 が Atom に駆逐された件
827 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 23:43:31 ID:Zm+GEAOX
Northwoodとほぼ同一設計のXeon(Prestonia)がHT対応


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。