- Intelの次世代CPUについて語ろう 41
878 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 02:34:20 ID:Zm+GEAOX - GPU側のほうこそ
| - Intelの次世代CPUについて語ろう 41
881 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 04:46:29 ID:Zm+GEAOX - AVX以外はNehalemそのものの正統進化だよ
| - Intelの次世代CPUについて語ろう 41
884 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 11:48:34 ID:Zm+GEAOX - >>883
出落ちパネェ
| - Intelの次世代CPUについて語ろう 41
885 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:17:03 ID:Zm+GEAOX - >>871
ソフトが出てくるかはさておき、Larrabee統合プロセッサを出す最初で最後の機会は 後にも先にもHaswellじゃねーのかな。 3世代目から市場投入と言ってるから45nmが1世代として丁度22nmだし Sandy BridgeでのGMA統合(L3フルアクセス)はその布石でしょ。 というか、ソフト側が対応しないとリソースを持て余すって意味ではAMDも同じなので 泣いてもらう方向で。 方向としてはみんな同じじゃね? この程度の並列度すら使いこなせないならGPGPUなんかもっと無理だし。
| - AMDの次世代CPUについて語ろう 第31世代
407 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:26:06 ID:Zm+GEAOX - >>341
これは流石に・・・ つーか、__intel_fast_memcpyのコードのスループットはガチ >>352 ストリング命令は流石に今時使わないでしょ。
| - AMDの次世代CPUについて語ろう 第31世代
409 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:36:02 ID:Zm+GEAOX - ICCってそんなに速くないよ。SIMD周りだけは速いケースが多いけど。
| - AMDの次世代CPUについて語ろう 第31世代
411 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:41:15 ID:Zm+GEAOX - Bulldozerに関してはAMD独自命令使わないと半分程度しか性能発揮できないような設計になってるから
そういう意味で言いがかりは通用しない
| - AMDの次世代CPUについて語ろう 第31世代
413 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 14:53:22 ID:Zm+GEAOX - 読む価値無し
| - AMDの次世代CPUについて語ろう 第31世代
421 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 15:34:59 ID:Zm+GEAOX - >>415
確かにIntelコンパイラの吐くコードだとAVX使うとかえって性能落ちそうな箇所があるよ。 俺の予想だとvbroadcasts{s,d} は鬼門 Intelの場合ロードユニットに128ビットまでのブロードキャスト機能が組み込まれてるので 128ビットだけならシャッフルユニットを使わずにブロードキャストできる。 256ビットのロードはvinsertf128相当のμOPでおk。 [A] ↓Load (with Broadcast) [A A A A] ↓Permute 256 [A A A A A A A A] このへんは謹製シミュレータで確認した。 しかしBulldozerはバックエンドは旧Bulldozerとほとんど変わってない(内部128ビットのまんま) バックエンドがAVXに最適化されてないとすると スカラ値をロードしてシャッフルユニットで各要素にコピー、 さらにそれをYMM上位にコピーで、合計3マイクロオペレーション。 A ↓Load scalar [A * * *] ↓Permute 128 [A A A A] ↓Move (to YMM upper) [A A A A][A A A A] というわけで256ビット単位で処理すると単純に128ビットの2倍+αのスループットサイクルを要する。
| - Intelの次世代CPUについて語ろう 41
888 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 15:46:23 ID:Zm+GEAOX - GMAのシェーダユニットはSandy Bridge世代でも12〜16SP程度。
GeForce 9400Mに勝てるかどうかのレベルなのでGPGPU以前の問題。 というかCPU 1コアの方が速い。 Sandy Bridge世代でとるべきパフォーマンス戦略は、頂点シェーディングをGMAにやらせないことだ。 ドライバレベルで仮想化すればどっちで動いてるかはアプリからは区別する必要はない。 関係ないけどライトニングさんはエロい
| - AMDの次世代CPUについて語ろう 第31世代
424 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 16:08:59 ID:Zm+GEAOX - Pentium Mすら認識しなかったのにぶち切れて、スタートアップルーチンとか完全に自分で書いてたが
他のコンパイラの質がよくなったのでICC自体使わなくなった
| - AMDの次世代CPUについて語ろう 第31世代
434 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 22:21:21 ID:Zm+GEAOX - >>432
それこそAMD XOP非対応だぞ、と。
| - Intelの次世代CPUについて語ろう 41
890 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 22:29:23 ID:Zm+GEAOX - 6コア12スレッドのSandybridgeを買えば良いじゃん。
DDR3 3ch欲しいだろ?
| - Intelの次世代CPUについて語ろう 41
891 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 22:56:45 ID:Zm+GEAOX - >Larrabee失敗の主要因がドライバの糞さなんだが、
何故そういえる? ソフトがどれだけ頑張ろうがハードウェアの特性は変わらん。 ヘンにプログラマブルにするより固定機能積んだ方が速いという従来GPUのパラダイムが 覆らなかったが故のこと。
| - Intelの次世代CPUについて語ろう 41
893 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 23:04:58 ID:Zm+GEAOX - 汎用スループットコンピューティングがやりたい人は別にゲームがやりたいわけじゃない。
| - Intelの次世代CPUについて語ろう 41
896 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 23:40:57 ID:Zm+GEAOX - ほぼEpic Games
| - Core i7 が Atom に駆逐された件
827 :,,・´∀`・,,)っ-○○○[sage]:2009/12/20(日) 23:43:31 ID:Zm+GEAOX - Northwoodとほぼ同一設計のXeon(Prestonia)がHT対応
|
|