- Intel派がAMDの次世代CPUを語るスレ 1
878 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 00:33:48.58 ID:IjG782mV - >>877
Sandy BridgeのAVXは最初から256ビットのSIMDユニットを搭載している。 あとはユニットそのものを増やすとかFMA化くらいしかないと思うが。 実装が命令に追いついてないのってLSUと除算ユニットくらいじゃね? Intelは今回は最初からソフト開発者に飴を与えることにしたんだよ。 理由は簡単。スループット改善が伴わない256ビット命令を用意したところで 移行が進まないのが目に見えてるから。 IntelはSSEのときは64ビットのFP SIMD命令を用意しなかったので移行がスムーズにいった。 逆にPentium 4におけるSSE2のSIMD整数命令の実装はMMXの64ビットを2回分実行するだけで 旨みが無かったため、ソフトの移行があまり進まなかった。 (Pentium MにいたってはMMXのほうが速い始末)
| - Intel派がAMDの次世代CPUを語るスレ 1
879 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 00:51:23.38 ID:IjG782mV - って言ってしまうと256ビット化されてない整数ではAVXの意味がないように思えてしまうだろうが
3オペランド化によるMOVオペレーションの削減って十分な旨みだぜ
| - Intelの次世代CPUについて語ろう 45
514 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 03:31:16.59 ID:IjG782mV - >>488
100人じゃなくて100社だろ個人に届くわけねーだろ 零細なめんな
| - AMDの次世代CPUについて語ろう 第68世代
70 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 03:33:09.88 ID:IjG782mV - >>64
「32ビット専用」なら可能性は否定できない。 64ビットサポートはSSSE3とsysenter/sysexitが問題だな。
| - CPUアーキテクチャについて語れ 18
869 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 03:56:47.17 ID:IjG782mV - YOU落ち着きなよ
チョコレートもコーヒーもビター・ブラックが最高さ 現代日本の鐚は一円玉さ 文は昔の通貨さ 江戸時代で言うと寛永通宝さ 今日も決め手のZENIが飛ぶZE!
| - AMDの次世代CPUについて語ろう 第68世代
72 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 04:14:10.03 ID:IjG782mV - 不名誉の「トリプルコア」を量産しなくていい程度にプロセスルールが枯れてる45nmは
AMDとしてもしばらくは継続すると思うけどな。GFだって45nmのFabを32nmに即座に 転換できるならまだしも当分残すんだろ? 一昨年末に32nmを立ち上げ22nm移行も見えてきたIntelだって、 低価格向けに45nmのCPUは未だに供給してるんだし。
| - CPUアーキテクチャについて語れ 18
871 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 04:18:11.44 ID:IjG782mV - CellのPPEの部分に関してはソニーはIBMがどことライセンスしようが
関与できない契約になってたんじゃね? もちろん、作ってくれと依頼したのはソニーだろうが。
| - CPUアーキテクチャについて語れ 18
872 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 04:26:39.78 ID:IjG782mV - IBMに頼むとして現実問題PPE派生アーキテクチャ以外の選択肢は無いんじゃねーの?
Wii上位互換だとすればVMXとは別にGekko/Broadway互換の64ビットSIMD命令も載るんだろうな。 あとはVSXとかw
| - AMDの次世代CPUについて語ろう 第68世代
73 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 04:57:19.55 ID:IjG782mV - おっと、メーカーに大好評で32nmだけでは生産量不足になる前提が必要か。
それこそ出来次第だな
| - Intel派がAMDの次世代CPUを語るスレ 1
881 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 17:06:50.06 ID:IjG782mV - 逆にいまのOpteronの売上げってItaniumより少なかったのかwwwwww
つーか、安藤さんはCPU作ってた人だからそういう視点になっても仕方ないが 別に中身がItaniumってことを意識して最適化コードを書いてるプログラマは多くないと思うよ。 それこそHP-UXだったりACOS向けに高級言語で書いてるのであって。
| - CPUアーキテクチャについて語れ 18
876 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 17:20:47.35 ID:IjG782mV - 32nmプロセスならPPEの3〜4コアでもコスト・消費電力ともにそれなりに小さい筐体に
収まる程度にはなるのでは? 任天堂はそれこそ「枯れた技術の水平思考」だからHD機を1から作るよりは 既存のCPUを流用したほうがマシだと考えるのは当然でしょう。 さて、問題はアウトオブオーダ実行で3+1命令同時発行のG3派生プロセッサの性能を PPE派生で超えられるかという問題ですな。 案外Broadwayをそのまんま混載してWii互換を実現するのかもしれないけどw
| - Intel派がAMDの次世代CPUを語るスレ 1
885 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 17:26:56.83 ID:IjG782mV - そそ、せいぜいバイトオーダの違いくらいだな。Itaniumはバイエンディアンだからどっちでもいけるが
大きい会社だとそういうのも社内ミドルウェアで違いを吸収するようにしてるのが普通。
| - Intel派がAMDの次世代CPUを語るスレ 1
888 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 17:57:09.64 ID:IjG782mV - まあそうだけどさ。
コンソーシアムから企業が続々撤退してるからIntelとて事業継続するのは厳しい。 今後はパイは広がらないどころか小さくなるから新規にやろうという企業は皆無だろうが 今までやってきた大手ベンダー系ソフトハウス屋が急に撤退するなんてことも現実にはない。 (WindowsやRHELがなくなるからオープン屋はまず手を出さなくなるだろうが)
| - Intel派がAMDの次世代CPUを語るスレ 1
889 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 18:02:43.52 ID:IjG782mV - > んな互換性楽勝ならx86がここまで市場支配してないぞ。
これはむしろ逆だな。コードの互換性が問題になるならそもそもx86はRISCサーバ&WS市場を奪えてないわけで。 x86がサーバ市場を支配できたのはPCベースのオープンハード仕様による価格の安さだよ。 そしてItaniumも高度なRAS機能を持ちながらハイエンドRISCベースのシステムより一桁は安い。
| - Intel派がAMDの次世代CPUを語るスレ 1
893 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 18:19:22.62 ID:IjG782mV - >>891
え?ARMには64ビットプロセッサあったっけ? ARMの省電力の拠り所はメモリやI/Oの帯域をケチってることにある。 PCに匹敵する性能を出そうと思えばその時点でご自慢の電力効率は破綻する。 だからARMはキャッシュ内に収まるベンチマークでは強いがメモリアクセスが多いベンチマークでは パフォーマンスが劇的に落ちる。 ついでに言うとARMにはオープンな共通ハード規格なんてないよ。 だからベンダー独自の機能をつけてぼったくりやすい。 そしてiPadみたいな原価の数倍の価格付けて売るハードが蔓延する。 今のところサーバ向けのARMは売り込みに失敗している。根本的に性能不足だからな。 ARMは64ビット化の計画すらまだ具体化してないし他を揺るがすだけの影響力も無いだろう。 x86の命令フォーマットは64ビットにおいてはRISCよりコード密度および性能で他のRISCと比べても圧倒的に有利だ。 なぜなら32ビットや64ビットの即値をコード上にそのままとれるから。 16ビットないし32ビット固定の語長じゃこうはできない。 ARMもコード効率を上げるには可変長方式をとる必要があるだろうが、デコーダがシンプルにできる だのの世迷言は捨て去る必要が出来る(Thumb2とか採用した時点で既に可変長なんだが)
| - AMDの次世代CPUについて語ろう 第68世代
130 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 18:26:37.93 ID:IjG782mV - > ハイエンドの最上位は16コアのInterlagosが抑えるけどね
デュアルダイ(笑)で16コアならSandy Bridge以降はDP向けでも投入可能になると思うよ。 QPI配線引っ張るだけですむし。 実際に出すかどうかは別として元々MCMの技術はIntelのほうが枯れてるから AMDにアドバンテージなんて無い。生かさず殺さずで放置してるだけ。 巨大ダイを2枚も使って作る分、生産ユニット数は半減するだろ? その分AMDはシェアが上がらないってことを意味する。
| - Intel派がAMDの次世代CPUを語るスレ 1
895 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 18:38:12.41 ID:IjG782mV - > Atomのメインターゲットってサーバなのか
ARMがx86市場を食おうとしてるのはまず省電力サーバからなんだが。 ウェハ単価が高騰を続けてるので薄利多売で維持するのは厳しいから 高単価で売れる市場を探してるんだよ。 で、それを迎え撃つ弾はAtomが適任と。MSも待望している。 Atomは当初は高密度サーバ向けのメニーコアプロセッサとして開発されてるから、 サーバ向けがターゲットになるのは当然の流れだと思うけどね。 Intelは今更ARMを自力開発するくらいならMarvellからXScale買い戻す、というより 会社ごと買うと思うけどな。 そもそもIntelの市場拡大路線は高騰するプロセス開発費の捻出を独力で維持するためってのが 根底にあるのでそれさえ達成できれば別にx86にこだわる必要はない。 独占的な契約を結んでFab屋をはじめるのも手だ。
| - AMDの次世代CPUについて語ろう 第68世代
134 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 18:41:01.81 ID:IjG782mV - > SandyのAVXに整数入ってないからh264はどうやっても対応できなくね?
は?
| - AMDの次世代CPUについて語ろう 第68世代
143 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:05:28.41 ID:IjG782mV - >>137
SIMD整数で使えるユニットは256ビット化されてはいないがNehalemよりある程度強化はされてる。 ただしそれはSSEからでも使えるのでAVXを使ってもそれほどアドバンテージが無いだけ。 3オペランドになる分は若干性能面で有利。 Sandy Bridgeが不利、という意味ではない Bulldozerはシフト演算器が2個から1個に劣化したり、FSTOREとMMX-ALUがポート共用に なったりどこそこK10より劣化してる部分もあるからそれこそSIMD整数演算性能は 手放しで期待はできない。 1コア当たりの話じゃないよ、モジュール当たりの話だ。 つーか、XOPのビットローテートとかIMACとかx264の具体的にどの場所で使えるんだい? >>140 いやh264は基本FP使うとこないからw ビット論理演算ならPort5は256ビット化されてるけどx264ってビット論理だけ 繰り返すところなんて無いような・・・
| - AMDの次世代CPUについて語ろう 第68世代
144 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:07:03.36 ID:IjG782mV - >>142
強化ならFSTOとMAL1をポート共有にしないだろう。
| - AMDの次世代CPUについて語ろう 第68世代
146 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:10:52.80 ID:IjG782mV - ついでにL1Dを16KBに削ったりもしない。
| - AMDの次世代CPUについて語ろう 第68世代
148 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:17:10.24 ID:IjG782mV - h264の模範的な(マシン固有の最適化されてない)Cソースを見てみようか。
http://cekirdek.pardus.org.tr/~ismail/ffmpeg-docs/h264_8c-source.html ご覧の通り加減算と固定量のビットシフトの塊ですよ。 XOPで追加された命令なんてどこで使えるの?教えてエロイ人。
| - AMDの次世代CPUについて語ろう 第68世代
150 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:20:42.62 ID:IjG782mV - Bulldozerは小出しじゃなくて最適化マニュアルが出たことで明らかなボトルネックが露呈したんだが。
| - AMDの次世代CPUについて語ろう 第68世代
153 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:31:07.83 ID:IjG782mV - h264のエンコーディングはご覧の通り足し算と引き算の塊なので、Bulldozerの
SIMDユニットではPort 2のMAL0, Port3のMAL1が良く使われる しかしロード・ストア命令にもPort2とPort3を使う。明らかにここがボトルネックだな。 x264向けには【デチューン】されたとしか思えない構造な。 XOPを使うことで出来る最適化って、せいぜいPort0のIMACを A * (±1) + B として使って 加減算を実現するくらいだよ。 (ただし通常の加減算命令よりレイテンシが大きくなるので場所によってはかえって性能落ちるかも)
| - CPUアーキテクチャについて語れ 18
880 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:37:18.71 ID:IjG782mV - BroadwayとPPEってPentium IIIとAtomみたいな関係だよね。
Atomのほうが高クロックで動き、足回りはリッチでSIMD性能はあるが アウトオブオーダ実行のPentium IIIを完全に上回れるかというとやや不安だよね。 分岐予測も弱いし。 今回は90nmプロセスから32nmあるいはそれ以降になるわけで、クロックを上げるよりは 最深30段くらいあるパイプラインステージ数を半分くらいにして分岐予測を強化するとか できそうだし、そっちのほうが性能が上がりそうな気はするね。
| - AMDの次世代CPUについて語ろう 第68世代
158 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 19:58:54.36 ID:IjG782mV - XOPがx264に使えるなんて情弱の世迷言にすぎないからな。
| - AMDの次世代CPUについて語ろう 第68世代
161 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 20:01:21.23 ID:IjG782mV - 馬鹿め漢字マニアの俺が鐚を知らないわけがないだろう。
コーヒーはブラック無糖だ。
| - AMDの次世代CPUについて語ろう 第68世代
163 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 20:06:47.91 ID:IjG782mV - 強いて言えば4オペランドの意味がほとんどないからコードサイズが小さくなる
3オペランド方式に変更にしたらしいな。 たとえばAMD最適化マニュアルのコードサンプルでFMA4使ってるコードいくつかあるけどさ それ全部FMA3に置き換え可能なんだわ。その程度に4オペランドのメリットが小さい。
| - AMDの次世代CPUについて語ろう 第68世代
165 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 20:16:47.19 ID:IjG782mV - と、アスペ情弱が発狂しております
| - AMDの次世代CPUについて語ろう 第68世代
167 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 20:29:41.33 ID:IjG782mV - sourceとdestが分かれていようが同じレジスタ指定するケースが大半なのに受け皿もクソもねえ
| - AMDの次世代CPUについて語ろう 第68世代
175 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 20:44:18.07 ID:IjG782mV - >>174
いつもの敗北のビター汁を舐めろよ。
| - AMDの次世代CPUについて語ろう 第68世代
178 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 20:56:01.71 ID:IjG782mV - pmaddubswでGREPかけたら57件もヒットしたズラ。
しかし惜しいな、pmaddubsw + paddwに相当する融合演算命令さえあれば有効に使えたのに
| - AMDの次世代CPUについて語ろう 第68世代
181 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 21:04:11.23 ID:IjG782mV - >>177
ま、AVXに整数が入ってないなんて珍説いう奴が今更何を言っても無駄だけど
| - AMDの次世代CPUについて語ろう 第68世代
190 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 21:22:58.72 ID:IjG782mV - >>186
3オペランドになっただけでもものによっては恩恵があるけど。 x264でのBulldozerの最大の弱点はむしろSIMD整数加減算のレイテンシが依然2ってことだな。 この点はK10から改善されてない。Intelは1だからコア当たりの性能でAMDを圧倒してる。 2スレッド実行でレイテンシはある程度埋まるだろうが2コア分の性能になるというわけではない。 XOPが使えようが使えまいが弱点は埋まらん。
| - AMDの次世代CPUについて語ろう 第68世代
197 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 22:24:29.80 ID:IjG782mV - ダイサイズはSandy Bridgeより大きいのに2スレッド合計で最大5〜6issueならともかく
4issue(=Sandy Bridgeと同じ)じゃ浮かばれないけどな
| - AMDの次世代CPUについて語ろう 第68世代
200 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 22:31:40.72 ID:IjG782mV - 意訳:しんじゃうからいじめないで
| - AMDの次世代CPUについて語ろう 第68世代
205 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 22:37:37.26 ID:IjG782mV - > 今ふと思ったけど、AVX以降で4オペランドFMAが無いってコトは、
> AMDのFMA4とAVXのFMAは共存できるってことだよな 次のバージョンでIntelのFMA互換にすることはAMDも明言してるし そうなった場合はFMA4はソフト開発者には殆ど使われなくなるけどな だって(Intelとの互換性をなくしてまで)4オペランドにする意味が殆どないから。
| - AMDの次世代CPUについて語ろう 第68世代
218 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 23:13:05.11 ID:IjG782mV - >>214
AVXにすら対応してないLlanoからTrinityに無償で交換するくらいのパフォーマンスをやらないと無理だろう。
| - AMDの次世代CPUについて語ろう 第68世代
230 :,,・´∀`・,,)っ-○○○[sage]:2011/04/16(土) 23:55:16.44 ID:IjG782mV - Intelより数百多く命令を搭載しておいて新命令に頼らないなんていえたら大したもんだよ
|
|