- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
689 :Socket774[sage]:2007/11/17(土) 00:34:46 ID:wzfL3xOA - R600は、32bit長のALU5つだっけ。
R600ってよくよく考えると、VLIWとスーパースカラの混載なのよね。 コンパイラとコマンドプロセッサ、分岐実行ユニット。 何かこれだけ見てるとCPUだよね。
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
728 :Socket774[sage]:2007/11/17(土) 18:31:31 ID:wzfL3xOA - >>716
R700以降の事は、R600のアーキに関係なくnVIDIAのGPUでも可能な事。 R600がG80と一線を科すのは、よりCPUライクなGPGPUを筆頭念頭においたアーキテクチャ。 >>704が言う様にコマンドプロセッサを完全な汎用CPUと置き換えた場合、 コマンドプロセッサの仕事と一方向だったGPUの処理に逐次性を持たせる事ができる。 ストリーム処理による一括処理と個別処理による汎用性を手に入れる事になる。 ・・でもさ、GPUがCPUを目指してどうするの? CPUをサポートできるとしても、CPUライクを目指した結果、 中途半端なグラフィック性能を纏う事になれば本末転倒にしかならない。 今現状のCPUコアの多コア化に伴うヘテロジニアスコア化は、本来ある汎用コアの性能が頭打ちになっている為。 ミドル等ハイ以外のGPUはGPGPUアーキでもいいが(統合されるのはミドル以下だろうし) ハイエンドはハイエンドで、グラフィック処理(ストリーム処理)にのみ特化した別仕様にすべきではない? まぁシェーダが進化すれば自然と演算性能は上がるけど。
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
732 :Socket774[sage]:2007/11/17(土) 19:12:32 ID:wzfL3xOA - >>730
>より効率的にGPUを使う為の仕組みだと思うけどね。 演算性能をグラフィック以外にでしょ。
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
735 :Socket774[sage]:2007/11/17(土) 19:39:27 ID:wzfL3xOA - そこをGPUの管理も出来るCPUコアに置き換え、システムも変えれば問題ないんでない。
CPUコアでCPの代わりが出来ない事はないだろうし。 シェーダで全部やろうとしないで、CPをCPUコアに置き換えて 載せたCPUコアに粒度の小さいものを、粒度の大きい並列性の高いものをシェーダで。 シェーダの粒度を小さくしていったら、膨大な数の演算器が必要になるし。
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
742 :Socket774[sage]:2007/11/17(土) 20:27:26 ID:wzfL3xOA - そうすると、アレイの分割を細かくしなかったのは
プロセスの進行具合とダイサイズとの折り合いで、今は16*4構成になったのか。 全ては、プロセスの進行具合とダイサイズとの折り合いなのか。 DX10.1でがシェーダによるAAなどが掛けられる様になるんでしょ。 まぁ今のモーメントには合致していない構成だがな。
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
751 :Socket774[sage]:2007/11/17(土) 20:56:48 ID:wzfL3xOA - なら、ゲームにおけるR6xxシリーズのG8xシリーズより低い数値は、TMUの張り付けが弱いから?
そのTMUを抜かして考えた場合、R6xxのアーキテクチャは優秀と言えるのか?
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
755 :Socket774[sage]:2007/11/17(土) 21:12:39 ID:wzfL3xOA - >>754
いつも思うんだが、何故nVIDIAのユニットは一基当たりの性能が、ATIより低いわけ? 一基当たりの効率をATI並に出来ないものかね
|
- NVIDIA厨 vs AMDATi厨 と永遠のS3厨 Part 46
763 :Socket774[sage]:2007/11/17(土) 21:46:11 ID:wzfL3xOA - DX10.1ならあながちシェーダの時代ってのも間違いじゃないと思う、ただ出てもいないものに焦点を当てすぎた。
またプロセスもHigh-kとメタルゲートでようやく45nmの目処が立ったくらいだから、 これからは本当に闇雲にトランジスタは増やせない。 一基当たりの効率化が求められてくる。 なのにnVIDIAは各ユニットにしてもATIより効率は低く、数は多い。 nVIDIAは今後考えるならばATI並に効率化していくべきなのでは?
|