トップページ > 自作PC > 2009年04月07日 > 7hcJ9sUc

書き込み順位&時間帯一覧

30 位/2931 ID中時間01234567891011121314151617181920212223Total
書き込み数00000000200000000450200013



使用した名前一覧書き込んだスレッド一覧
Socket774
Intel Larrabee 2コア

書き込みレス一覧

Intel Larrabee 2コア
145 :Socket774[sage]:2009/04/07(火) 08:08:01 ID:7hcJ9sUc
ネハレンとララビのキャッシュ構造って似てるよね、なんとなく
ネハレンのSMT数を4スレッド&LRBni追加して、
ネハレン1コア4GHz+ララビ15コア2GHz+4MBL3の論理コア64個のCPUとかできんもんかね
Intel Larrabee 2コア
147 :Socket774[sage]:2009/04/07(火) 08:31:44 ID:7hcJ9sUc
DirectXのレンダリングパイプラインが既存の3D描画に依存しすぎ
バージョンうpでむしろAPIの自由度をゴソっと「下げないと」いかん時が来てる
Intel Larrabee 2コア
155 :Socket774[sage]:2009/04/07(火) 17:16:00 ID:7hcJ9sUc
>>148-149
タイルレンダは、ZバッファのRWを完全にオンチップキャッシュで行える → 帯域ケチれる
さらに、半透明ポリを除き事前にZバッファ処理してテクセル参照を画面1ピクセルにつき1回に限定 → 帯域ケチれる

これを64*64タイル程度の適切な単位で実現するには、ある程度のオンチップキャッシュの大きさが必要になってくる
Intel Larrabee 2コア
158 :Socket774[sage]:2009/04/07(火) 17:41:04 ID:7hcJ9sUc
>BGRA情報およびZ-Buffer情報は頻繁に読み込み-比較-書き出しが行われる
これを完全にオンチップキャッシュで処理し、1/60秒に1回だけ最終表示結果をVRAMに書き出すのがタイルレンダ
既存のGPUはキャッシュ持ってるとは言え、1ポリ描画毎にVRAMにフラッシュせにゃいかんようなもん
Intel Larrabee 2コア
160 :Socket774[sage]:2009/04/07(火) 17:51:01 ID:7hcJ9sUc
>>159
いやいや…タイルレンダでは各タイルの処理は「独立」してるんだよ?
処理の終わったタイルは次の処理タイルに入れ替えれば良いだけ、1タイルに1コア割り当てとか笑止
Intel Larrabee 2コア
163 :Socket774[sage]:2009/04/07(火) 17:57:02 ID:7hcJ9sUc
いや…あの…ドリキャスのメモリ構造って知ってます?w タイルレンダの概念わかります?
Intel Larrabee 2コア
168 :Socket774[sage]:2009/04/07(火) 18:06:18 ID:7hcJ9sUc
>キャッシュに乗り切らない部分はメモリと入れ替えが発生する
タイルレンダの場合、キャッシュに乗り切らない(=量が可変な)主なデータは頂点データとなる
テクセル参照は、64*64タイルなら必ず固定で4096回だけ発生する (半透明除き)
Intel Larrabee 2コア
170 :Socket774[sage]:2009/04/07(火) 18:10:44 ID:7hcJ9sUc
>>166
Zソート? Zバッファを先に全ポリで更新して、1ピクセルと1回のテクセル参照を対応付けてるんだけど
Intel Larrabee 2コア
171 :Socket774[sage]:2009/04/07(火) 18:12:58 ID:7hcJ9sUc
>>169
別に厄介じゃないと思うけど…次に必要なポリの頂点データはわかってるんだから順次プリフェッチするだけ
Intel Larrabee 2コア
173 :Socket774[sage]:2009/04/07(火) 18:22:24 ID:7hcJ9sUc
「Zバッファは同じアドレスを頻繁に更新するので全部キャッシュしておきましょう」
「同じフレームバッファ上のピクセルを何度も塗るのは無駄なので、1回だけ必要な色を塗るように工夫しましょう」
それを適切なトランジスタ数で実現するのがタイルレンダってだけの話

まぁ確かに頂点データの参照は冗長になるね、でもピクセル処理の冗長さとどっちが良いかね
Intel Larrabee 2コア
175 :Socket774[sage]:2009/04/07(火) 18:44:13 ID:7hcJ9sUc
???Zバッファなのになんで交差するポリゴンの前後関係なんて話が出てくるん?
分割レンダ&Deferred Renderingの省メモリ版ってだけの話なのに
Intel Larrabee 2コア
179 :Socket774[sage]:2009/04/07(火) 20:43:54 ID:7hcJ9sUc
>テクスチャユニットに負荷がかかるとリングバスがパンク
もしテクスチャユニットの処理で詰まってるだけってなら、
コア空けてテクスチャユニットをエミュレートしてやりゃ良いよね
ほんとにリングバスがパンクってんならどうしよもないけどさ
Intel Larrabee 2コア
180 :Socket774[sage]:2009/04/07(火) 20:49:14 ID:7hcJ9sUc
しかし半透明とAAをどうすんのかって課題はどうしても残るんだよなー
4xSSAAとかなら、全描画を(0,0)・(0,0.5)・(0.5,0)・(0.5,0.5)ずらして4回描いて平均取るとかでいけんもんかね


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。