必死チェッカーもどきプログラム > 2016年02月05日

トップページ > プログラム > 2016年02月05日 > bTIbnCX4

書き込み順位＆時間帯一覧

7 位/199 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
7 位/199 ID中	書き込み数	0	0	0	0	0	0	0	0	1	0	0	0	1	1	0	0	1	0	0	0	0	0	0	0	4

使用した名前一覧	書き込んだスレッド一覧
デフォルトの名無しさん	【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

書き込みレス一覧

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
346 ：デフォルトの名無しさん[]：2016/02/05(金) 08:45:35.15 ID:bTIbnCX4: いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
348 ：デフォルトの名無しさん[]：2016/02/05(金) 12:16:48.26 ID:bTIbnCX4: http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
356 ：デフォルトの名無しさん[]：2016/02/05(金) 16:48:34.33 ID:bTIbnCX4: ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。