トップページ > プログラム > 2016年02月05日 > bTIbnCX4

書き込み順位&時間帯一覧

7 位/199 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000010001100100000004



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

書き込みレス一覧

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
346 :デフォルトの名無しさん[]:2016/02/05(金) 08:45:35.15 ID:bTIbnCX4
いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
348 :デフォルトの名無しさん[]:2016/02/05(金) 12:16:48.26 ID:bTIbnCX4
http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー(GPU)と同様、SIMD(single instruction multiple data)などから成る
プロセッサー・エレメント(PE)を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

 作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
350 :デフォルトの名無しさん[]:2016/02/05(金) 13:02:33.01 ID:bTIbnCX4
また病気か
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
356 :デフォルトの名無しさん[]:2016/02/05(金) 16:48:34.33 ID:bTIbnCX4
ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。