トップページ
>
プログラム
>
2016年02月05日
>
bTIbnCX4
書き込み順位&時間帯一覧
7 位
/199 ID中
時間
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Total
書き込み数
0
0
0
0
0
0
0
0
1
0
0
0
1
1
0
0
1
0
0
0
0
0
0
0
4
使用した名前一覧
書き込んだスレッド一覧
デフォルトの名無しさん
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
書き込みレス一覧
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
346 :
デフォルトの名無しさん
[]:2016/02/05(金) 08:45:35.15 ID:bTIbnCX4
いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
348 :
デフォルトの名無しさん
[]:2016/02/05(金) 12:16:48.26 ID:bTIbnCX4
http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発
http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg
Eyerissは、グラフィックス処理プロセッサー(GPU)と同様、SIMD(single instruction multiple data)などから成る
プロセッサー・エレメント(PE)を多数集積したICである。
ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。
また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。
加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。
作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
350 :
デフォルトの名無しさん
[]:2016/02/05(金) 13:02:33.01 ID:bTIbnCX4
また病気か
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
356 :
デフォルトの名無しさん
[]:2016/02/05(金) 16:48:34.33 ID:bTIbnCX4
ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html
※このページは、
『2ちゃんねる』
の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合は
メール
をしてください。対応します。