トップページ > ソフトウェア > 2011年08月28日 > 9nceMSa20

書き込み順位&時間帯一覧

25 位/952 ID中時間01234567891011121314151617181920212223Total
書き込み数2002000000000010000000005



使用した名前一覧書き込んだスレッド一覧
◆MERIKEN4.k
◆QwF3QYjuZk
【トリップ検索】CUDA SHA-1 Tripper【GeForce】

書き込みレス一覧

【トリップ検索】CUDA SHA-1 Tripper【GeForce】
356 : ◆MERIKEN4.k [sage]:2011/08/28(日) 00:52:35.63 ID:9nceMSa20
>>353
お疲れさまです〜 こちらでも動作確認しました。ソースを見ましたけど、
SHA-1の部分を差し替えられたんですね。詳しい報告はまた後でさせて頂きます。
【トリップ検索】CUDA SHA-1 Tripper【GeForce】
357 : ◆MERIKEN4.k [sage]:2011/08/28(日) 00:57:48.07 ID:9nceMSa20
>>355
ラデのレジスタの数はブロック単位でとんでもないことになってるみたいですね。
実際1スレッドあたりどれぐらい使えるのか、非常に興味があります。
Bitslice DESの移植するときにはCUDAだとShared Memoryをつかわないと
かなり厳しいことになりそうなので…

それはそうと、さっき初めてComputer Visual Profilerの存在に気づいて
いま動かしてるんですけど、これって物凄い重いですね。結果が実にたのしみです。
【トリップ検索】CUDA SHA-1 Tripper【GeForce】
358 : ◆QwF3QYjuZk [sage]:2011/08/28(日) 03:04:19.82 ID:9nceMSa20
test
【トリップ検索】CUDA SHA-1 Tripper【GeForce】
359 : ◆MERIKEN4.k [sage]:2011/08/28(日) 03:59:02.70 ID:9nceMSa20
トリップテストを誤爆してしまった…
でもとにかくJohn the RipperのBitslice DESのコードで
10桁トリップを生成することに成功しました!
∩( ・ω・)∩ばんじゃーい

素のCでかかれてることもあって速度はCPU1スレッドで550K TPSと
まだまだですが、UCB-cryptが330K TPSだったのと比べると差は
歴然としています。Bitslice DESのことを教えていただいて
本当にありがとうございました > >>303

さて、これからJohn the Ripperのコードの余分な部分を削りまくって
綺麗なvanilla Cの実装にしてからCUDA Cに移植することにします。
途中でCPU検索に対応させるのがさきですけど…
【トリップ検索】CUDA SHA-1 Tripper【GeForce】
361 : ◆MERIKEN4.k [sage]:2011/08/28(日) 14:29:19.22 ID:9nceMSa20
>>353
私も試してみました。調べてみたら、1SMあたりのコア数は
Compute Capabilityが1.xの場合は8、2.0の場合は32、2.1の場合は48の
ようです。これに応じて-xのデフォルトの値を変えてやると
よいかもしれません。私の版では次のバージョンで対応する予定です。

【GPU】GTX 580 (OC: 860/1720/2004)
【CPU】Phenom II X6 1100T 3.30GHz
【OS】Windows XP SP3 32bit
【バージョン】CUDA SHA-1 Tripper 0.3.0
【オプション】なし
【Display Driver】270.81
【速度】
2147476 kTrips in 3.156 sec - 680.442 MTrips/sec
2147479 kTrips in 3.157 sec - 680.228 MTrips/sec
2147472 kTrips in 3.171 sec - 677.223 MTrips/sec
2147471 kTrips in 3.157 sec - 680.225 MTrips/sec
【その他】配布パッケージのtrip.txt

Device 0: "GeForce GTX 580"
Compute Capability revision number: 2.0
Total amount of global memory: 1535 Mbytes
Number of multiprocessors: 16
Number of cores: 512
Clock rate: 1.72 GHz

Use device 0, grid is 128 blocks, 8 blocks/SM (default is 8 blocks/SM)

71 targets found, target_int_num is 5


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。