- 【トリップ検索】CUDA SHA-1 Tripper【GeForce】
356 : ◆MERIKEN4.k [sage]:2011/08/28(日) 00:52:35.63 ID:9nceMSa20 - >>353
お疲れさまです〜 こちらでも動作確認しました。ソースを見ましたけど、 SHA-1の部分を差し替えられたんですね。詳しい報告はまた後でさせて頂きます。
|
- 【トリップ検索】CUDA SHA-1 Tripper【GeForce】
357 : ◆MERIKEN4.k [sage]:2011/08/28(日) 00:57:48.07 ID:9nceMSa20 - >>355
ラデのレジスタの数はブロック単位でとんでもないことになってるみたいですね。 実際1スレッドあたりどれぐらい使えるのか、非常に興味があります。 Bitslice DESの移植するときにはCUDAだとShared Memoryをつかわないと かなり厳しいことになりそうなので… それはそうと、さっき初めてComputer Visual Profilerの存在に気づいて いま動かしてるんですけど、これって物凄い重いですね。結果が実にたのしみです。
|
- 【トリップ検索】CUDA SHA-1 Tripper【GeForce】
358 : ◆QwF3QYjuZk [sage]:2011/08/28(日) 03:04:19.82 ID:9nceMSa20 - test
|
- 【トリップ検索】CUDA SHA-1 Tripper【GeForce】
359 : ◆MERIKEN4.k [sage]:2011/08/28(日) 03:59:02.70 ID:9nceMSa20 - トリップテストを誤爆してしまった…
でもとにかくJohn the RipperのBitslice DESのコードで 10桁トリップを生成することに成功しました! ∩( ・ω・)∩ばんじゃーい 素のCでかかれてることもあって速度はCPU1スレッドで550K TPSと まだまだですが、UCB-cryptが330K TPSだったのと比べると差は 歴然としています。Bitslice DESのことを教えていただいて 本当にありがとうございました > >>303 さて、これからJohn the Ripperのコードの余分な部分を削りまくって 綺麗なvanilla Cの実装にしてからCUDA Cに移植することにします。 途中でCPU検索に対応させるのがさきですけど…
|
- 【トリップ検索】CUDA SHA-1 Tripper【GeForce】
361 : ◆MERIKEN4.k [sage]:2011/08/28(日) 14:29:19.22 ID:9nceMSa20 - >>353
私も試してみました。調べてみたら、1SMあたりのコア数は Compute Capabilityが1.xの場合は8、2.0の場合は32、2.1の場合は48の ようです。これに応じて-xのデフォルトの値を変えてやると よいかもしれません。私の版では次のバージョンで対応する予定です。 【GPU】GTX 580 (OC: 860/1720/2004) 【CPU】Phenom II X6 1100T 3.30GHz 【OS】Windows XP SP3 32bit 【バージョン】CUDA SHA-1 Tripper 0.3.0 【オプション】なし 【Display Driver】270.81 【速度】 2147476 kTrips in 3.156 sec - 680.442 MTrips/sec 2147479 kTrips in 3.157 sec - 680.228 MTrips/sec 2147472 kTrips in 3.171 sec - 677.223 MTrips/sec 2147471 kTrips in 3.157 sec - 680.225 MTrips/sec 【その他】配布パッケージのtrip.txt Device 0: "GeForce GTX 580" Compute Capability revision number: 2.0 Total amount of global memory: 1535 Mbytes Number of multiprocessors: 16 Number of cores: 512 Clock rate: 1.72 GHz Use device 0, grid is 128 blocks, 8 blocks/SM (default is 8 blocks/SM) 71 targets found, target_int_num is 5
|