- 【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
36 :,,・´∀`・,,)っ-○○○[sage]:2015/06/09(火) 10:18:10.60 ID:hpY+QnAE - 上下128ビット跨いだシフトが簡単にできないから
ミスアラインロード使わないとめんどくさいんだよねー void up_index(short a[16],short b[16]) { __m256i x = _mm256_load_si256((__m256i*)a); __m128i u = mm_mm256_extracti128_si256(x, 1); x = _mm256_alignr_epi8( x, _mm256_castsi128_si256(u), 14); _mm256_store_si256((__m256i*)b, x); }
| - 【C++】高速化手法【SSE】2 [転載禁止]©2ch.net
37 :,,・´∀`・,,)っ-○○○[sage]:2015/06/09(火) 10:19:22.92 ID:hpY+QnAE - __m128i u = _mm256_extractf128_si256(x, 1);
みすった
|
|