c/c++语言开发共享使用SSE(x * x * x)+(y * y * y)进行乘法

我正在尝试使用SIMD优化此function,但我不知道从哪里开始。

long sum(int x,int y) { return x*x*x+y*y*y; } 

反汇编函数如下所示:

  4007a0: 48 89 f2 mov %rsi,%rdx 4007a3: 48 89 f8 mov %rdi,%rax 4007a6: 48 0f af d6 imul %rsi,%rdx 4007aa: 48 0f af c7 imul %rdi,%rax 4007ae: 48 0f af d6 imul %rsi,%rdx 4007b2: 48 0f af c7 imul %rdi,%rax 4007b6: 48 8d 04 02 lea (%rdx,%rax,1),%rax 4007ba: c3 retq 4007bb: 0f 1f 44 00 00 nopl 0x0(%rax,%rax,1) 

调用代码如下所示:

  do { for (i = 0; i < maxi; i++) { j = nextj[i]; long sum = cubeSum(i,j); while (sum <= p) { long x = sum & (psize - 1); int flag = table[x]; if (flag <= guard) { table[x] = guard+1; } else if (flag == guard+1) { table[x] = guard+2; count++; } j++; sum = cubeSum(i,j); } nextj[i] = j; } p += psize; guard += 3; } while (p <= n); 

    最后,如果结果比编译器为您生成的简单代码更快,我会感到惊讶。 如果您要操作数据arrays,SIMD会更有用。

    这种特殊情况不适合SIMD(SSE或其他)。 当你有连续的数组,你可以顺序访问和异步处理时,SIMD真的只能很好地工作。

    但是你可以至少摆脱标量代码中的一些冗余操作,例如当i不变时重复计算i * i * i

     do { for (i = 0; i < maxi; i++) { int i3 = i * i * i; int j = nextj[i]; int j3 = j * j * j; long sum = i3 + j3; while (sum <= p) { long x = sum & (psize - 1); int flag = table[x]; if (flag <= guard) { table[x] = guard+1; } else if (flag == guard+1) { table[x] = guard+2; count++; } j++; j3 = j * j * j; sum = i3 + j3; } nextj[i] = j; } p += psize; guard += 3; } while (p <= n); 

      以上就是c/c++开发分享使用SSE(x * x * x)+(y * y * y)进行乘法相关内容,想了解更多C/C++开发(异常处理)及C/C++游戏开发关注计算机技术网(www.ctvol.com)!)。

      本文来自网络收集,不代表计算机技术网立场,如涉及侵权请联系管理员删除。

      ctvol管理联系方式QQ:251552304

      本文章地址:https://www.ctvol.com/c-cdevelopment/522505.html

      (0)
      上一篇 2020年12月10日
      下一篇 2020年12月10日

      精彩推荐