c/c++语言开发共享紧凑型AVX2寄存器，因此根据掩码选择的整数是连续的

2021年1月5日上午1:54 • C/C++开发 • 阅读 0

在优化arrays压缩的问题中，最佳答案指出：

具有最新指令集的SSE / AVX寄存器允许更好的方法。我们可以直接使用PMOVMSKB的结果，将其转换为PSHUFB之类的控制寄存器。

Haswell（AVX2）可以实现吗？或者它需要AVX512的一种口味？

我有一个包含int32s的AVX2向量，以及一个比较结果的相应向量。我想以某种方式将其改组，以便在掩码中设置相应msb的元素（比较true）在向量的低端是连续的。

我能看到的最好的是使用_mm256_movemask_ps / vmovmskps（没有* d变体？）得到一个掩码，然后在256 AVX2向量查找表中使用它来获得跨通道_m256_permutevar8x32_epi32 / vpermd的随机掩码

首先要做的是找到一个快速标量函数。这是一个不使用分支的版本。

 inline int compact(int *x, int *y, const int n) { int cnt = 0; for(int i=0; i


  SIMD的最佳结果可能取决于零的分布。 如果它稀疏或密集。 以下代码应该适用于稀疏或密集的分发。 例如，长整数的零和非零。 如果分布更均匀，我不知道这个代码是否会带来任何好处。 但无论如何它会给出正确的结果。 
 这是我测试过的AVX2版本。 
 int compact_AVX2(int *x, int *y, int n) { int i =0, cnt = 0; for(i=0; i 

 这是我测试过的SSE2版本。 
 int compact_SSE2(int *x, int *y, int n) { int i =0, cnt = 0; for(i=0; i 

 这是一个完整的测试 
 #include  #include  #if defined (__GNUC__) && ! defined (__INTEL_COMPILER) #include  #else #include  #endif #define N 50 inline int compact(int *x, int *y, const int n) { int cnt = 0; for(int i=0; i


       

      		 以上就是c/c++开发分享紧凑型AVX2寄存器，因此根据掩码选择的整数是连续的相关内容,想了解更多C/C++开发(异常处理)及C/C++游戏开发关注计算机技术网(www.ctvol.com)!)。
                                                        本文来自网络收集，不代表计算机技术网立场，如涉及侵权请联系管理员删除。
ctvol管理联系方式QQ:251552304

本文章地址：https://www.ctvol.com/c-cdevelopment/541951.html


                                            
                    
                
                    c/c++语言开发共享Mac Zlib为架构x86_64定义了符号：
                
                
                     上一篇
                    2021年1月5日
                
            
                            
                
                    c/c++语言开发共享使用fscanf_s时访问冲突
                
                
                    下一篇 
                    2021年1月5日
                
            
            
                                                                
                            精彩推荐

    
        c/c++语言开发共享swprintf在xcode中使用unicode字符失败，但在visual studio中工作
    
    2021年1月14日

    
        c/c++语言开发共享布线问题-分支限界法c++实现
    
    2021年5月15日

    
        c/c++语言开发共享c语言编程:实现数字的翻转
    
    2021年5月13日

    
        c/c++语言开发共享C语言学习之动态内存分配的四个函数
    
    2021年5月14日

    
        c/c++语言开发共享是什么导致“警告：条件表达式中的指针/整数类型不匹配”？
    
    2021年1月3日

    
        C++单链表实现大数加法分享！
    
    2020年11月10日

    
        c/c++语言开发共享在C中的新#define中使用先前定义的#define
    
    2021年1月10日

    
        C++模版函数详解分享
    
    2020年11月12日

    
        c/c++语言开发共享JNI本机代码上的内存泄漏
    
    2020年12月5日

    
        c/c++语言开发共享如何获得基于c函数的差异？
    
    2021年1月9日

    
        c/c++语言开发共享C语言实现简单的计算器
    
    2021年5月8日

    
        c/c++语言开发共享如何获取输入的第二个字符串
    
    2020年12月5日


            
                    
                            
        
C/C++编程
            
                                    c/c++语言开发共享如何在C中将XML文件读入缓冲区？
                                    c/c++语言开发共享C/C++ Windows API：文件/文件夹
                                    c/c++语言开发共享malloc什么时候在裸机环境中返回NULL？
                                    c/c++语言开发共享STL 应用之set
                                    c/c++语言开发共享从C读取.mat文件：可以读取变量;  但不能正确返回
                                    c/c++语言开发共享笔试题——C++后序字符比较
                                    c/c++语言开发共享120. 三角形最小路径和  （C语言+暴力递归+优化递归+动态规划+空间优化动态规划）
                                    c/c++语言开发共享Pygame库200行代码实现简易飞机大战
                                    c/c++语言开发共享如何检索所有对象ID？
                                    c/c++语言开发共享从文件读取到数组 –  C
                                    c/c++语言开发共享在linux中断的上下文中运行用户线程
                                    c/c++语言开发共享告知clang内联汇编读取特定的内存区域
                                    C++ 中构造函数的实例详解分享
                                    c/c++语言开发共享P2472 [SCOI2007]蜥蜴 (最大流)
                                    c/c++语言开发共享C++ 学习笔记（三）string 类
                            
        
热门标签
C
COD
cs
EA
h
html
http
IE
ign
js
ns
OG
OW
php
ps
SE
select
名字大全
工具
攻略大全
数据
测试
游戏
游戏名字
游戏名字大全
游戏攻略
系统
网络名字大全
网络游戏名字
网络游戏名字大全



    
        
                        
                
            
                        
                游戏最新信息
手游/网游免费精选名字大全
游戏好看图片大全
关于计算机技术网
热门分类目录
网站地图
搜索蜘蛛地图
                
                    Copyright © 2024 CTVOL版权所有 蜀ICP备19030938号-5 Powered by 猴子技术宅