热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

检查所有__m128i组件是否为0的最有效方法[使用SSE内在函数]

如何解决《检查所有__m128i组件是否为0的最有效方法[使用SSE内在函数]》经验,为你挑选了2个好方法。

我正在使用SSE内在函数来确定矩形(由四个int32值定义)是否已更改:

__m128i oldRect; // contains old left, top, right, bottom packed to 128 bits
__m128i newRect; // contains new left, top, right, bottom packed to 128 bits

__m128i xor = _mm_xor_si128(oldRect, newRect);

此时,xor如果矩形未更改,则结果值将全为零.那么最有效的方法是什么呢?

目前我这样做:

if (xor.m128i_u64[0] | xor.m128i_u64[1])
{
    // rectangle changed
}

但我认为有一种更聪明的方法(可能使用了一些我还没有找到的SSE指令).

我在x64上定位SSE4.1,我在Visual Studio 2013中编写C++.



1> Paul R..:

您可以通过_mm_testz_si128内在函数(SSE4.1)使用PTEST instuction ,如下所示:

#include "smmintrin.h" // SSE4.1 header

if (!_mm_testz_si128(xor, xor))
{
    // rectangle has changed
}

请注意,_mm_testz_si128如果AND两个参数的按位为零,则返回1 .



2> stgatilov..:

具有讽刺意味的是,在某些情况下ptest,SSE 4.1的指令可能比pmovmskbSSE2 慢.我建议简单地使用:

__m128i cmp = _mm_cmpeq_epi32(oldRect, newRect);
if (_mm_movemask_epi8(cmp) != 0xFFFF)
  //registers are different

请注意,如果您确实需要该xor值,则必须单独计算它.

对于像Ivy Bridge这样的英特尔处理器,PaulR的版本使用xor_mm_testz_si128转换为4 uop ,而没有计算的建议版本xor转换为3 uop(另请参见此主题).这可能会提高我的版本的吞吐量.


推荐阅读
author-avatar
Devil灬旋律
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有