在C++中使用short(int16)进行饱和

作者：多米音乐_34281398 | 来源：互联网 | 2022-12-07 04:34

如何解决《在C++中使用short(int16)进行饱和》经验，为你挑选了1个好方法。

我正在优化瓶颈代码:

int sum = ........
sum = (sum >> _bitShift);

if (sum > 32000)
    sum = 32000; //if we get an overflow, saturate output
else if (sum <-32000)
    sum = -32000; //if we get an underflow, saturate output

short result = static_cast(sum);

我想将饱和条件写为一个"if condition",或者甚至更好,没有"if condition"来使这段代码更快.我不需要精确饱和值为32000,任何类似的值如32768都是可以接受的.

根据此页面,ARM中有一个饱和指令.在x86/x64中有类似的东西吗？

1> Jerry Coffin..：

我完全不相信试图消除这些if陈述可能会带来任何真正的好处.快速检查表明给出此代码:

int clamp(int x) {
    if (x <-32768)
        x = -32768;
    else if (x > 32767)
        x = 32767;
    return x;
}

...... gcc和Clang都会产生这样的无分支结果:

clamp(int):
  cmp edi, 32767
  mov eax, 32767
  cmovg edi, eax
  mov eax, -32768
  cmp edi, -32768
  cmovge eax, edi
  ret

你可以做类似的事情x = std::min(std::max(x, -32768), 32767);,但这会产生相同的序列,并且源码似乎不太可读,至少对我而言.

如果你使用英特尔的向量指令,你可以做得比这更好,但可能只有你愿意投入大量的工作 - 特别是你可能需要对整个(小)向量进行操作通过这种方式同时实现价值观.如果你这样做,你通常会想要采取一种与你现在所采取的方法不同的方法.现在,你显然依赖于int32位类型,所以你在32位类型上进行算术运算,然后将其截断回到(饱和的)16位值.

对于像AVX这样的东西,你通常想要使用一个指令_mm256_adds_epi16来获取16个值(每个16位)的向量,并同时对所有这些值进行饱和加法(或者同样地,_mm256_subs_epi16做饱和度减法) ).

由于您正在编写C++,我上面给出的是x86处理器的大多数当前编译器(gcc,icc,clang,msvc)中使用的编译器内在函数的名称.如果您直接编写汇编语言,则说明分别为vpaddsw和vpsubsw.

如果您可以依靠当前的处理器(支持AVX 512指令的处理器),您可以使用它们来同时操作32个16位值的向量.

推荐阅读

byte
java boolean 大小_java boolean 大小

先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]

蜡笔小新 2023-12-12 13:36:56
byte
【技术分享】一个 ELF 蠕虫分析

【技术分享】一个 ELF 蠕虫分析 ... [详细]

蜡笔小新 2023-10-17 16:12:28
uri
32位ubuntu编译android studio,32位Ubuntu编译Android 4.0.4问题

问题一：在32位Ubuntu12.04上编译Android4.0.4源码时，出现了关于emulator的错误，关键是其Makefile里的 ... [详细]

蜡笔小新 2023-10-16 13:19:01
int
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
int
Which is more efficient: char str[] or char *str?

This article discusses the efficiency of using char str[] and char *str and whether there is any reason to prefer one over the other. It explains the difference between the two and provides an example to illustrate their usage. ... [详细]

蜡笔小新 2023-12-12 10:13:35
int
字符设备驱动leds

内核版本：4.12.9编译器：arm-linux-gcc-4.4.3本驱动基于jz2440v2开发板，实现3个led设备的驱动程序。代码如下：1#include ... [详细]

蜡笔小新 2023-10-16 05:10:50
int
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
int
Android源码深入理解JNI技术的概述和应用

本文介绍了Android源码中的JNI技术，包括概述和应用。JNI是Java Native Interface的缩写，是一种技术，可以实现Java程序调用Native语言写的函数，以及Native程序调用Java层的函数。在Android平台上，JNI充当了连接Java世界和Native世界的桥梁。本文通过分析Android源码中的相关文件和位置，深入探讨了JNI技术在Android开发中的重要性和应用场景。 ... [详细]

蜡笔小新 2023-12-13 10:00:57
int
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
byte
配置IPv4静态路由实现企业网内不同网段用户互访

本文介绍了通过配置IPv4静态路由实现企业网内不同网段用户互访的方法。首先需要配置接口的链路层协议参数和IP地址，使相邻节点网络层可达。然后按照静态路由组网图的操作步骤，配置静态路由。这样任意两台主机之间都能够互通。 ... [详细]

蜡笔小新 2023-12-12 13:12:08
int
java.lang.NoSuchMethodError.getMessage()方法的使用及代码示例

本文整理了Java中java.lang.NoSuchMethodError.getMessage()方法的一些代码示例，展示了NoSuchMethodErr ... [详细]

蜡笔小新 2023-12-09 17:50:11
int
linux进阶50——无锁CAS

1.概念比较并交换(compareandswap，CAS)，是原⼦操作的⼀种，可⽤于在多线程编程中实现不被打断的数据交换操作࿰ ... [详细]

蜡笔小新 2023-12-09 10:10:40
int
linux 字符串数组初始化,C++字符数组初始化方法的分析

发现了一个字符数组初始化的误区，而这个往往能导致比较严重的性能问题，分析介绍如下：往往我们在初始化一个字符数组，大概有如下几 ... [详细]

蜡笔小新 2023-10-16 20:46:26
int
如何在运行参数中导入txt文件

刚开始crousera上学习<algorithmspart1>但对JAVA实在是不熟。******************************************** ... [详细]

蜡笔小新 2023-10-16 18:10:03
int
VS用c语言连接mysql,c语言连接mysql完整演示

#include#includeintmain(){MYSQL*conn;创建一个指向mysql数据类型的指针connmysql_init(NULL);mysql的初始化if(!c ... [详细]

蜡笔小新 2023-10-16 13:56:56

多米音乐_34281398

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章