首页 > 编程语言 >C++关键字之likely和unlikely

C++关键字之likely和unlikely

时间:2022-10-15 11:56:37浏览次数:57  
标签:edi 编译器 C++ likely unlikely CPU 分支

什么是likely和unlikely

既然程序是我们程序员所写,在一些明确的场景下,我们应该比CPU和编译器更了解哪个分支条件更有可能被满足。我们是否可将这一先验知识告知编译器和CPU, 提高分支预测的准确率,从而减少CPU流水线分支预测错误带来的性能损失呢?答案是可以!它便是likely和unlikely。在Linux内核代码中,这两个宏的应用比比皆是。下面是他们的定义:

#define likely(x) __builtin_expect(!!(x), 1) 
#define unlikely(x) __builtin_expect(!!(x), 0)

likely,用于修饰if/else if分支,表示该分支的条件更有可能被满足。而unlikely与之相反
以下为示例。unlikely修饰argc > 0分支,表示该分支不太可能被满足。

#include <cstdio>

#define likely(x)       __builtin_expect(!!(x), 1)
#define unlikely(x)     __builtin_expect(!!(x), 0)

int main(int argc, char *argv[])
{
    if (unlikely(argc > 0)) {
        puts ("Positive\n");
    } else
    {
        puts ("Zero or Negative\n");
    }
    return 0;
}

likely/unlikely的原理

接下来,我们从汇编指令分析likely/unlikely到底是如何起作用的?
首先我们将上述代码中的unlikely去掉,然后反汇编,作为对照组
汇编如下,我们看到,if分支中的指令被编译器放置于分支跳转指令jle相邻的位置,即CPU流水线在遇到jle指令所代表的的'岔路口'时,更倾向于走if分支

.LC0:
        .string "Positive\n"
.LC1:
        .string "Zero or Negative\n"
main:
        sub     rsp, 8
        test    edi, edi                
        jle     .L2                     ; 如果argc <= 0, 跳转到L2
        mov     edi, OFFSET FLAT:.LC0   ; 如果argc > 0, 从这里执行
        call    puts
.L3:
        xor     eax, eax
        add     rsp, 8
        ret
.L2:
        mov     edi, OFFSET FLAT:.LC1
        call    puts
        jmp     .L3

接着我们在if分支中加上unlikely, 反汇编如下。这里的情况正好与对照组相反,if分支下的指令被编译器放置于远离跳转指令jg的位置。这意味着CPU此时更倾向于走else分支。

.LC0:
        .string "Positive\n"
.LC1:
        .string "Zero or Negative\n"
main:
        sub     rsp, 8
        test    edi, edi
        jg      .L6
        mov     edi, OFFSET FLAT:.LC1
        call    puts
.L3:
        xor     eax, eax
        add     rsp, 8
        ret
.L6:
        mov     edi, OFFSET FLAT:.LC0
        call    puts
        jmp     .L3

因此,通过对分支条件使用likely和unlikely,我们可给编译器一种暗示,即该分支条件被满足的概率比较大或比较小。而编译器利用这一信息优化其机器指令,从而最大限度减少CPU分支预测失败带来的惩罚。

likely/unlikely的适用条件

CPU有自带的分支预测器,在大多数场景下效果不错。因此在分支发生概率严重倾斜、追求极致性能的场景下,使用likely/unlikely才具有较大意义。

C++20中的likely/unlikely

C++20之前的,likely和unlikely只不过是一对自定义的宏。而C++20中正式将likely和unlikely确定为属性关键字。

int foo(int i) {
    switch(i) {
               case 1: handle1();
                       break;
    [[likely]] case 2: handle2();
                       break;
    }
}

标签:edi,编译器,C++,likely,unlikely,CPU,分支
From: https://www.cnblogs.com/lygin/p/16793828.html

相关文章

  • C++ Primer Plus学习笔记之开始学习C++
    前言个人觉得学习编程最有效的方法是阅读专业的书籍,通过阅读专业书籍可以构建更加系统化的知识体系。一直以来都很想深入学习一下C++,将其作为自己的主力开发语言。现在为......
  • C++ | 关联容器map通过值(Value)找键(Key)
    今天又学到了一个关于关联容器map小技巧:通过值(Value)来寻找对应的键(Key),这个功能通过std::find_if实现,代码如下template<classT,classU>TfindKeyByValue(constUVal,......
  • C/C++ 为什么要使用动态内存?
    为什么要使用动态内存?1.按需分配,根据需要分配内存,不浪费;2.被调用函数之外需要使用被调用函数内部的指针对应的地址空间;3.突破栈区的限制,可以给程序分配更多的内存......
  • C++ openCV 相关
    1.opencv的Mat矩阵Mat是opencv在C++中的一个图像容器类,可以使用Mat进行图像矩阵的定义Mat矩阵的定义#include<iostream>#include<opencv2/opencv.hpp>//定义图像......
  • C++实现太阳系行星系统
    实验楼项目:C++实现太阳系行星系统关于详细知识跟着实验做比较好基础知识做这个项目需要知道一些基础知识:OpenGLGLUT类设计main.cpp#include<GL/glut.h>#include......
  • C++11 中的 noexcept
    关键字noexcept用于指出函数不会引发异常,它也可用作运算符,判断操作数(表达式)是否可能引异常:如果操作数可能引发异常,则返回false,否则返回tue。例如,请看下面的声明:......
  • C++程序的内存分区
    1、栈区(stack):由编译器自动分配释放,存放函数的参数值,局部变量值等。2、堆区(heap):一般由程序员分配释放,随叫随到,挥之即走。3、全局/静态区(static):全局变量和静态变量的存储是......
  • C/C++ 错题总结
    写出下列程序在X86上的运行结果structmybitfields{unsignedshorta:4;......
  • extern、关于C++的变量和类的声明和定义
    extern参考:extern声明变量详解变量的声明:intdata;//这样既声明了data同时也定义了dataexternintdata;//只声明而不定义函数的声明:voidhello();......
  • C++ thread array and join respectively
    #pragmacomment(lib,"rpcrt4.lib")#include<Windows.h>#include<rpcdce.h>#include<iostream>#include<string>#include<thread>#include<vector>usingn......