thread_local变量

thread_local变量是C++ 11新引入的一种存储类型。它会影响变量的存储周期(Storage duration)，C++中有4种存储周期：

automatic
static
dynamic
thread

有且只有thread_local关键字修饰的变量具有线程周期(thread duration)，这些变量(或者说对象）在线程开始的时候被生成(allocated)，在线程结束的时候被销毁(deallocated)。并且每一个线程都拥有一个独立的变量实例(Each thread has its own instance of the object)。thread_local 可以和static 与 extern关键字联合使用，这将影响变量的链接属性(to adjust linkage)。

那么，哪些变量可以被声明为thread_local？以下3类都是ok的

命名空间下的全局变量
类的static成员变量
本地变量

下面引用《C++ Concurrency in Action》书中的例子来说明这3种情况：

thread_local int x;  //A thread-local variable at namespace scope
class X
{
    static thread_local std::string s; //A thread-local static class data member
};
static thread_local std::string X::s;  //The definition of X::s is required

void foo()
{
    thread_local std::vector<int> v;  //A thread-local local variable
}

既然每个线程都拥有一份独立的thread_local变量，那么就有2个问题需要考虑：

各线程的thread_local变量是如何初始化的
各线程的thread_local变量在初始化之后拥有怎样的生命周期，特别是被声明为thread_local的本地变量(local variables)

下面的代码可以帮助回答这2个问题，我的测试环境是vs2015。

输出的前3行打印能帮助解答thread_local变量是如何初始化的，可以看到每个线程都会进行一次初始化，例子中的g_n在主线程中最早被初始化为1，随后被修改为2和3，但这些修改操作并不影响g_n在线程t2和t3中的初始值(值为1)，虽然t2和t3线程启动的时候主线程中的变量值已经被更新为3，所以主线程、thread1、thread2打印结果分别为3，2，2。

后6行打印说明了一个事实，声明为thread_local的本地变量在线程中是持续存在的，不同于普通临时变量的生命周期，它具有static变量一样的初始化特征和生命周期，虽然它并没有被声明为static。例子中foo函数中的thread_local变量 i 在每个线程第一次执行到的时候初始化，在每个线程各自累加，在线程结束时释放。

#include <thread>

thread_local int g_n = 1;

void f()
{
    g_n++;
    printf("id=%d, n=%d\n", std::this_thread::get_id(),g_n);
}

void foo()
{
    thread_local int i=0;
    printf("id=%d, n=%d\n", std::this_thread::get_id(), i);
    i++;
}

void f2()
{
    foo();
    foo();
}

int main()
{
    g_n++;
    f();
    std::thread t1(f);
    std::thread t2(f);

    t1.join();
    t2.join();

    f2();
    std::thread t4(f2);
    std::thread t5(f2);

    t4.join();
    t5.join();
    return 0;
}

输出（id值是每次运行时变的）：

id=8004, n=3

id=8008, n=2
id=8012, n=2
id=8004, n=0
id=8004, n=1
id=8016, n=0
id=8016, n=1
id=8020, n=0
id=8020, n=1

C++Thread Local Storage

概述
thread_local指示对象拥有线程存储期。也就是对象的存储在线程开始时分配，而在线程结束时解分配。每个线程拥有其自身的对象实例。唯有声明为 thread_local 的对象拥有此存储期。 thread_local 能与 static 或 extern 结合一同出现，以调整链接（分别指定内部或外部链接），详细的可以查阅：存储类说明符 - cppreference.com。

使用 thread_local 说明符声明的变量仅可在它在其上创建的线程上访问。变量在创建线程时创建，并在销毁线程时销毁。每个线程都有其自己的变量副本。
thread_local 说明符可以与 static 或 extern 合并。这将影响变量的链接属性。

表现形式
在 C++ 中，Thread Local Storage (TLS) 是通过使用 thread_local 关键字来实现的。它可以用于修饰全局变量、静态变量或类的静态成员变量，使其成为线程局部变量。对于一个使用 thread_local 修饰的变量，每个线程都拥有一个独立的副本。以下是使用 thread_local 的一些原型示例：

全局变量
每个线程都有自己单独的x副本，互不干预。
thread_local int globalVar;
1
局部变量(静态变量)
线程存储期的变量都是和线程绑定的，所以只有第一次声明时被赋值。可以理解为线程专用的static变量。不过变量的作用域依然是在本身的作用域内。
void foo() {
thread_local int staticVar;
}

类对象(静态变量)
与局部变量的情况相同，创建的实例相对于thread是static的,一般情况要求我们：thread_local对象声明时赋值.
类成员变量

thread_local作为类成员变量时必须是static的.
thread_local作为类成员时也是对于每个thread分别分配了一个,而static则是全局一个.
class MyClass {
public:
static thread_local int staticMemberVar;
};

需要注意的是，使用 thread_local 关键字修饰的变量在每个线程中都有一个独立的副本，因此每个线程对其进行的操作都不会影响其他线程。在多线程环境下，这可以帮助避免数据竞争和同步开销。

作用和适用的场景
C++ 的 Thread Local Storage（TLS）特性在多线程环境中非常有用，它允许每个线程拥有一份单独的全局或静态变量副本。适用的场景包括：

避免数据竞争：当多个线程需要访问全局或静态变量时，使用 TLS 可以为每个线程提供一个变量副本，从而避免数据竞争。每个线程只操作自己的变量副本，不会影响其他线程。
减少同步开销：由于每个线程都有自己的变量副本，因此在某些情况下可以减少同步开销，例如减少互斥锁的使用。这可以提高多线程程序的性能。
线程独立的资源分配：当某个资源需要在多个线程之间共享，但又希望每个线程独立使用该资源时，可以使用 TLS。例如，线程独立的内存分配器、线程独立的随机数生成器等。
线程特有的状态跟踪：TLS 可用于跟踪每个线程的特定状态，如错误信息、递归调用计数、线程局部缓存等。这可以使每个线程在处理自己的数据时，能够访问和操作这些特定状态。
模拟线程局部变量：在一些没有原生支持线程局部变量的环境中，可以使用 TLS 来模拟这个功能。例如，在 C++11 之前的版本中，可以通过自定义的实现来模拟线程局部变量。
需要注意的是，TLS 可能会增加内存消耗，因为每个线程都有自己的变量副本。此外，在某些情况下，TLS 可能会导致一定的性能损失，因为操作系统需要在线程切换时处理线程局部数据。因此，在使用 TLS 时，请确保权衡这些因素，并在适当的场景下使用。

实现逻辑
C++ 的 Thread Local Storage（TLS）特性在底层的实现和逻辑上有很多不同的方面。主要实现方法包括编译器支持、操作系统支持和库支持。在这里，我们将概述 TLS 的一般实现原理和底层逻辑：

编译器支持：编译器在生成目标代码时，对于使用 thread_local 修饰的变量，会将其分配到特殊的存储区域。这个存储区域是每个线程独立的，因此在运行时，每个线程都可以访问自己独立的变量副本。
操作系统支持：操作系统通常提供一种机制来管理线程局部存储。例如，Windows 使用 TlsAlloc、TlsGetValue 和 TlsSetValue 等函数管理线程局部存储，而 Linux 使用 pthread_key_create、pthread_getspecific 和 pthread_setspecific 等函数。当一个线程访问 thread_local 变量时，操作系统会将请求重定向到这个线程对应的局部存储区域。
库支持：在 C++ 标准库中，线程局部存储的功能由 thread_local 关键字和相关的库函数提供。这些库函数在底层调用操作系统提供的 API 来实现线程局部存储的功能。
线程创建时的初始化：当一个新线程被创建时，运行时系统会分配一个独立的 TLS 区域，并为该区域中的 thread_local 变量进行初始化。这些初始化操作可能包括调用默认构造函数、执行初始化表达式等。
线程退出时的清理：当一个线程退出时，运行时系统会负责释放线程局部存储区域，并为该区域中的 thread_local 变量调用析构函数。这个过程通常由操作系统或 C++ 运行时库自动完成。
需要注意的是，不同的编译器和操作系统可能有不同的实现细节。在实际使用中，开发者无需了解所有这些底层逻辑，只需使用 thread_local 关键字和相关的库函数就可以享受到线程局部存储带来的便利。
示例
示例1：使用 thread_local 计算每个线程的累积和
#include <iostream>
#include <thread>
#include <vector>

thread_local int sum = 0;

void accumulate(int n) {
for (int i = 1; i <= n; ++i) {
sum += i;
}
std::cout << "Thread id: " << std::this_thread::get_id() << ", Sum: " << sum << std::endl;
}

int main() {
std::vector<std::thread> threads;

for (int i = 1; i <= 5; ++i) {
threads.emplace_back(accumulate, i * 10);
}

for (auto& t : threads) {
t.join();
}

return 0;
}

示例2：模拟一个简单的线程安全计数器

#include <iostream>
#include <mutex>
#include <thread>
#include <vector>

std::mutex mtx;
unsigned int globalCounter = 0;
thread_local unsigned int localCounter = 0;

void incrementCounter(int n) {
for (int i = 0; i < n; ++i) {
++localCounter;
std::unique_lock<std::mutex> lock(mtx);
++globalCounter;
lock.unlock();
}

std::cout << "Thread id: " << std::this_thread::get_id()
<< ", Local counter: " << localCounter
<< ", Global counter: " << globalCounter << std::endl;
}

int main() {
std::vector<std::thread> threads;

for (int i = 0; i < 5; ++i) {
threads.emplace_back(incrementCounter, 100);
}

for (auto& t : threads) {
t.join();
}

std::cout << "Final global counter: " << globalCounter << std::endl;

return 0;
}

这两个示例展示了如何使用 thread_local 关键字创建线程局部变量。在第一个示例中，我们计算了每个线程的累积和。在第二个示例中，我们模拟了一个简单的线程安全计数器，它使用 thread_local 存储每个线程的局部计数，并使用互斥锁保护全局计数器。

需要注意的地方
thread_local 变量是线程局部存储的变量，它的生命周期与线程的生命周期相同。在多线程程序中，thread_local 变量可以用来保存线程相关的状态，从而避免了线程间的共享状态可能导致的同步问题。
然而，如果在使用 thread_local 变量时不小心，可能会导致内存泄漏问题。具体来说，如果一个线程结束时，它仍然持有一个指向 thread_local 变量的指针，那么这个 thread_local 变量就会一直存在，直到整个程序结束才会被释放。如果这个 thread_local 变量是一个大的对象，那么就会导致内存泄漏。
为了避免这个问题，需要确保在线程结束时及时清理 thread_local 变量。一种常见的做法是在 thread_local 变量的析构函数中清理相关的资源。例如，如果 thread_local 变量是一个指针类型，那么在析构函数中应该释放指针所指向的资源。同时，还可以使用一些 RAII 技巧，例如使用 std::unique_ptr 等智能指针，来帮助自动化资源清理的工作。

除了在 thread_local 变量的析构函数中及时清理资源外，还有一些其他的可能导致内存泄漏的情况，例如：
1.在使用 thread_local 变量时发生异常，导致析构函数没有被正确调用，从而导致资源泄漏。
2.在使用 thread_local 变量的线程中调用 std::exit 函数或者使用 std::quick_exit 函数退出程序，导致 thread_local 变量的析构函数没有被调用，从而导致资源泄漏。
3.在使用 thread_local 变量的线程中创建了一些子线程，并且这些子线程也使用了相同的 thread_local 变量，但是没有正确清理子线程中的 thread_local 变量，从而导致资源泄漏。

针对这些情况，我们需要采取相应的措施来避免内存泄漏，例如：
1.使用 RAII 技巧，例如使用 std::unique_ptr 等智能指针来管理资源，从而避免异常导致的资源泄漏。
2.在程序退出时，可以使用 std::atexit 函数来注册一个清理函数，该函数会在程序退出前被调用，从而确保 thread_local 变量的析构函数被正确调用。
3.在子线程中正确清理 thread_local 变量，可以使用类似于在主线程中清理 thread_local 变量的方式，即在 thread_local 变量的析构函数中清理相关资源。同时，还需要确保在子线程退出时，thread_local 变量的析构函数被正确调用。

总结
本质上thread_local修饰后仍然是一个变量，我们依旧能够使用取地址操作者通过引用的方法传递给其他线程对其进行修改，
thread-local storage 和 static(或者说global) 存储很类似，每一个线程都将拥有一份这个数据的拷贝，thread_local对象的生命周期从线程开始时开始(对于全局变量)，或者首先分配空间。当线程退出的时候对象析构；
一般在声明时赋值，在本thread中只执行一次。当用于类成员变量时，必须是static的。
参考：https://blog.csdn.net/qq_21438461/article/details/129408082

标签：std,变量,thread,int,用法,线程,local
From： https://www.cnblogs.com/bwbfight/p/18025752

thread_local的一些用法

thread_local变量

相关文章

赞助商

阅读排行