首页 > 其他分享 >go sync.Once

go sync.Once

时间:2024-06-07 10:13:30浏览次数:31  
标签:Do sync done func go once Once

 

来自:https://juejin.cn/post/7088305487753510925

解析 Golang sync.Once 用法和原理

ag9920 2022-04-193,650阅读5分钟  

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第11天,点击查看活动详情

在此前一篇文章中我们了解了 sync.Mutex 的原理 Golang Mutex 原理解析,今天来看一个官方给出的 Mutex 应用场景:sync.Once。

1. 定位

Once is an object that will perform exactly one action.

sync.Once 是 Go 标准库提供的使函数只执行一次的实现,常应用于单例模式,例如初始化配置、保持数据库连接等。它可以在代码的任意位置初始化和调用,因此可以延迟到使用时再执行,并发场景下是线程安全的。

2. 对外接口

Once 对外仅暴露了唯一的方法 Do(f func()),f 为需要执行的函数。

  go 复制代码
// Do calls the function f if and only if Do is being called for the
// first time for this instance of Once. In other words, given
// 	var once Once
// if once.Do(f) is called multiple times, only the first call will invoke f,
// even if f has a different value in each invocation. A new instance of
// Once is required for each function to execute.
//
// Do is intended for initialization that must be run exactly once. Since f
// is niladic, it may be necessary to use a function literal to capture the
// arguments to a function to be invoked by Do:
// 	config.once.Do(func() { config.init(filename) })
//
// Because no call to Do returns until the one call to f returns, if f causes
// Do to be called, it will deadlock.
//
// If f panics, Do considers it to have returned; future calls of Do return
// without calling f.
//
func (o *Once) Do(f func()) 

结合注释,我们来看看 Do 方法有哪些需要注意的:

  1. 只有在当前的 Once 实例第一次调用 Do 方法时,才会真正执行 f。哪怕在多次调用 Do 中间 f 的值有所变化,也只会被实际调用一次;

  2. Do 针对的是只希望执行一次的初始化操作,由于f 是没有参数的,如果需要传参,可以采用包装一层 func 的形式来实现:config.once.Do(func() { config.init(filename) })

  3. 在对f 的调用返回之前,不会返回对Do的调用,所以如果f方法中又调用来Do方法,将会死锁。所以不要做这样的操作:

  go 复制代码
func main() {
 var once sync.Once
 once.Do(func() {
    once.Do(func() {
       fmt.Println("hello kenmawr.")
    })
 })
}
  1. 如果 f 抛出了 panic,此时Do会认为f已经返回,后续多次调用Do也不会再触发对 f 的调用。

3. 实战用法

sync.Once 的场景很多,但万变不离其宗的落脚点在于:任何只希望执行一次的操作。

基于此,我们可以发现很多具体的应用场景落地,比如某个资源的清理,全局变量的初始化,单例模式等,它们本质都是一样的。这里简单列几个,大家可以直接参考代码熟悉。

3.1 初始化

很多同学可能会有疑问,我直接在 init() 函数里面做初始化不就可以了吗?效果上是一样的,为什么还要用 sync.Once,这样还需要多声明一个 once 对象。

原因在于:init() 函数是在所在包首次被加载时执行,若未实际使用,既浪费了内存,又延缓了程序启动时间。而 sync.Once 可以在任何位置调用,而且是并发安全的,我们可以在实际依赖某个变量时才去初始化,这样「延迟初始化」从功能上讲并无差异,但可以有效地减少不必要的性能浪费。

我们来看 Golang 官方的 html 库中的一个例子,我们经常使用的转义字符串函数

func UnescapeString(s string) string

在进入函数的时候,首先就会依赖包里内置的 populateMapsOnce 实例(本质是一个 sync.Once) 来执行初始化 entity 的操作。这里的entity是一个包含上千键值对的 map,如果init()时就去初始化,会浪费内存。

  go 复制代码
var populateMapsOnce sync.Once
var entity           map[string]rune

func populateMaps() {
    entity = map[string]rune{
        "AElig;":                           '\U000000C6',
        "AMP;":                             '\U00000026',
        "Aacute;":                          '\U000000C1',
        "Abreve;":                          '\U00000102',
        "Acirc;":                           '\U000000C2',
        // 省略后续键值对
    }
}

func UnescapeString(s string) string {
    populateMapsOnce.Do(populateMaps)
    i := strings.IndexByte(s, '&')

    if i < 0 {
            return s
    }
    // 省略后续的实现
    ...
}

3.2 单例模式

开发中我们经常会实现 Getter 来暴露某个非导出的变量,这个时候就可以把 once.Do 放到 Getter 里面,完成单例的创建。

  go 复制代码
package main

import (
   "fmt"
   "sync"
)

type Singleton struct{}
var singleton *Singleton
var once sync.Once

func GetSingletonObj() *Singleton {
   once.Do(func() {
      fmt.Println("Create Obj")
      singleton = new(Singleton)
   })
   return singleton
}

func main() {
   var wg sync.WaitGroup
   for i := 0; i < 5; i++ {
      wg.Add(1)
      go func() {
         defer wg.Done()
         obj := GetSingletonObj()
         fmt.Printf("%p\n", obj)
      }()
   }
   wg.Wait()
}
/*--------- 输出 -----------
Create Obj
0x119f428
0x119f428
0x119f428
0x119f428
0x119f428
**/

3.3 关闭channel

一个channel如果已经被关闭,再去关闭的话会 panic,此时就可以应用 sync.Once 来帮忙。

  go 复制代码
type T int

type MyChannel struct {
   c    chan T
   once sync.Once
}

func (m *MyChannel) SafeClose() {
   // 保证只关闭一次channel
   m.once.Do(func() {
      close(m.c)
   })
}

4. 原理

在 sync 的源码包中,Once 的定义是一个 struct,所有定义和实现去掉注释后不过 30行,我们直接上源码来分析:

  go 复制代码
package sync

import (
   "sync/atomic"
)

// 一个 Once 实例在使用之后不能被拷贝继续使用
type Once struct {
   done uint32 // done 表明了动作是否已经执行
   m    Mutex
}

func (o *Once) Do(f func()) {
    if atomic.LoadUint32(&o.done) == 0 {
      o.doSlow(f)
   }
}

func (o *Once) doSlow(f func()) {
   o.m.Lock()
   defer o.m.Unlock()
   if o.done == 0 {
      defer atomic.StoreUint32(&o.done, 1)
      f()
   }
}

这里有两个非常巧妙的设计值得学习,我们参照注释来看一下:

  1. 结构体字段顺序对速度的影响 我们来看一下带注释的 Once 结构定义
  go 复制代码
type Once struct {
	// done indicates whether the action has been performed.
	// It is first in the struct because it is used in the hot path.
	// The hot path is inlined at every call site.
	// Placing done first allows more compact instructions on some architectures (amd64/386),
	// and fewer instructions (to calculate offset) on other architectures.
	done uint32
	m    Mutex
}

sync.Once绝大多数场景都会访问o.done,访问 done 的机器指令是处于hot path上,hot path表示程序非常频繁执行的一系列指令。由于结构体第一个字段的地址和结构体的指针是相同的,如果是第一个字段,直接对结构体的指针解引用即可,如果是其他的字段,除了结构体指针外,还需要计算与第一个值的偏移,所以将done放在第一个字段,则CPU减少了一次偏移量的计算,访问速度更快。

  1. 为何不使用 CAS 来达到执行一次的效果

其实使用 atomic.CompareAndSwapUint32 是一个非常直观的方案,这样的话 Do 的实现就变成了

  go 复制代码
func (o *OnceA) Do(f func()) {
  if !atomic.CompareAndSwapUint32(&o.done, 0, 1) {
    return
  }
  f()
}

这样的问题在于,一旦出现 CAS 失败的情况,成功协程会继续执行 f,但其他失败协程不会等待 f 执行结束。而Do 的API定位对此有着强要求,当一次 once.Do 返回时,执行的 f 一定是完成的状态。

对此,sync.Once 官方给出的解法是:

Slow path falls back to a mutex, and the atomic.StoreUint32 must be delayed until after f returns.

我们再来结合 doSlow() 看一看这里是怎么解决这个并发问题的:

  go 复制代码
func (o *Once) Do(f func()) {
    if atomic.LoadUint32(&o.done) == 0 {
      o.doSlow(f)
   }
}

func (o *Once) doSlow(f func()) {
   o.m.Lock()
   defer o.m.Unlock()
   if o.done == 0 {
      defer atomic.StoreUint32(&o.done, 1)
      f()
   }
}
  • atomic.LoadUint32 用于原子加载地址(也就是 &o.done),返回加载到的值;
  • o.done 为 0 是代表尚未执行。若同时有两个 goroutine 进来,发现 o.done 为 0(此时 f 尚未执行),就会进入 o.doSlow(f) 的慢路径中(slow path);
  • doSlow 使用 sync.Mutex 来加锁,一个协程进去,其他的被阻塞在锁的地方(注意,此时是阻塞,不是直接返回,这是和 CAS 方案最大的差别);
  • 经过 o.m.Lock() 获取到锁以后,如果此时 o.done 还是 0,意味着依然没有被执行,此时就可以放心的调用 f来执行了。否则,说明当前协程在被阻塞的过程中,已经失去了调用f 的机会,直接返回。
  • defer atomic.StoreUint32(&o.done, 1) 是这里的精华,必须等到f() 返回,在 defer 里才能够去更新 o.done 的值为 1。

5. 避坑

  • 不要拷贝一个 sync.Once 使用或作为参数传递,然后去执行 Do,值传递时 done 会归0,无法起到限制一次的效果。
  • 不要在 Do 的 f 中嵌套调用 Do

参考资料

Golang 1.18标准库sync.Once

Golang atomic.LoadUint32()用法及代码示例

sync.Once 的使用场景

你真的了解 sync.Once 吗

 

============

sync.Once 代表在这个对象下在这个示例下多次执行能保证只会执行一次操作。

  var once sync.Once
  for i:=0; i < 10; i++ {
  once.Do(func(){
  fmt.Println("execed...")
  })
  }

在上面的例子中,once.Do 的参数 func 函数就会保证只执行一次。

sync.Once 原理

那么 sync.Once 是如何保证 Do 执行体函数只执行一次呢?

从 sync.Once 的源码就可以看出其实就是通过一个 uint32 类型的 done 标识实现的。当 done = 1 就标识着已经执行过了。Once 的源码非常简短

  package sync
   
  import (
  "sync/atomic"
  )
   
  type Once struct {
  done uint32
  m Mutex
  }
   
  func (o *Once) Do(f func()) {
  if atomic.LoadUint32(&o.done) == 0 {
  o.doSlow(f)
  }
  }
   
  func (o *Once) doSlow(f func()) {
  o.m.Lock()
  defer o.m.Unlock()
  if o.done == 0 {
  defer atomic.StoreUint32(&o.done, 1)
  f()
  }
  }

Do 方法内部用到了内存加载同步原语 atomic.LoadUint32done = 0 表示还没有执行,所以多个请求在 f 执行前都会进来执行 o.doSlow(f),然后通过互斥锁使保证多个请求只有一个才能成功执行,保证了 f 成功返回之后才会内存同步原语将 done 设置为 1。最后释放锁,后面的请求就因无法满足判断而退出。

如果仔细查看源代码中的注释就会发现 go 团队还解释了为什么没有使用 cas 这种同步原语实现。因为 sync.Once 的 Do(f) 在执行的时候要保证只有在 f 执行完之后 do 才返回。想象一下有至少两个请求,Do 是用 cas 实现的:

  func (o *Once) Do(f func()) {
  if atomic.CompareAndSwapUint32(&o.done, 0, 1) {
  f()
  }
  }

虽然 cas 保证了同一时刻只有一个请求进入 if 判断执行 f()。但是其它的请求却没有等待 f() 执行完成就立即返回了。那么用户端在执行 once.Do 返回之后其实就可能存在 f() 还未完成,就会出现意料之外的错误。如下面例子

  var db SqlDb
  var once sync.Once
  for i:=0; i < 2; i++ {
  once.Do(func() {
  db = NewSqlDB()
  fmt.Println("execed...")
  })
  }
  // #1
  db.Query("select * from table")
  ...

根据上述如果是用 cas 实现的 once,那么当 once.Do 执行完返回并且循环体结束到达 #1 时,由于 db 的初始化函数可能还没完成,那么这个时候 db 还是 nil,那么直接调用 db.Query 就会发生错误了。

sync.Once 使用限制

由于 Go 语言一切皆 struct 的特性,我们在使用 sync.Once 的时候一定要注意不要通过传递参数使用。因为 go 对于 sync.Once 参数传递是值传递,会将原来的 once 拷贝过来,所以有可能会导致 once 会重复执行或者是已经执行过了就不会执行的问题。

  func main() {
  for i := 0; i < 10; i++ {
  once.Do(func() {
  fmt.Println("execed...")
  })
  }
  duplicate(once)
  }
   
  func duplicate(once sync.Once) {
  for i := 0; i < 10; i++ {
  once.Do(func() {
  fmt.Println("execed2...")
  })
  }
  }

比如上述例子,由于 once 已经执行过一次,once.done 已经为 1。这个时候再通过传递,由于 once.done 已经为1,所以就不会执行了。上面的输出结果只会打印第一段循环的结果 execed...

sync.Pool

sync.Pool 其实把初始化的对象放到内部的一个池对象中,等下次访问就直接返回池中的对象,如果没有的话就会生成这个对象放入池中。Pool 的目的是”预热“,即初始化但还未立即使用的对象,由于预先初始化至 Pool,所以到后续取得时候就直接返回已经初始化过得对象即可。这样提高了程序吞吐,因为有时候在运行时初始化一些对象的开销是非常昂贵的,如数据库连接对象等。

=======

 

来自:

https://juejin.cn/post/7088305487753510925

https://www.cnblogs.com/ms27946/p/SyncOnce-And-SyncPool-For-Golang.html

参考:

 

标签:Do,sync,done,func,go,once,Once
From: https://www.cnblogs.com/rebrobot/p/18236617

相关文章

  • go pool
     来自:sync.Pool原理sync.Pool核心对象有三个New:函数,负责对象初始化Get:获取Pool中的对象,如果Pool中对象不存在则会调用NewPut:将对象放入Pool中NewfuncPool的结构很简单,就5个字段 typePoolstruct{ ... Newfunc()interface{} }......
  • 基于 Go 语言实现的 Ollama 大语言模型框架
    大语言模型在现代人工智能领域中扮演着重要角色。Ollama作为一个轻量级且可扩展的框架,帮助开发者在本地机器上构建和运行这些模型。Ollama简介Ollama是一个简单、可扩展的框架,旨在帮助开发者构建和运行大语言模型。它提供了一个简洁的API,用于创建、运行和管理模型。此外,Olla......
  • go cond
      cond:packagemainimport("fmt""sync""time")funcmain(){varmusync.Mutexcond:=sync.NewCond(&mu)varreadyboolgofunc(){time.Sleep(time.Second)//模拟一些工作......
  • 195、Django实战:从部署到运维,打造高效Web应用
    DjangoChannels:实现WebSocket与实时通信本文将向您介绍Python开发框架Django中的一个重要组件——DjangoChannels,它使得在Django中实现WebSocket通信变得轻而易举。通过阅读本文,您将了解WebSocket的概念、DjangoChannels的工作原理以及如何在实际项目中使用它来实现实时......
  • 197、加速Django应用:性能优化全攻略
    Python开发框架Django之性能优化:提高应用程序的运行速度本文将为大家介绍如何使用Python开发框架Django进行性能优化,以提高应用程序的运行速度。我们将探讨一系列的技巧和最佳实践,帮助你优化Django应用程序的性能,从而提供更好的用户体验。1.概述在当今的数字化时代,应用......
  • 199、扩展Django之力:第三方库集成指南
    Python开发框架Django之Django插件与扩展:第三方库的使用与集成本文将介绍如何在Django项目中使用和集成第三方库,以扩展Django的功能,提高开发效率。我们将讨论Django插件的概念,如何选择合适的第三方库,以及如何将第三方库集成到Django项目中。1.Django插件与扩展的概念在......
  • Forgotten password(内存取证练习)
    vol.py-f'/root/桌面/raw'imageinfo--查看镜像信息Filescan直接找flag关键字命令vol.py-f'/root/桌面/raw'--profile=Win7SP1x86_23418filescan|grep'flag'然后dumpfiles导出压缩包命令vol.py-f'/root/桌面/raw'--profile=Win7SP1x86_23418d......
  • Golang学习笔记(1):包管理
    Golang学习笔记(1):包管理本人学习Golang主要是为了做MIT6.824的lab,然而一上来就被Golang神奇的import搞混了,因此写一篇博客记录学习Golang的包管理的过程。packagemainimport"fmt"funcmain(){fmt.Println("hello,world")}如果有编程基础肯定会觉得这段代码很好理......
  • MongoDB分片部署(windows)
    OS:win10MongoDB:4.4.24伪分布式从图中可以看出,分片集群中主要由三个部分组成,即分片服务器(Shard)、路由服务器(Mongos)以及配置服务器(ConfigServer)组成。其中,分片服务器有三个,即Shard1、Shard2、Shard3;路由服务器有两个,即Mongos1和Mongos2;配置服务器有三个,即......
  • 【go】【rpc】【同一端口,提供多种服务】
    @目录写在前面1.需求1.起另外的服务端口2.一个端口监听3.同一个端口相同方法监听参考资料基础/标准库/第三方库golang导航编程规范算法|面试项目写在前面相关博文个人博客首页免责声明:仅供学习交流使用!开源框架可能存在的风险和相关后果将完全由用户自行承担,本人不承担......