鸟窝

Go中秘而不宣的数据结构 runq, 难怪运行时调度那么好

2024-10-20T04:17:47.000Z

首先，让我们先来回顾 Go 运行时的 GPM 模型。这方面的介绍网上的资料都非常非常多了，但是我们也不妨回顾一下：

GPM模型中的G代表goroutine。每个goroutine只占用几KB的内存,可以轻松创建成千上万个。G包含了goroutine的栈、指令指针和其他信息,如阻塞channel的等待队列等。

P代表processor,可以理解为一个抽象的CPU核心。P的数量默认等于实际的CPU核心数,但可以通过环境变量进行调整。P维护了一个本地的goroutine队列,还负责执行goroutine并管理与之关联的上下文信息。

M代表machine,是操作系统线程。一个M必须绑定一个P才能执行goroutine。当一个M阻塞时,运行时会创建一个新的M或者复用一个空闲的M来保证P的数量总是等于GOMAXPROCS的值,从而充分利用CPU资源。

在这个模型中,P扮演了承上启下的角色。它连接了G和M,实现了用户层级的goroutine到操作系统线程的映射。这种设计允许Go在用户空间进行调度,避免了频繁的系统调用,大大提高了并发效率。

调度过程中,当一个goroutine被创建时,它会被放到P的本地队列或全局队列中。如果P的本地队列已满,一些goroutine会被放到全局队列。当P执行完当前的goroutine后,会优先从本地队列获取新的goroutine来执行。如果本地队列为空,P会尝试从全局队列或其他P的队列中偷取goroutine。

这种工作窃取(work-stealing)算法确保了负载的动态平衡。当某个P的本地队列为空时,它可以从其他P的队列中窃取一半的goroutine,这有效地平衡了各个P之间的工作负载。

Go 运行时这么做，主要还是减少 P 之间对获取 goroutine 之间的竞争。本地队列 runq 主要由持有它的 P 进行读写，只有在"被偷"的情况下，才可能有"数据竞争"的问题，而这种情况发生概率较少，所以它设计了一个高效的 runq 数据结构来应对这么场景。实际看起来和上面介绍的 PoolDequeue 有异曲同工之妙。

本文还会介绍 global queue 等数据结构，但不是本文的重点。

runq

在运行时中 P 是一个复杂的数据结构，下面列出了本文关注的它的几个字段:

// 一个goroutine的指针
type guintptr uintptr
//go:nosplit
func (gp guintptr) ptr() *g { return (*g)(unsafe.Pointer(gp)) }
//go:nosplit
func (gp *guintptr) set(g *g) { *gp = guintptr(unsafe.Pointer(g)) }
//go:nosplit
func (gp *guintptr) cas(old, new guintptr) bool {
	return atomic.Casuintptr((*uintptr)(unsafe.Pointer(gp)), uintptr(old), uintptr(new))
}
type p struct {
	id          int32
	status      uint32 // one of pidle/prunning/...
	link        puintptr
	schedtick   uint32     // incremented on every scheduler call
	syscalltick uint32     // incremented on every system call
	sysmontick  sysmontick // last tick observed by sysmon
	m           muintptr   // back-link to associated m (nil if idle)
	mcache      *mcache
	pcache      pageCache
	raceprocctx uintptr
	deferpool    []*_defer // pool of available defer structs (see panic.go)
	deferpoolbuf [32]*_defer
	// Cache of goroutine ids, amortizes accesses to runtime·sched.goidgen.
	goidcache    uint64
	goidcacheend uint64
	// 本地运行的无锁循环队列
	runqhead uint32
	runqtail uint32
	runq     [256]guintptr
	// 如果非nil，是一个可优先运行的G
	runnext guintptr
	...
}

runq 是一个无锁循环队列，由数组实现，它的长度是 256，这个长度是固定的，不会动态调整。runqhead 和 runqtail 分别是队列的头和尾，runqhead 指向队列的头部，runqtail 指向队列的尾部。
runq 数组的每个元素是一个 guintptr 类型，它是一个 uintptr 类型的别名，用来存储 g 的指针。

runq 的操作主要是 runqput、runqputslow、runqputbatch、runqget、runqdrain、runqgrab、runqsteal等方法。

接下来我们捡重点的方法看一下它是怎么实现高效额度并发读写的.

runqput

runqput 方法是向 runq 中添加一个 g 的方法，它是一个无锁的操作，不会阻塞。它的实现如下：

// runqput 尝试将 g 放到本地可运行队列上。
// 如果 next 为 false，runqput 将 g 添加到可运行队列的尾部。
// 如果 next 为 true，runqput 将 g 放在 pp.runnext 位置。
// 如果可运行队列已满，runnext 将 g 放到全局队列上。
// 只能由拥有 P 的所有者执行。
func runqput(pp *p, gp *g, next bool) {
	if !haveSysmon && next {
        // 如果没有 sysmon，我们必须完全避免 runnext，否则会导致饥饿。
		next = false
	}
	if randomizeScheduler && next && randn(2) == 0 {
        // 如果随机调度器打开，我们有一半的机会避免运行 runnext
		next = false
	}
    // 如果 next 为 true，优先处理 runnext
    // 将当前的goroutine放到 runnext 中, 如果原来runnext中有goroutine, 则将其放到runq中
	if next {
	retryNext:
		oldnext := pp.runnext
		if !pp.runnext.cas(oldnext, guintptr(unsafe.Pointer(gp))) {
			goto retryNext
		}
		if oldnext == 0 {
			return
		}
		// Kick the old runnext out to the regular run queue.
		gp = oldnext.ptr()
	}
    // 重点来了，将goroutine放入runq中
retry:
	h := atomic.LoadAcq(&pp.runqhead) // ①
	t := pp.runqtail
	if t-h < uint32(len(pp.runq)) { // ② 如果队列未满
		pp.runq[t%uint32(len(pp.runq))].set(gp) // ③ 将goroutine放入队列
		atomic.StoreRel(&pp.runqtail, t+1) // ④ 更新队尾
		return
	}
	if runqputslow(pp, gp, h, t) { // ⑤ 如果队列满了，调用runqputslow 尝试将goroutine放入全局队列
		return
	}
	// 如果队列未满，上面的操作应该已经成功返回，否则重试
	goto retry
}

runqput 方法的实现非常简单，它首先判断是否需要优先处理 runnext，如果需要，就将 g 放到 runnext 中，然后再将 g 放到 runq 中。
runq 的操作是无锁的，它通过 atomic 包提供的原子操作来实现。
这里使用的内部的更精细化的原子操作，这个也是我后面专门有一篇文章来讲解的。你现在大概把①、④ 理解为Load、Store操作即可。

②、⑤ 分别处理本地队列未满和队列已满的情况，如果队列未满，就将 g 放到队列中，然后更新队尾；如果队列已满，就调用 runqputslow 方法，将 g 放到全局队列中。

③ 处直接将 g 放到队列中，这是因为只有当前的 P 才能操作 runq，所以不会有并发问题。
同时我们也可以看到，我们总是往尾部插入, t总是一直增加的，取余操作保证了循环队列的特性。

runqputslow 会把本地队列中的一半的 g 放到全局队列中，包括当前要放入的 g。一旦涉及到全局队列，就会有一定的竞争，Go运行时使用了一把锁来控制并发，所以 runqputslow 方法是一个慢路径，是性能的瓶颈点。

runqputbatch

func runqputbatch(pp *p, q *gQueue, qsize int) 是批量往本地队列中放入 g 的方法，比如它从其它 P 那里偷来一批 g ，需要放到本地队列中，就会调用这个方法。它的实现如下：

// runqputbatch 尝试将 q 上的所有 G 放到本地可运行队列上。
// 如果队列已满，它们将被放到全局队列上；在这种情况下，这将暂时获取调度器锁。
// 只能由拥有 P 的所有者执行。
func runqputbatch(pp *p, q *gQueue, qsize int) {
	h := atomic.LoadAcq(&pp.runqhead) // ①
	t := pp.runqtail
	n := uint32(0)
	for !q.empty() && t-h < uint32(len(pp.runq)) { // ② 放入的批量goroutine非空， 并且本地队列还足以放入
		gp := q.pop()
		pp.runq[t%uint32(len(pp.runq))].set(gp)
		t++
		n++
	}
	qsize -= int(n)
	if randomizeScheduler { // ③ 随机调度器, 随机打乱
		off := func(o uint32) uint32 {
			return (pp.runqtail + o) % uint32(len(pp.runq))
		}
		for i := uint32(1); i < n; i++ {
			j := cheaprandn(i + 1)
			pp.runq[off(i)], pp.runq[off(j)] = pp.runq[off(j)], pp.runq[off(i)]
		}
	}
	atomic.StoreRel(&pp.runqtail, t) // ④ 更新队尾
	if !q.empty() {
		lock(&sched.lock)
		globrunqputbatch(q, int32(qsize))
		unlock(&sched.lock)
	}
}

①获取队列头,使用原子操作获取队头。

它下面一行是获取队尾的值，你可以思考下为什么不需要使用atomic.LoadAcq。

② 逐个的将 g 放到队列中，直到放完或者放满。

如果是随机调度器，则使用混淆算法将队列中的 g 随机打乱。

最后如果队列还有剩余的 g，则调用 globrunqputbatch 方法，将剩余的 g 放到全局队列中。

runqget

runqget 方法是从 runq 中获取一个 g 的方法，它是一个无锁的操作，不会阻塞。它的实现如下：

// runqget 从本地可运行队列中获取一个 G。
// 如果 inheritTime 为 true，gp 应该继承当前时间片的剩余时间。
// 否则，它应该开始一个新的时间片。
// 只能由拥有 P 的所有者执行。
func runqget(pp *p) (gp *g, inheritTime bool) {
	next := pp.runnext
    // 如果有 runnext，优先处理 runnext
	if next != 0 && pp.runnext.cas(next, 0) { // ①
		return next.ptr(), true
	}
	for {
		h := atomic.LoadAcq(&pp.runqhead) // ② 获取队头
		t := pp.runqtail
		if t == h { // ③ 队列为空
			return nil, false
		}
		gp := pp.runq[h%uint32(len(pp.runq))].ptr() // ④ 获取队头的goroutine
		if atomic.CasRel(&pp.runqhead, h, h+1) { // ⑤ 更新队头
			return gp, false
		}
	}
}

① 如果有 runnext，则优先处理 runnext，将 runnext 中的 g 取出来。

② 获取队列头。如果 ③ 队列为空，直接返回。

④ 获取队头的 g，这就是要读取的 g。

⑤ 更新队头，这里使用的是 atomic.CasRel 方法，它是一个原子的 Compare-And-Swap 操作，用来更新队头。

可以看到这里只使用到了队列头runqhead。

runqdrain

runqdrain 方法是从 runq 中获取所有的 g 的方法，它是一个无锁的操作，不会阻塞。它的实现如下：

// runqdrain 从 pp 的本地可运行队列中获取所有的 G 并返回。
// 只能由拥有 P 的所有者执行。
func runqdrain(pp *p) (drainQ gQueue, n uint32) {
	oldNext := pp.runnext
	if oldNext != 0 && pp.runnext.cas(oldNext, 0) {
		drainQ.pushBack(oldNext.ptr()) // ① 将 runnext 中的goroutine放入队列
		n++
	}
retry:
	h := atomic.LoadAcq(&pp.runqhead) // ② 获取队头
	t := pp.runqtail
	qn := t - h
	if qn == 0 {
		return
	}
	if qn > uint32(len(pp.runq)) { // ③ 居然超出队列的长度了？
		goto retry
	}
	if !atomic.CasRel(&pp.runqhead, h, h+qn) { // ④ 更新队头
		goto retry
	}
    // ⑤ 将队列中的goroutine放入队列drainQ中
	for i := uint32(0); i < qn; i++ {
		gp := pp.runq[(h+i)%uint32(len(pp.runq))].ptr()
		drainQ.pushBack(gp)
		n++
	}
	return
}

runqgrab

runqgrab 方法是从 runq 中获取一半的 g 的方法，它是一个无锁的操作，不会阻塞。它的实现如下：

// runqgrab 从 pp 的本地可运行队列中获取一半的 G 并返回。
// Batch 是一个环形缓冲区，从 batchHead 开始。
// 返回获取的 goroutine 数量。
// 可以由任何 P 执行。
func runqgrab(pp *p, batch *[256]guintptr, batchHead uint32, stealRunNextG bool) uint32 {
	for {
		h := atomic.LoadAcq(&pp.runqhead) // load-acquire, synchronize with other consumers
		t := atomic.LoadAcq(&pp.runqtail) // load-acquire, synchronize with the producer
		n := t - h
		n = n - n/2 // ① 取一半的goroutine
		if n == 0 {
			if stealRunNextG {
                // ② 如果要偷取runnext中的goroutine
				if next := pp.runnext; next != 0 {
					if pp.status == _Prunning {
                        // ② 如果要偷取runnext中的goroutine，这里会sleep一会
						if !osHasLowResTimer {
							usleep(3)
						} else {
							osyield()
						}
					}
					if !pp.runnext.cas(next, 0) {
						continue
					}
					batch[batchHead%uint32(len(batch))] = next
					return 1
				}
			}
			return 0
		}
		if n > uint32(len(pp.runq)/2) { // ③ 如果要偷取的goroutine数量超过一半, 重试
			continue
		}
        // ④ 将队列中至多一半的goroutine放入batch中
		for i := uint32(0); i < n; i++ {
			g := pp.runq[(h+i)%uint32(len(pp.runq))]
			batch[(batchHead+i)%uint32(len(batch))] = g
		}
		if atomic.CasRel(&pp.runqhead, h, h+n) { // ⑤ 更新队头
			return n
		}
	}
}

① 取一半的 g，这里是一个简单的算法，取一半的 g。

② 如果要偷取 runnext 中的 g，则会尝试偷取 runnext 中的 g。

③ 如果要偷取的 g 数量超过一半，则重试。

④ 将队列中至多一半的 g 放入 batch 中。

⑤ 更新队头，这里使用的是 atomic.CasRel 方法，它是一个原子的 Compare-And-Swap 操作，用来更新队头。

runqsteal

runqsteal 方法是从其它 P 的 runq 中偷取 g 的方法，它是一个无锁的操作，不会阻塞。它的实现如下：

// runqsteal 从 p2 的本地可运行队列中偷取一半的 G 并返回。
// 如果 stealRunNextG 为 true，它还会尝试偷取 runnext 中的 G。
func runqsteal(pp, p2 *p, stealRunNextG bool) *g {
	t := pp.runqtail
	n := runqgrab(p2, &pp.runq, t, stealRunNextG) // ① 从p2中偷取一半的goroutine
	if n == 0 {
		return nil
	}
	n--
	gp := pp.runq[(t+n)%uint32(len(pp.runq))].ptr() // ② 获取偷取的一个goroutine
	if n == 0 {
		return gp
	}
	h := atomic.LoadAcq(&pp.runqhead) // ③ 获取队头
	if t-h+n >= uint32(len(pp.runq)) { // ④ 如果队列满了，重置队列
		throw("runqsteal: runq overflow")
	}
	atomic.StoreRel(&pp.runqtail, t+n) // ⑤ 更新队尾
	return gp
}

它实际使用了 runqgrab 方法来偷取 g，然后再从 runq 中取出一个 g。

以上就是runq的主要操作，它针对Go调度器的特点，设计了一套特定的队列操作的函数，这些函数都是无锁的，不会阻塞，保证了高效的并发读写。

`gQueue` 和 `gList`

gQueue 和 gList 是 Go 运行时中的两个队列，它们都是用来存储 g 的，但是它们的实现方式不同。

gQueue是一个G的双端队列，可以从首尾增加gp, 通过g.schedlink链接。一个G只能在一个gQueue或gList上。

type gQueue struct {
	head guintptr
	tail guintptr
}
func (q *gQueue) empty() bool {
	return q.head == 0
}
// push 将gp添加到q的头部。
func (q *gQueue) push(gp *g) {
	gp.schedlink = q.head
	q.head.set(gp)
	if q.tail == 0 {
		q.tail.set(gp)
	}
}
// pushBack 增加gp到q的尾部。
func (q *gQueue) pushBack(gp *g) {
	gp.schedlink = 0
	if q.tail != 0 {
		q.tail.ptr().schedlink.set(gp)
	} else {
		q.head.set(gp)
	}
	q.tail.set(gp)
}
// q2的所有G添加到q的尾部。之后不能再使用q2。
func (q *gQueue) pushBackAll(q2 gQueue) {
	if q2.tail == 0 {
		return
	}
	q2.tail.ptr().schedlink = 0
	if q.tail != 0 {
		q.tail.ptr().schedlink = q2.head
	} else {
		q.head = q2.head
	}
	q.tail = q2.tail
}
// pop 移除并返回队列q的头部。如果q为空，则返回nil。
func (q *gQueue) pop() *g {
	gp := q.head.ptr()
	if gp != nil {
		q.head = gp.schedlink
		if q.head == 0 {
			q.tail = 0
		}
	}
	return gp
}
// popList 将所有的元素从队列q中取出并返回一个gList。
func (q *gQueue) popList() gList {
	stack := gList{q.head}
	*q = gQueue{}
	return stack
}

而gList是一个G的链表，通过g.schedlink链接。一个G只能在一个gQueue或gList上。

type gList struct {
	head guintptr
}
func (l *gList) empty() bool {
	return l.head == 0
}
// push 将gp添加到l的头部。
func (l *gList) push(gp *g) {
	gp.schedlink = l.head
	l.head.set(gp)
}
// pushAll 将q中的所有G添加到l的头部。
func (l *gList) pushAll(q gQueue) {
	if !q.empty() {
		q.tail.ptr().schedlink = l.head
		l.head = q.head
	}
}
// pop 移除并返回l的头部。如果l为空，则返回nil。
func (l *gList) pop() *g {
	gp := l.head.ptr()
	if gp != nil {
		l.head = gp.schedlink
	}
	return gp
}

这是常规的数据结构中链表的实现，你可以和教科书中的介绍和实现做对比，看看书本中的内容如何应用到显示的工程中的。

global runq

一个全局的runq用来处理太多的goroutine, 在本地runq中的goroutine太少的情况下，从全局队列中偷取goroutine。
主要用来处理P中goroutine不均的情况。

因为它直接使用一把锁(sched.lock)，而不是lock-free的数据结构，所以代码阅读和理解起来会相对简单一些。这里就不详细介绍了


var (
	sched      schedt
)
type schedt struct {
	...
	// Global runnable queue.
	runq     gQueue
	runqsize int32
    ...
}
func globrunqput(gp *g) {
	assertLockHeld(&sched.lock) // 保证锁被持有
	sched.runq.pushBack(gp)
	sched.runqsize++
}
func globrunqputhead(gp *g) {
	assertLockHeld(&sched.lock) // 保证锁被持有
	sched.runq.push(gp)
	sched.runqsize++
}
func globrunqputbatch(batch *gQueue, n int32) {
	assertLockHeld(&sched.lock) // 保证锁被持有
	sched.runq.pushBackAll(*batch)
	sched.runqsize += n
	*batch = gQueue{}
}
func globrunqget(pp *p, max int32) *g {
	assertLockHeld(&sched.lock) // 保证锁被持有
	if sched.runqsize == 0 { // 如果全局队列为空
		return nil
	}
	n := sched.runqsize/gomaxprocs + 1 // 从全局队列中获取goroutine的数量
	if n > sched.runqsize {
		n = sched.runqsize
	}
	if max > 0 && n > max { // 如果max大于0，取最小值
		n = max
	}
	if n > int32(len(pp.runq))/2 { // 如果要获取的goroutine数量超过一半，只取一半，不贪婪
		n = int32(len(pp.runq)) / 2
	}
	sched.runqsize -= n
	gp := sched.runq.pop() // 从全局队列中获取一个goroutine
	n--
	for ; n > 0; n-- { // 从全局队列中获取n-1个goroutine
		gp1 := sched.runq.pop()
		runqput(pp, gp1, false) // 将goroutine放入本地队列
	}
	return gp // 返回获取的goroutine
}

Go中秘而不宣的数据结构 spmc, 10倍性能于 channel

2024-10-20T04:14:44.000Z

Go 标准库和运行中中，有一些专门针对特定场景优化的数据结构，这些数据结构并没有暴露出来，这个系列就是逐一介绍这些数据结构。

这一次给大家介绍的就是一个 lock-free、高性能的单生产者多消费者的队列：PoolDequeue 和 PoolChain。
到底是一个还是两个呢？
主要是 PoolDequeue, 它是一个固定尺寸，使用 ringbuffer (环形队列) 方式实现的队列。
PoolChain 是在它的基础上上，实现的一个动态尺寸的队列。

生产者消费者模式是常见的一种并发模式，根据生产者的数量和消费者的数量，可以分为四种情况：

单生产者-单消费者模式: spsc
单生产者-多消费者模式: spmc
多生产者-单消费者模式: mpsc
多生产者-多消费者模式: mpmc

Channel 基本上可以看做是一种多生产者多消费者模式的队列。可以同时允许多个生产者发送数据，有可以允许多个消费者消费数据，它也可以应用在其他模式的场景，比如 rpc 包中的 oneshot 模式、通知情况下的的单生产者多消费者模式、rpc 和服务端单连接通讯时的消息处理，就是多生产者单消费者模式。

但是 Go 标准库的 sync 包下，有一个针对单生产者多消费者的数据结构，它是一个 lock-free 的数据结构，针对这个场景做了优化，被使用在 sync.Pool 中。

sync.Pool 采用了一种类似 Go 运行时调度的机制，针对每个 p 有一个 private 的数据，同时还有一个 shared 的数据，如果在本地 private、shared 中没有数据，就去其他 P 对应的 shared 去偷取。难么同时可能有多个 P 偷取同一个 shared, 这是多消费者。

同时对 shared 的写只有它隶属的 p 执行 Put 的时候才会发生：

l, _ := p.pin()
if l.private == nil {
	l.private = x
} else {
	l.shared.pushHead(x)
}
runtime_procUnpin()

这有属于单生产者模式。sync.Pool 使用了 PoolDequeue 和 PoolChain 来做优化。

首先我们先来了解 poolDequeue。

poolDequeue

poolDequeue 是一个 lock-free 的数据结构，必然会使用 atomic, 同时它要求必须使用单生产者，否则会有并发问题。消费者可以是并发多个，当然你用一个也没问题。

其中，生产者可以使用下面的方法：

pushHead: 在队列头部新增加一个数据。如果队列满了，增加失败
popHead：在队列头部弹出一个数据。生产者总是弹出新增加的数据，除非队列为空

消费者可以使用下面的一个方法：

popTail: 从队尾处弹出一个数据，除非队列为空。所以消费者总是消费最老的数据，这也正好符合大部分的场景

接下来就是分析代码了，有点枯燥，你可以跳过。

代码分析

首先我们看这个struct的定义：

type poolDequeue struct {
	headTail atomic.Uint64
	vals []eface
}

这里有两个重要的字段：

headTail：一个 atomic.Uint64 类型的字段，它的高 32 位是 head，低 32 位是 tail。head 是下一个要填充的位置，tail 是最老的数据的位置。
vals：一个 eface 类型的切片，它是一个环形队列，大小必须是 2 的幂次方。

生产者增加数据的逻辑如下：

func (d *poolDequeue) pushHead(val any) bool {
	ptrs := d.headTail.Load()
	head, tail := d.unpack(ptrs)
	if (tail+uint32(len(d.vals)))&(1<-1) == head {
		// 队列满
		return false
	}
	slot := &d.vals[head&uint32(len(d.vals)-1)]
    // 检查 head slot 是否被 popTail 释放
	typ := atomic.LoadPointer(&slot.typ)
	if typ != nil {
        // 另一个 goroutine 正在清理 tail，所以队列还是满的
		return false
	}
    // 如果值为空，那么设置一个特殊值
	if val == nil {
		val = dequeueNil(nil)
	}
    // 队列头是空的，将数据写入 slot
	*(*any)(unsafe.Pointer(slot)) = val // ①
    // 增加 head，这样 popTail 就可以消费这个 slot 了
    // 同时也是一个 store barrier，保证了 slot 的写入
	d.headTail.Add(1 << dequeueBits)
	return true
}

① 处会有并发问题吗？万一有两个 goroutine 同时执行到这里，会不会有问题？这里没有问题，因为要求只有一个生产者，不会有另外一个goroutine同时写这个槽位。

注意它还实现了pack和unpack方法，用于将 head 和 tail 打包到一个 uint64 中，或者从 uint64 中解包出 head 和 tail。

消费者消费数据的逻辑如下：

func (d *poolDequeue) popTail() (any, bool) {
	var slot *eface
	for { // ②
		ptrs := d.headTail.Load()
		head, tail := d.unpack(ptrs)
		if tail == head {
			// 队列为空
			return nil, false
		}
        // 确认头部和尾部（用于我们之前的推测性检查），并递增尾部。如果成功，那么我们就拥有了尾部的插槽。
		ptrs2 := d.pack(head, tail+1)
		if d.headTail.CompareAndSwap(ptrs, ptrs2) {
			// 成功读取了一个 slot
			slot = &d.vals[tail&uint32(len(d.vals)-1)]
			break
		}
	}
	// 剩下来就是读取槽位的值
	val := *(*any)(unsafe.Pointer(slot))
	if val == dequeueNil(nil) { // 如果本身就存储的nil
		val = nil
	}
    // 释放 slot，这样 pushHead 就可以继续写入这个 slot 了
	slot.val = nil // ③
	atomic.StorePointer(&slot.typ, nil) // ④
	
	return val, true
}

② 处是一个 for 循环，这是一个自旋的过程，直到成功读取到一个 slot 为止。在有大量的goroutine的时候，这里可能会是一个瓶颈点，但是少量的消费者应该还不算大问题。

③ 和 ④ 处是释放 slot 的过程，这样生产者就可以继续写入这个 slot 了。

生产者还可以调用popHead方法，用来弹出刚刚压入还没有消费的数据:

func (d *poolDequeue) popHead() (any, bool) {
	var slot *eface
	for {
		ptrs := d.headTail.Load()
		head, tail := d.unpack(ptrs)
		if tail == head {
			// 队列为空
			return nil, false
		}
        // 确认头部和尾部（用于我们之前的推测性检查），并递减头部。如果成功，那么我们就拥有了头部的插槽。
		head--
		ptrs2 := d.pack(head, tail)
		if d.headTail.CompareAndSwap(ptrs, ptrs2) {
            // 成功取回了一个 slot
			slot = &d.vals[head&uint32(len(d.vals)-1)]
			break
		}
	}
	val := *(*any)(unsafe.Pointer(slot))
	if val == dequeueNil(nil) {
		val = nil
	}
	
    // 释放 slot，这样 pushHead 就可以继续写入这个 slot 了
	*slot = eface{}
	return val, true
}

这是一个固定大小的队列，如果队列满了，生产者就会失败。这个队列的大小是 2 的幂次方，这样可以用 & 来取模，而不用 %，这样可以提高性能。

PoolChain

PoolChain 是在 PoolDequeue 的基础上实现的一个动态尺寸的队列，它的实现和 PoolDequeue 类似，只是增加了一个 headTail 的链表，用于存储多个 PoolDequeue。

type poolChain struct {
    // head 是生产者用来push的 poolDequeue。只有生产者访问，所以不需要同步
	head *poolChainElt
    // tail 是消费者用来pop的 poolDequeue。消费者访问，所以需要原子操作
	tail atomic.Pointer[poolChainElt]
}
type poolChainElt struct {
	poolDequeue
    // next由生产者原子写入，消费者原子读取。它只能从nil转换为非nil。
    // prev由消费者原子写入，生产者原子读取。它只能从非nil转换为nil。
	next, prev atomic.Pointer[poolChainElt]
}

考虑到文章中代码过多，大家就会感觉很枯燥了，我就不具体展示代码了，你可以在 https://github.com/golang/go/blob/master/src/sync/poolqueue.go#L220-L302 查看具体的实现。
整体的思想就是将多个poolDequeue串联起来，生产者在head处增加数据，消费者在tail处消费数据，当tail的poolDequeue为空时，就从head处获取一个poolDequeue。
当head满了的时候，就增加一个新的poolDequeue。
这样就实现了动态尺寸的队列。

sync.Pool中就是使用的PoolChain来实现的，它是一个单生产者多消费者的队列，可以同时有多个消费者消费数据，但是只有一个生产者生产数据。

为了能将这个数据结构暴露出来使用，我把相关的代码复制到 https://github.com/smallnest/exp/blob/master/gods/poolqueue.go , 增加了单元测试和性能测试的代码。

你可以学到这个方法，使用类似的技术，创建一个 look-free 无线长度的 byte buffer。在一些 Go 的网络优化库中就使用这种方法，避免频繁的 grow 和 copy 既有数据。

与channel的性能比较

我们来看一下poolDequeue、PoolChain和channel的性能对比。
我们使用一个goroutine进行写入，10个goroutine进行读取：

package gods
import (
	"sync"
	"testing"
)
func BenchmarkPoolDequeue(b *testing.B) {
	const size = 1024
	pd := NewPoolDequeue(size)
	var wg sync.WaitGroup
	// Producer
	go func() {
		for i := 0; i < b.N; i++ {
			pd.PushHead(i)
		}
		wg.Done()
	}()
	// Consumers
	numConsumers := 10
	wg.Add(numConsumers + 1)
	for i := 0; i < numConsumers; i++ {
		go func() {
			for {
				if _, ok := pd.PopTail(); !ok {
					break
				}
			}
			wg.Done()
		}()
	}
	wg.Wait()
}
func BenchmarkPoolChain(b *testing.B) {
	pc := NewPoolChain()
	var wg sync.WaitGroup
	// Producer
	go func() {
		for i := 0; i < b.N; i++ {
			pc.PushHead(i)
		}
		wg.Done()
	}()
	// Consumers
	numConsumers := 10
	wg.Add(numConsumers + 1)
	for i := 0; i < numConsumers; i++ {
		go func() {
			for {
				if _, ok := pc.PopTail(); !ok {
					break
				}
			}
			wg.Done()
		}()
	}
	wg.Wait()
}
func BenchmarkChannel(b *testing.B) {
	ch := make(chan interface{}, 1024)
	var wg sync.WaitGroup
	// Producer
	go func() {
		for i := 0; i < b.N; i++ {
			ch <- i
		}
		close(ch)
		wg.Done()
	}()
	// Consumers
	numConsumers := 10
	wg.Add(numConsumers + 1)
	for i := 0; i < numConsumers; i++ {
		go func() {
			for range ch {
			}
			wg.Done()
		}()
	}
	wg.Wait()
}

运行这个benchmark,我们可以看到poolDequeue和PoolChain的性能要比channel高很多，大约是channel的10倍。
poolDequeue 比 PoolChain 要好一些，性能是后者的两倍。

在 Rust 中同时支持异步和同步代码

2024-08-28T00:30:43.000Z

来，过路人，请坐到我身边来，听老衲讲一讲我对 Rust 过分要求的故事。

介绍

想象一下,你打算用Rust创建一个新库。这个库的唯一功能就是封装一个你需要的公共API, 比如 Spotify API或者 ArangoDB 之类的数据库。这并不是造火箭，你也不是在发明什么新东西或者处理复杂的算法,所以你认为这应该相对简单直接。

你决定用异步方式实现这个库。你的库中大部分工作都涉及执行HTTP请求,主要是I/O操作,所以使用异步是有道理的(而且,这也是Rust圈里现在的潮流)。你开始编码,几天后就准备好了v0.1.0版本。当 cargo publish 成功完成并将你的作品上传到 crates.io 时,你暗自得意地想: "不错嘛"。

几天过去了,你在GitHub上收到了一个新通知。有人提了一个问题:

我如何同步使用这个库？

我的项目不使用异步,因为对我的需求来说太复杂了。我想尝试你的新库,但不确定怎么轻松地使用它。我不想在代码中到处使用 block_on(endpoint())。。我见过像 reqwest 这样的 crate导出一个 blocking模块，提供完全相同的功能,你能不能也这么做?

从底层来看,这听起来是个很复杂的任务。为异步代码(需要像 tokio 这样的运行时、awaiting future、pinning等)和普通的同步代码提供一个通用接口?好吧,既然他们提出请求的态度很好,也许我们可以试试。毕竟,代码中唯一的区别就是 async 和 await 关键字的出现,因为你没有做什么花哨的事情。

好吧，这或多或少就是crate 发生的事情 rspotify ，我曾经和它的创建者 Ramsay 一起维护它。对于那些不知道的人来说，它是 Spotify Web API 的一个包装器。对不了解的人来说,这是一个Spotify Web API的封装。说明一下,我最终确实实现了这个功能,尽管不如我希望的那么干净利落;我会在Rspotify系列的这篇新文章中试图解释这个情况。

第一种方法

为了提供更多背景信息，Rspotify 的客户端大致如下：

struct Spotify { /* ... */ }
impl Spotify {
    async fn some_endpoint(&self, param: String) -> SpotifyResult {
        let mut params = HashMap::new();
        params.insert("param", param);
        self.http.get("/some-endpoint", params).await
    }
}

本质上，我们需要让 some_endpoint 同时支持异步和阻塞两种使用方式。这里的关键问题是，当你有几十个端点时，你该如何实现这一点？而且，你怎样才能让用户在异步和同步之间轻松切换呢？

老掉牙的复制粘贴大法

这是最初实现的方法。它相当简单，而且确实能用。你只需要把常规的客户端代码复制到 Rspotify 的一个新的 blocking模块里。reqwest（我们用的 HTTP 客户端）和 reqwest::blocking 共用一个接口，所以我们可以在新模块里手动删掉 async 或 .await 这样的关键字，然后把 reqwest 的导入改成 reqwest::blocking。

这样一来，Rspotify 的用户只需要用 rspotify::blocking::Client 替代 rspotify::Client，瞧！他们的代码就变成阻塞式的了。这会让只用异步的用户的二进制文件变大，所以我们可以把它放在一个叫 blocking 的特性开关后面，大功告成。

不过，问题后来就变得明显了。整个 crate 的一半代码都被复制了一遍。添加或修改一个端点就意味着要写两遍或删两遍所有东西。

除非你把所有东西都测试一遍，否则没法确保两种实现是等效的。这主意倒也不坏，但说不定你连测试都复制粘贴错了呢！那可怎么办？可怜的代码审查员得把同样的代码读两遍，确保两边都没问题 —— 这听起来简直就是人为错误的温床。

根据我们的经验，这确实大大拖慢了 Rspotify 的开发进度，尤其是对于不习惯这种折腾的新贡献者来说。作为 Rspotify 的一个新晋且热情的维护者，我开始研究其他可能的解决方案。

召唤 `block_on`

第二种方法是把所有东西都在异步那边实现。然后，你只需为阻塞接口做个包装，在内部调用 block_on。block_on 会运行 future 直到完成，本质上就是把它变成同步的。你仍然需要复制方法的定义，但实现只需写一次：

mod blocking {
    struct Spotify(super::Spotify);
    impl Spotify {
        fn endpoint(&self, param: String) -> SpotifyResult {
            runtime.block_on(async move {
                self.0.endpoint(param).await
            })
        }
    }
}

请注意，为了调用block_on，您首先必须在端点方法中创建某种运行时。例如，使用tokio ：

let mut runtime = tokio::runtime::Builder::new()
    .basic_scheduler()
    .enable_all()
    .build()
    .unwrap();

这就引出了一个问题：我们是应该在每次调用端点时都初始化运行时，还是有办法共享它呢？我们可以把它保存为一个全局变量（呃，真恶心），或者更好的方法是，我们可以把运行时保存在 Spotify 结构体中。但是由于它需要对运行时的可变引用，你就得用 Arc> 把它包起来，这样一来就完全扼杀了客户端的并发性。正确的做法是使用 Tokio 的 Handle，大概是这样的：

use tokio::runtime::Runtime;
lazy_static! { // You can also use `once_cell`
    static ref RT: Runtime = Runtime::new().unwrap();
}
fn endpoint(&self, param: String) -> SpotifyResult {
    RT.handle().block_on(async move {
        self.0.endpoint(param).await
    })
}

虽然使用 handle 确实让我们的阻塞客户端更快了^1，但还有一种性能更高的方法。如果你感兴趣的话，这正是 reqwest 自己采用的方法。简单来说，它会生成一个线程，这个线程调用 block_on 来等待一个装有任务的通道 [^2] (https://nullderef.com/blog/rust-async-sync/#block-on-channels) [^3] (https://nullderef.com/blog/rust-async-sync/#block-on-reqwest)。

不幸的是，这个解决方案仍然有相当大的开销。你需要引入像 futures 或 tokio 这样的大型依赖，并将它们包含在你的二进制文件中。所有这些，就是为了...最后还是写出阻塞代码。所以这不仅在运行时有成本，在编译时也是如此。这在我看来就是不对劲。

而且你仍然有不少重复代码，即使只是定义，积少成多也是个问题。reqwest 是一个巨大的项目，可能负担得起他们的 blocking 模块的开销。但对于像 rspotify 这样不那么流行的 crate 来说，这就难以实现了。

复制 crate

另一种可能的解决方法是，正如 features 文档所建议的那样，创建独立的 crate。我们可以有 rspotify-sync 和 rspotify-async，用户可以根据需要选择其中一个作为依赖，甚至如果需要的话可以两个都用。问题是 —— 又来了 —— 我们究竟该如何生成这两个版本的 crate 呢？即使使用 Cargo 的一些技巧，比如为每个 crate 准备一个 Cargo.toml 文件（这种方法本身就很不方便），我也无法在不复制粘贴整个 crate 的情况下做到这一点。

采用这种方法，我们甚至无法使用过程宏，因为你不能在宏中凭空创建一个新的 crate。我们可以定义一种文件格式来编写 Rust 代码的模板，以便替换代码中的某些部分，比如 async/.await。但这听起来完全超出了我们的范畴。

最终版是：`maybe_async` crate

第三次尝试基于一个名为 maybe_async 的 crate。我记得当初发现它时，天真地以为这就是完美的解决方案。

总之，这个 crate 的思路是，你可以用一个过程宏自动移除代码中的 async 和 .await，本质上就是把复制粘贴的方法自动化了。举个例子：

1 2	#[maybe_async::maybe_async] async fn endpoint() { /* stuff */ }

生成以下代码：

#[cfg(not(feature = "is_sync"))]
async fn endpoint() { /* stuff */ }
#[cfg(feature = "is_sync")]
fn endpoint() { /* stuff with `.await` removed */ }

你可以通过在编译 crate 时切换 maybe_async/is_sync 特性来配置是要异步还是阻塞代码。这个宏适用于函数、trait 和 impl 块。如果某个转换不像简单地移除 async 和 .await 那么容易，你可以用 async_impl 和 sync_impl 过程宏来指定自定义实现。它处理得非常好，我们在 Rspotify 中已经使用它一段时间了。

事实上，它效果如此之好，以至于我让 Rspotify 变成了HTTP 客户端无关的，这比异步/同步无关更加灵活。这使我们能够支持多种 HTTP 客户端，比如 reqwest 和 ureq ，而不用管客户端是异步的还是同步的。

如果你有 maybe_async，实现HTTP 客户端无关并不是很难。你只需要为 HTTP 客户端定义一个 trait，然后为你想支持的每个客户端实现它：

一段代码胜过千言万语。（你可以在这里找到 Rspotify 的 reqwest客户端的完整源代码， ureq 也可以在这里找到）

#[maybe_async]
trait HttpClient {
    async fn get(&self) -> String;
}
#[sync_impl]
impl HttpClient for UreqClient {
    fn get(&self) -> String { ureq::get(/* ... */) }
}
#[async_impl]
impl HttpClient for ReqwestClient {
    async fn get(&self) -> String { reqwest::get(/* ... */).await }
}
struct SpotifyClient {
    http: Http
}
#[maybe_async]
impl SpotifyClient {
    async fn endpoint(&self) { self.http.get(/* ... */) }
}

然后，我们可以进一步扩展，让用户通过在他们的 Cargo.toml 中设置特性标志来选择他们想要使用的客户端。比如，如果启用了 client-ureq，由于 ureq 是同步的，它就会启用 maybe_async/is_sync。这样一来，就会移除 async/.await 和 #[async_impl] 块，Rspotify 客户端内部就会使用 ureq 的实现。

这个解决方案避免了我之前提到的所有缺点：

完全没有代码重复
无论是在运行时还是编译时都没有额外开销。如果用户想要一个阻塞客户端，他们可以使用 ureq，这样就不会引入 tokio 及其相关依赖
对用户来说很容易理解；只需在 Cargo.toml 中配置一个标志

不过，先停下来想几分钟，试试看你能不能找出为什么不应该这么做。实际上，我给你9个月时间，这就是我花了多长时间才意识到问题所在...

问题

嗯，问题在于 Rust 中的特性必须是叠加的："启用一个特性不应该禁用功能，而且通常应该可以安全地启用任意组合的特性"。当依赖树中出现重复的 crate 时，Cargo 可能会合并该 crate 的特性，以避免多次编译同一个 crate。如果您想了解更多详细信息，参考资料对此进行了很好的解释。

这种优化意味着互斥的特性可能会破坏依赖树。在我们的情况下，maybe_async/is_sync 是一个由 client-ureq 启用的切换特性。所以如果你试图同时启用 client-reqwest 来编译，它就会失败，因为 maybe_async 将被配置为生成同步函数签名。不可能有一个 crate 直接或间接地同时依赖于同步和异步的 Rspotify，而且根据 Cargo 参考文档，maybe_async 的整个概念目前是错误的。

新特性解析器 v2

一个常见的误解是，这个问题可以通过"特性解析器v2"来修复，参考文档也对此进行了很好的解释。从2021版本开始，这个新版本已经默认启用了，但你也可以在之前的版本的 Cargo.toml 中指定使用它。这个新版本除了其他改进，还在一些特殊情况下避免了特性的统一，但不包括我们的情况：

对于当前未在构建的目标，启用在平台特定依赖项上的特性会被忽略。
构建依赖和过程宏不会与普通依赖共享特性。
除非构建需要它们的目标（如测试或示例），否则开发依赖不会激活特性。

为了以防万一，我自己尝试复现了这个问题，结果确实如我所料。这个代码库是一个特性冲突的例子，在任何特性解析器下都会出错。

其他失败

有一些 crate也存在这个问题：

arangors 和 aragog ：ArangoDB 的包装器。两者都用于 maybe_async 在异步和同步之间切换（arangors 事实上，的作者是同一个人）^5 [^6] (https://nullderef.com/blog/rust-async-sync/#aragog-error)。
inkwell ：LLVM 的包装器。它支持多个版本的 LLVM，但彼此之间不兼容[7]。
k8s-openapi ：Kubernetes 的包装器，与 inkwell ^8存在同样的问题。

修复 `maybe_async`

随着这个 crate 开始变得流行起来，有人在 maybe_async 中提出了这个问题，解释了情况并展示了一个修复方案：
async 和 sync 在同一程序中 fMeow/maybe-async-rs #6

maybe_async 现在会有两个特性标志：is_sync 和 is_async。这个 crate 会以同样的方式生成函数，但会在标识符后面添加 _sync 或 _async 后缀，这样就不会冲突了。例如：

1 2	#[maybe_async::maybe_async] async fn endpoint() { /* stuff */ }

现在将生成以下代码：

#[cfg(feature = "is_async")]
async fn endpoint_async() { /* stuff */ }
#[cfg(feature = "is_sync")]
fn endpoint_sync() { /* stuff with `.await` removed */ }

然而，这些后缀会引入噪音，所以我在想是否有可能以更符合人体工程学的方式来实现。我fork了maybe_async并尝试了一下，你可以在这一系列评论中读到更多相关内容。总的来说，这太复杂了，我最终放弃了。

修复这个边缘情况的唯一方法就是让Rspotify对所有人的可用性变差。但我认为，同时依赖异步和同步版本的人可能很少；实际上我们还没有收到任何人的抱怨。与reqwest不同，rspotify是一个"高级"库，所以很难想象它会在一个依赖树中出现多次。

也许我们可以向Cargo的开发者寻求帮助？

官方支持

虽然不是官方的，但 Rust 中可以进一步探索的另一种有趣方法是“Sans I/O”。这是一个 Python 协议，它抽象了网络协议（如 HTTP）的使用，从而最大限度地提高了可重用性。Rust 中现有的一个示例是 tame-oidc。

Rspotify 远不是第一个遇到这个问题的项目，所以阅读之前的相关讨论可能会很有趣：

这个现已关闭的 Rust 编译器 RFC 添加 oneof 配置谓词（类似 #[cfg(any(…))]）来支持互斥特性。这只是让在别无选择的情况下拥有冲突特性变得更容易，但特性仍应该是严格叠加的。
前一个 RFC 在 Cargo 本身允许互斥特性的背景下引发了一些讨论，尽管有一些有趣的信息，但并没有取得太大进展。
Cargo 中的这个问题解释了 Windows API 的类似情况。讨论包括更多示例和解决方案想法，但还没有被 Cargo 采纳。
Cargo 中的另一个问题要求提供一种方法来轻松测试和构建不同标志组合。如果特性是严格叠加的，那么 cargo test --all-features 将涵盖所有情况。但如果不是，用户就必须用多个特性标志组合运行命令，这相当麻烦。非官方的 cargo-hack 已经可以实现这一点。
一种完全不同的方法基于关键字泛型倡议。这似乎是解决这个问题的最新尝试，但仍处于"探索"阶段，截至目前还没有可用的 RFC。

根据这条旧评论，这不是 Rust 团队已经否决的东西；它仍在讨论中。

虽然是非官方的，但另一个可以在 Rust 中进一步探索的另一种有趣方法是 “Sans I/O”。这是一种 Python 协议，它在我们的案例中抽象了 HTTP 等网络协议的使用，从而最大化了可重用性。Rust 中现有的一个例子是 tame-oidc。

结论

我们目前面临以下选择：

忽视 Cargo 参考。我们可以假设没有人会同时使用 Rspotify 的同步和异步版本。
修复 maybe_async 并为我们库中的每个端点添加 _async 和 _sync 后缀。
放弃支持异步和同步代码。这已经变成了一团糟，我们没有足够的人力来处理，而且它影响了 Rspotify 的其他部分。问题是一些依赖 rspotify 的 crate，如 ncspot 或 spotifyd 是阻塞的，而其他如 spotify-tui 使用异步，所以我不确定他们会怎么想。

我知道这是我给自己强加的问题。我们可以直接说"不。我们只支持异步"或"不。我们只支持同步"。虽然有用户对能够使用两者感兴趣，但有时你就是得说不。如果这样一个特性变得如此复杂，以至于你的整个代码库变成一团糟，而你没有足够的工程能力来维护它，那这就是你唯一的选择。如果有人真的很在意，他们可以直接 fork 这个 crate 并将其转换为同步版本供自己使用。

毕竟，大多数 API 封装库等只支持异步或阻塞代码中的一种。例如，serenity （Discord API）、sqlx （SQL 工具包）和 teloxide （Telegram API）是仅异步的，而且它们非常流行。。

尽管有时候很沮丧，但我并不后悔花了这么多时间兜圈子试图让异步和同步都能工作。我最初为 Rspotify 做贡献就是为了_学习。我没有截止日期，也没有压力，我只是想在空闲时间尝试改进 Rust 中的一个库。而且我确实学到了_很多；希望在读完这篇文章后，你也是如此。

也许今天的教训是，我们应该记住 Rust 毕竟是一种低级语言，有些事情如果不引入大量复杂性是不可能实现的。无论如何，我期待 Rust 团队将来如何解决这个问题。

那么你怎么看？如果你是 Rspotify 的维护者，你会怎么做？如果你愿意，可以在下面留言。

四种字符串和bytes互相转换方式的性能比较

2024-08-13T14:16:34.000Z

昨天公司群中同事提到 Go 1.22 中 string 和 bytes 的互转不需要再用 unsafe 那个包了，直接转就可以。我翻看了 Go 1.22 的 release notes 没找到相应的介绍，但是大家提到了 kubernetes 的 issue 中有这个说法：

As of go 1.22, for string to bytes conversion, we can replace the usage of unsafe.Slice(unsafe.StringData(s), len(s)) with type casting []bytes(str), without the worry of losing performance.

As of go 1.22, string to bytes conversion []bytes(str) is faster than using the unsafe package. Both methods have 0 memory allocation now.

自 Go 1.22 起，对于 string 到 bytes 的转换，我们可以用类型转换 []bytes(str) 来替换 unsafe.Slice(unsafe.StringData(s), len(s)) 的用法，而不用担心性能损失。
自 Go 1.22 起，string 到 bytes 的转换 []bytes(str) 比使用 unsafe 包更快。现在两种方法都不会有内存分配。

这个说法让我很好奇，但是我还是想验证一下这个说法。

注意，这个说法只谈到了 string 到 bytes 的转换，并没有提到 bytes 到 string 的转换，这篇文章也会关注这两者的互转。

首先，让我们看看几种 string 和 bytes 的转换方式，然后我们再写 benchmark 比较它们之间的性能。

一、强转

字符串和 bytes 之间可以强制转换，编译器会内部处理。代码如下：

func toRawBytes(s string) []byte {
	if len(s) == 0 {
		return nil
	}
	return []byte(s)
}
func toRawString(b []byte) string {
	if len(b) == 0 {
		return ""
	}
	return string(b)
}

这里我们做了一点点优化，处理空 string或者 bytes 的情况。

二、传统 unsafe 方式

reflect 包中定义了 SliceHeader 和 StringHeader, 分别对应 slice 和 string 的数据结构

type SliceHeader struct {
	Data uintptr
	Len  int
	Cap  int
}
type StringHeader struct {
	Data uintptr
	Len  int
}

我们按照这种数据结构，可以实现 string 和 bytes 的互转。我们暂且把它叫做 reflect 方式吧，虽然下面的代码没有用到 reflect 包，但是实际我们是按照 reflect 包中的这两个数据结构进行转换的:

func toReflectBytes(s string) []byte {
	if len(s) == 0 {
		return nil
	}
	x := (*[2]uintptr)(unsafe.Pointer(&s))
	h := [3]uintptr{x[0], x[1], x[1]}
	return *(*[]byte)(unsafe.Pointer(&h))
}
func toReflectString(b []byte) string {
	if len(b) == 0 {
		return ""
	}
	return *(*string)(unsafe.Pointer(&b))
}

三、新型 unsafe 方式

我在两年前的文章与日俱进，在 Go 1.20 中这种高效转换的方式又变了介绍了新的 unsafe 方式，reflect 包中的 SliceHeader 和 StringHeader 准备废弃了。让我们看看这种新的转换方式：

func toBytes(s string) []byte {
	if len(s) == 0 {
		return nil
	}
	return unsafe.Slice(unsafe.StringData(s), len(s))
}
func toString(b []byte) string {
	if len(b) == 0 {
		return ""
	}
	return unsafe.String(unsafe.SliceData(b), len(b))
}

利用 unsafe.Slice 、unsafe.String、unsafe.StringData 和 unsafe.SliceData 完成 Slice 和 String 的转换以及底层数据的指针的获取。

四、kubernetes 的实现

在 k8s 中，使用的是下面方式的优化的转换：

func toK8sBytes(s string) []byte {
	return *(*[]byte)(unsafe.Pointer(&s))
}
func toK8sString(b []byte) string {
	return *(*string)(unsafe.Pointer(&b))
}

可以看到，相对于传统 unsafe 方式，k8s 的实现更简洁，并没有为toBytes临时构造3元素的数组，而是直接将 string 和 bytes 的指针进行转换。

string不是只包含两个字段么？slice不是包含三个字段么？toK8sBytes返回的[]byte的cap是怎么确定的呢？最后我们再分析这个问题，现在先把这几个实现的性能搞清楚。

性能比较

我们分别对这几种实现进行 benchmark，看看它们之间的性能差异。
使用一个简单的字符串和它对应的bytes, 分别进行 string 到 bytes 、 bytes 到 string 的转换。

var s = "hello, world"
var bts = []byte("hello, world")
func BenchmarkStringToBytes(b *testing.B) {
	var fns = map[string]func(string) []byte{
		"强制转换":  toRawBytes,
		"传统转换":  toReflectBytes,
		"新型转换":  toBytes,
		"k8s转换": toK8sBytes,
	}
	for name, fn := range fns {
		b.Run(name, func(b *testing.B) {
			for i := 0; i < b.N; i++ {
				bts = fn(s)
			}
		})
	}
}
func BenchmarkBytesToString(b *testing.B) {
	var fns = map[string]func([]byte) string{
		"强制转换":  toRawString,
		"传统转换":  toReflectString,
		"新型转换":  toString,
		"k8s转换": toK8sString,
	}
	for name, fn := range fns {
		b.Run(name, func(b *testing.B) {
			for i := 0; i < b.N; i++ {
				s = fn(bts)
			}
		})
	}
}

在Mac mini M2上运行，go1.22.6 darwin/arm64，结果如下：

goos: darwin
goarch: arm64
pkg: github.com/smallnest/study/str2bytes
BenchmarkStringToBytes/强制转换-8              	78813638	        14.73 ns/op	      16 B/op	       1 allocs/op
BenchmarkStringToBytes/传统转换-8              	599346962	         2.010 ns/op	       0 B/op	       0 allocs/op
BenchmarkStringToBytes/新型转换-8              	624976126	         1.929 ns/op	       0 B/op	       0 allocs/op
BenchmarkStringToBytes/k8s转换-8             	887370499	         1.211 ns/op	       0 B/op	       0 allocs/op

string 转 bytes性能最好的是k8s方案，新型转换和传统转换性能差不多，新型方案略好，强制转换性能最差。


BenchmarkBytesToString/强制转换-8              	92011309	        12.68 ns/op	      16 B/op	       1 allocs/op
BenchmarkBytesToString/传统转换-8              	815922964	         1.471 ns/op	       0 B/op	       0 allocs/op
BenchmarkBytesToString/新型转换-8              	624965414	         1.922 ns/op	       0 B/op	       0 allocs/op
BenchmarkBytesToString/k8s转换-8             	1000000000	         1.194 ns/op	       0 B/op	       0 allocs/op

而对于 bytes 转 string，k8s方案性能最好，传统转换次之，新型转换性能再次之，强制转换性能非常不好。

在Linux amd64上运行，go1.22.0 linux/amd64，结果如下：

goos: linux
goarch: amd64
pkg: test
cpu: Intel(R) Xeon(R) Platinum
BenchmarkStringToBytes/强制转换-2                 	30606319	        42.02 ns/op	      16 B/op	       1 allocs/op
BenchmarkStringToBytes/传统转换-2                 	315913948	         3.779 ns/op	       0 B/op	       0 allocs/op
BenchmarkStringToBytes/新型转换-2                 	411972518	         2.753 ns/op	       0 B/op	       0 allocs/op
BenchmarkStringToBytes/k8s转换-2                	449640819	         2.770 ns/op	       0 B/op	       0 allocs/op
BenchmarkBytesToString/强制转换-2                 	38716465	        29.18 ns/op	      16 B/op	       1 allocs/op
BenchmarkBytesToString/传统转换-2                 	458832459	         2.593 ns/op	       0 B/op	       0 allocs/op
BenchmarkBytesToString/新型转换-2                 	439537762	         2.762 ns/op	       0 B/op	       0 allocs/op
BenchmarkBytesToString/k8s转换-2                	478885546	         2.375 ns/op	       0 B/op	       0 allocs/op

整体上看，k8s方案、传统转换、新型转换性能都挺好，强制转换性能最差。k8s在bytes转string上性能最好。

性能分析

等等，kubernates的讨论中，不是说Go1.22中string到bytes的转换可以直接用[]byte(str)了么？为什么这里的性能测试中，强制转换为什么性能那么差呢？

同时你也可以看到，强制转换每个op都会有一次内存分配:1 allocs/op,这严重影响了它的性能。

如果我们编写两个benchmark测试函数, 如下:

func BenchmarkStringToBytesRaw(b *testing.B) {
	for i := 0; i < b.N; i++ {
		_ = toRawBytes(s)
	}
}
func BenchmarkBytesToStringRaw(b *testing.B) {
	for i := 0; i < b.N; i++ {
		_ = toRawString(bts)
	}
}

执行:

goos: darwin
goarch: arm64
pkg: github.com/smallnest/study/str2bytes
BenchmarkStringToBytesRaw-8   	1000000000	         0.2921 ns/op	       0 B/op	       0 allocs/op
BenchmarkBytesToStringRaw-8   	506502222	         2.363 ns/op	       0 B/op	       0 allocs/op

你会发现一个令人诧异的事情，强制转换的性能非常好，没有额外的内存分配(零拷贝)，设置字符串转换为bytes好太多。

这是咋回事呢？

当然聪明的你就会想到这个肯定是编译器做了优化，通过内联，把toRawBytes的函数调用展开了，这个好处是发现s

# go test -gcflags="-m=2" -bench Raw -benchmem
...
./convert_test.go:48:6: can inline toRawBytes with cost 10 as: func(string) []byte { if len(s) == 0 { return nil }; return ([]byte)(s) }
./convert_test.go:55:6: can inline toRawString with cost 10 as: func([]byte) string { if len(b) == 0 { return "" }; return string(b) }
...
./convert_test.go:101:17: ([]byte)(s) does not escape
./convert_test.go:101:17: zero-copy string->[]byte conversion
...

通过-gcflags="-m=2", 我们可以观察内联和逃逸分析的结果，可以看到编译器优化了强制转换的函数，将string转换为bytes的操作优化为零拷贝。

而上一节我们的benchmark中，bts = toRawBytes(s)这个操作，会导致([]byte)(s)逃逸到堆上，这样就会有一次内存分配，并且性能底下。

所以你现在情况了，Go1.22确实对强制转换做了优化，但是这个优化是通过编译器的内联和逃逸分析来实现的，并不是所有的场景都能够优化到零拷贝。

谁能在编写代码的时候注意到这个优化呢，甚至准确的判断能否避免逃逸？所以可能在现阶段，我们还是会通过其他三种方式进行优化。

貌似Go 1.23会进一步优化，参考这个CL: cmd/compile: restore zero-copy string->[]byte optimization

k8s实现的问题

一开始，我们留了一个问题：toK8sBytes返回的[]byte的cap是多少？

1
2
3

func toK8sBytes(s string) []byte {
	return *(*[]byte)(unsafe.Pointer(&s))
}

len是明确的，字段对应字符串的len字段，但是cap是多少呢？字符串可是没有cap字段的。

我们可以通过下面的代码来验证:

func Test_toK8sBytes(t *testing.T) {
	a := *(*[3]int64)(unsafe.Pointer(&s))
	fmt.Printf("%d, %d, %d\n", a[0], a[1], a[2])
	b := *(*[]byte)(unsafe.Pointer(&s))
	fmt.Printf("%d, %d, %d\n", unsafe.SliceData(b), len(b), cap(b))
}

首先我们强制获取三个字段，第一个字段应该是字符串底层数据的指针。第二个字段是字符串的长度，第三个字段是什么呢？
同样我进行强制转换成slice of byte, 然后打印slice的底层数据指针，长度和容量。

输出结果如下(每次运行可能会得到不同的结果):

1 2	4375580047, 12, 4375914624 4375580047, 12, 4375914624

可以看到两者的结果是一致的，第一个值就是底层数据指针，第二个值是长度12，第三个啥也不是，就取得的内存中的值，随机的，并不是容量12。

所以通过这种方式转换的slice，其容量是不确定的，这个是一个问题，可能会导致一些问题，比如slice的append操作。

1、如果得到的slice的容量那么大，我们是不是尽情的append数据呢？

b := *(*[]byte)(unsafe.Pointer(&s))
fmt.Printf("%d, %d, %d\n", unsafe.SliceData(b), len(b), cap(b))
b = append(b, '!')

运行上面的测试会导致panic:

1
2
3

unexpected fault address 0x105020dfb
fatal error: fault
[signal SIGBUS: bus error code=0x1 addr=0x105020dfb pc=0x10501ee98]

2、如果修改返回的bytes, 共享底层数据的原始string是不是也会发生变化？

1
2
3

b := *(*[]byte)(unsafe.Pointer(&s))
fmt.Printf("%d, %d, %d\n", unsafe.SliceData(b), len(b), cap(b))
b[0] = 'H'

运行上面的测试，会导致string的值s发生变化吗? 答案是不会，运行这段代码依然会导致panic"

1
2
3

unexpected fault address 0x104f1cdcf
fatal error: fault
[signal SIGBUS: bus error code=0x1 addr=0x104f1cdcf pc=0x104f1ae74]

3、如果修改原始的bytes, 返回的string是不是也会发生变化？
我们知道，字符串是不可变的，所以这个问题的答案是？
测试代码如下：

c := *(*string)(unsafe.Pointer(&bts))
fmt.Printf("%s\n", c)
bts[0] = 'H'
fmt.Printf("%s\n", c)

原始的bytes bts发生变化，返回的string c会发生变化吗？上面的代码打印出修改前后同一个字符串的值：

1 2	hello, world Hello, world

哈，字符串也变成了"可变"的了。

总结

Go 1.22中，string和bytes的互转在部分场景(未逃逸的情况)下做了优化，实现了零拷贝，性能优秀，但是并不是所有的场景都能优化到零拷贝，所以我们、可以再等等，再等几个版本优化完全后再替换传统的互转方式。

在字符串和bytes互转的情况下，我们要确定bytes是不是可变的，这样会避免意外的情况发生，否则不妨采用强制转换的方式，安全第一。

没有什么不可能：修改 Go 结构体的私有字段

2024-08-08T15:12:59.000Z

在Go语言中,结构体(struct)中的字段如果是私有的,只能在定义该结构体的同一个包内访问。这是为了实现数据的封装和信息隐藏,提高代码的健壮性和安全性。

但是在某些情况下,我们可能需要在外部包中访问或修改结构体的私有字段。这时,我们可以使用 Go 语言提供的反射(reflect)机制来实现这一功能。

即使我们能够实现访问，这些字段你没有办法修改，如果尝试通过反射设置这些私有字段的值，会 panic。

甚至有时，我们通过反射设置一些变量或者字段的值的时候，会 panic, 报错 panic: reflect: reflect.Value.Set using unaddressable value。

在本文中，你将了解到：

如何通过 hack 的方式访问外部结构体的私有字段
如何通过 hack 的方式设置外部结构体的私有字段
如何通过 hack 的方式设置 unaddressable 的值

首先我先介绍通过反射设置值遇到的 unaddressable 的困境。

通过反射设置一个变量的值

如果你使用过反射设置值的变量，你可能熟悉下面的代码，而且这个代码工作正常：

var x = 47
v := reflect.ValueOf(&x).Elem()
fmt.Printf("原始值: %d, CanSet: %v\n", v.Int(), v.CanSet()) // 47, false
v.Set(reflect.ValueOf(50))

注意这里传入给 reflect.ValueOf 的是 x 的指针 &x, 所以这个 Value 值是 addresable 的，我们可以进行赋值。

如果把 &x 替换成 x, 我们再尝试运行：

var x = 47
v := reflect.ValueOf(x)
fmt.Printf("Original value: %d, CanSet: %v\n", v.Int(), v.CanSet()) // 47, false
v.Set(reflect.ValueOf(50))

可以看到panic:

Original value: 47, CanSet: false
panic: reflect: reflect.Value.Set using unaddressable value
goroutine 1 [running]:
reflect.flag.mustBeAssignableSlow(0x1400012c410?)
	/usr/local/go/src/reflect/value.go:272 +0x74
reflect.flag.mustBeAssignable(...)
	/usr/local/go/src/reflect/value.go:259
reflect.Value.Set({0x104e13e40?, 0x104e965b8?, 0x104dec7e6?}, {0x104e13e40?, 0x104e0ada0?, 0x2?})
	/usr/local/go/src/reflect/value.go:2319 +0x58
main.setUnaddressableValue()
	/Users/smallnest/workspace/study/private/main.go:27 +0x1c0
main.main()
	/Users/smallnest/workspace/study/private/main.go:18 +0x1c
exit status 2

文章最后我会介绍如何通过 hack 的方式解决这个问题。

接下来我再介绍访问私有字段的问题。

访问外部包的结构体的私有字段

我们先准备一个 model 包，在它之下定义了两个结构体：

package model
type Person struct {
	Name string
	age  int
}
func NewPerson(name string, age int) Person {
	return Person{
		Name: name,
		age:  age, // unexported field
	}
}
type Teacher struct {
	Name string
	Age  int // exported field
}
func NewTeacher(name string, age int) Teacher {
	return Teacher{
		Name: name,
		Age:  age,
	}
}

注意Person的age字段是私有的，Teacher的Age字段是公开的。

在我们的main函数中，你不能访问Person的age字段：

package main;
import (
    "fmt"
    "reflect"
    "unsafe"
    "github.com/smallnest/private/model"
)   
func main() {
    p := model.NewPerson("Alice", 30)
    fmt.Printf("Person: %+v\n", p)
    // fmt.Println(p.age) // error: p.age undefined (cannot refer to unexported field or method age)
    t := model.NewTeacher("smallnest", 18)
    fmt.Printf("Teacher: %+v\n", t) // Teacher: {Name:Alice Age:30}
}

那么真的就无法访问了吗？也不一定，我们可以通过反射的方式访问私有字段:

p := model.NewPerson("Alice", 30)
age := reflect.ValueOf(p).FieldByName("age")
fmt.Printf("原始值: %d, CanSet: %v\n", age.Int(), age.CanSet()) // 30, false

运行这个程序，可以看到我们获得了这个私有字段age的值:

1	原始值: 30, CanSet: false

这样我们就绕过了Go语言的访问限制，访问了私有字段。

设置结构体的私有字段

但是如果我们尝试修改这个私有字段的值，会 panic:

1	age.SetInt(50)

或者

1	age.Set(reflect.ValueOf(50))

报错信息：

原始值: 30, CanSet: false
panic: reflect: reflect.Value.SetInt using value obtained using unexported field
goroutine 1 [running]:
reflect.flag.mustBeAssignableSlow(0x2?)
	/usr/local/go/src/reflect/value.go:269 +0xb4
reflect.flag.mustBeAssignable(...)
	/usr/local/go/src/reflect/value.go:259
reflect.Value.SetInt({0x1050ac0c0?, 0x14000118f20?, 0x1050830a8?}, 0x32)
	/usr/local/go/src/reflect/value.go:2398 +0x44
main.setUnexportedField()
	/Users/smallnest/workspace/study/private/main.go:37 +0x1a0
main.main()
	/Users/smallnest/workspace/study/private/main.go:18 +0x1c
exit status 2

实际上，reflect.Value的Set方法会做一系列的检查，包括检查是否是addressable的，以及是否是exported的字段:

func (v Value) Set(x Value) {
	v.mustBeAssignable()
	x.mustBeExported() // do not let unexported x leak
	...
}

v.mustBeAssignable()检查是否是addressable的，而且是exported的字段:

func (f flag) mustBeAssignable() {
	if f&flagRO != 0 || f&flagAddr == 0 {
		f.mustBeAssignableSlow()
	}
}
func (f flag) mustBeAssignableSlow() {
	if f == 0 {
		panic(&ValueError{valueMethodName(), Invalid})
	}
	// Assignable if addressable and not read-only.
	if f&flagRO != 0 {
		panic("reflect: " + valueMethodName() + " using value obtained using unexported field")
	}
	if f&flagAddr == 0 {
		panic("reflect: " + valueMethodName() + " using unaddressable value")
	}
}

f&flagRO == 0 代表是可写的（exported），f&flagAddr != 0 代表是addressable的,当这两个条件任意一个不满足时，就会报错。

既然我们明白了它检查的原理，我们就可以通过 hack 的方式绕过这个检查，设置私有字段的值。我们还是要使用unsafe代码。

这里我们以标准库的sync.Mutex结构体为例， sync.Mutex包含两个字段，这两个字段都是私有的：

type Mutex struct {
    state int32
    sema  uint32
}

正常情况下你只能通过Mutex.Lock和Mutex.Unlock来间接的修改这两个字段。

现在我们演示通过 hack 的方式修改Mutex的state字段的值：

func setPrivateField() {
	var mu sync.Mutex
	mu.Lock()
	field := reflect.ValueOf(&mu).Elem().FieldByName("state")
	state := field.Interface().(*int32)
	fmt.Println(*state) // ❶ 
	flagField := reflect.ValueOf(&field).Elem().FieldByName("flag")
	flagPtr := (*uintptr)(unsafe.Pointer(flagField.UnsafeAddr()))
	// 修改flag字段的值
	*flagPtr &= ^uintptr(flagRO) // ❷
	field.Set(reflect.ValueOf(int32(0)))
	mu.Lock() // ❸
	fmt.Println(*state)
}
type flag uintptr
const (
	flagKindWidth        = 5 // there are 27 kinds
	flagKindMask    flag = 1< 1
	flagStickyRO    flag = 1 << 5
	flagEmbedRO     flag = 1 << 6
	flagIndir       flag = 1 << 7
	flagAddr        flag = 1 << 8
	flagMethod      flag = 1 << 9
	flagMethodShift      = 10
	flagRO          flag = flagStickyRO | flagEmbedRO
)

❶ 处我们已经介绍过了，访问私有字段的值，这里会打印出1
❶ 处我们清除了flag字段的flagRO标志位，这样就不会报reflect: reflect.Value.SetInt using value obtained using unexported field错误了
❸ 处不会导致二次加锁带来的死锁，因为state字段的值已经被修改为0了，所以不会阻塞。最后打印结果还是1

这样我们就可以实现了修改私有字段的值了。

使用unexported字段的Value设置公开字段

看reflect.Value.Set的源码，我们可以看到它会检查参数的值是否unexported，如果是，就会报错,下面就是一个例子：

func setUnexportedField2() {
	alice := model.NewPerson("Alice", 30)
	bob := model.NewTeacher("Bob", 40)
	bobAgent := reflect.ValueOf(&bob).Elem().FieldByName("Age")
	aliceAge := reflect.ValueOf(&alice).Elem().FieldByName("age")
	bobAgent.Set(aliceAge) // ❹
}

注意❹处，我们尝试把alice的私有字段age的值赋值给bob的公开字段Age，这里会报错：

panic: reflect: reflect.Value.Set using value obtained using unexported field
goroutine 1 [running]:
reflect.flag.mustBeExportedSlow(0x1400012a000?)
	/usr/local/go/src/reflect/value.go:250 +0x70
reflect.flag.mustBeExported(...)
	/usr/local/go/src/reflect/value.go:241
reflect.Value.Set({0x102773a60?, 0x1400012a028?, 0x60?}, {0x102773a60?, 0x1400012a010?, 0x1027002b8?})
	/usr/local/go/src/reflect/value.go:2320 +0x88
main.setUnexportedField2()
	/Users/smallnest/workspace/study/private/main.go:50 +0x168
main.main()
	/Users/smallnest/workspace/study/private/main.go:18 +0x1c
exit status 2

原因alice的age值被识别为私有字段，它是不能用来赋值给公开字段的。

有了上一节的经验，我们同样可以绕过这个检查，实现这个赋值：

func setUnexportedField2() {
	alice := model.NewPerson("Alice", 30)
	bob := model.NewTeacher("Bob", 40)
	bobAgent := reflect.ValueOf(&bob).Elem().FieldByName("Age")
	aliceAge := reflect.ValueOf(&alice).Elem().FieldByName("age")
	// 修改flag字段的值
	flagField := reflect.ValueOf(&aliceAge).Elem().FieldByName("flag")
	flagPtr := (*uintptr)(unsafe.Pointer(flagField.UnsafeAddr()))
	*flagPtr &= ^uintptr(flagRO) // ❺
	bobAgent.Set(reflect.ValueOf(50))
	bobAgent.Set(aliceAge) // ❻
}

❺ 处我们修改了aliceAge的flag字段，去掉了flagRO标志位，这样就不会报错了,❻处我们成功的把alice的私有字段age的值赋值给bob的公开字段Age。

这样我们就可以实现了使用私有字段的值给其他Value值进行赋值了。

给unaddressable的值设置值

回到最初的问题，我们尝试给一个unaddressable的值设置值，会报错。

结合上面的hack手段，我们也可以绕过限制，给unaddressable的值设置值：

func setUnaddressableValue() {
	var x = 47
	v := reflect.ValueOf(x)
	fmt.Printf("原始值: %d, CanSet: %v\n", v.Int(), v.CanSet()) // 47, false
	// v.Set(reflect.ValueOf(50))
	flagField := reflect.ValueOf(&v).Elem().FieldByName("flag")
	flagPtr := (*uintptr)(unsafe.Pointer(flagField.UnsafeAddr()))
	// 修改flag字段的值
	*flagPtr |= uintptr(flagAddr)          // 设置可寻址标志位
	fmt.Printf("CanSet: %v\n", v.CanSet()) // true
	v.SetInt(50)
	fmt.Printf("修改后的值: %d\n", v.Int()) // 50
}

运行这个程序，不会报错，可以看到我们成功的给unaddressable的值设置了新的值。

回顾

我们通过修改Value值的flag标志位，可以绕过reflect的检查，实现了访问私有字段、设置私有字段的值、用私有字段设置值，以及给unaddressable的值设置值。

这些都是unsafe的方式，一般情况下不鼓励进行这样的hack操作，但是这种技术也不是完全没有用户，如果你正在写一个debugger，用户在断点出可能想修改某些值，或者你在写深拷贝的库，或者编写某种ORM库，或者你就像突破限制，访问第三方不愿意公开的字段，你有可能会采用这种非常规的技术。

我是鸟窝，一位老程序员，在百度写代码。如果你感觉这篇文章给你带来了帮助，请点击下方点赞按钮或者评论区进行评论。

使用eBPF编写系统调用跟踪器

2024-08-04T09:27:25.000Z

先决条件

系统调用、eBPF、C语言、底层编程基础。

简介

eBPF(扩展的伯克利数据包过滤器)是一项允许用户在内核中运行自定义程序的技术。BPF或cBPF(经典BPF)是eBPF的前身,它提供了一种简单高效的方法来基于预定义规则过滤数据包。与内核模块相比,eBPF程序提供了更高的安全性、可移植性和可维护性。现有多种高级方法可用于处理eBPF程序,如Cilium的Go语言库、bpftrace、libbpf等。

注意: 本文要求读者对eBPF有基本了解。如果你不熟悉它,ebpf.io上的这篇文章是很好的参考资料。

目标

你应该已经熟悉著名的工具 strace。我们将使用eBPF开发类似的工具。例如:

1	./beetrace /bin/ls

以下是该文本的地道中文翻译：

概念

在开始编写我们的工具之前，我们需要熟悉一些关键概念。

跟踪点（Tracepoints）：这些是放置在 Linux 内核代码各个部分的检测点。它们提供了一种方法，可以在不修改内核源代码的情况下，钩入内核中的特定事件或代码路径。可用于跟踪的事件可以在 /sys/kernel/debug/tracing/events 中找到。
SEC 宏：它在目标 ELF 文件中创建一个新的段，段名与跟踪点的名称相同。例如，SEC(tracepoint/raw_syscalls/sys_enter) 创建了一个具有这个名称的新段。可以使用 readelf 命令查看这些段。

1	readelf -s --wide somefile.o

映射（Maps）：这些是可以从 eBPF 程序和用户空间运行的应用程序中访问的共享数据结构。

编写 eBPF 程序

由于 Linux 内核中存在大量的系统调用，我们不会编写一个全面的工具来跟踪所有系统调用。相反，我们将专注于跟踪几个常见的系统调用。为了实现这一目标，我们将编写两类程序：eBPF 程序和加载器（用于将 BPF 对象加载到内核并将其附加进来）。

让我们首先创建一些数据结构来进行初始设置:

// controller.h
// SYS_ENTER : for retrieving system call arguments
// SYS_EXIT : for retrieving the return values of syscalls
typedef enum
{
    SYS_ENTER,
    SYS_EXIT
} event_mode;
struct inner_syscall_info
{
    union
    {
        struct
        {
            // For SYS_ENTER mode
            char name[32];
            int num_args;
            long syscall_nr;
            void *args[MAX_ARGS];
        };
        long retval; // For SYS_EXIT mode
    };
    event_mode mode;
};
struct default_syscall_info{
    char name[32];
    int num_args;
};
// Array for storing the name and argument count of system calls
const struct default_syscall_info syscalls[MAX_SYSCALL_NR] = {
    [SYS_fork] = {"fork", 0},
    [SYS_alarm] = {"alarm", 1},
    [SYS_brk] = {"brk", 1},
    [SYS_close] = {"close", 1},
    [SYS_exit] = {"exit", 1},
    [SYS_exit_group] = {"exit_group", 1},
    [SYS_set_tid_address] = {"set_tid_address", 1},
    [SYS_set_robust_list] = {"set_robust_list", 1},
    [SYS_access] = {"access", 2},
    [SYS_arch_prctl] = {"arch_prctl", 2},
    [SYS_kill] = {"kill", 2},
    [SYS_listen] = {"listen", 2},
    [SYS_munmap] = {"sys_munmap", 2},
    [SYS_open] = {"open", 2},
    [SYS_stat] = {"stat", 2},
    [SYS_fstat] = {"fstat", 2},
    [SYS_lstat] = {"lstat", 2},
    [SYS_accept] = {"accept", 3},
    [SYS_connect] = {"connect", 3},
    [SYS_execve] = {"execve", 3},
    [SYS_ioctl] = {"ioctl", 3},
    [SYS_getrandom] = {"getrandom", 3},
    [SYS_lseek] = {"lseek", 3},
    [SYS_poll] = {"poll", 3},
    [SYS_read] = {"read", 3},
    [SYS_write] = {"write", 3},
    [SYS_mprotect] = {"mprotect", 3},
    [SYS_openat] = {"openat", 3},
    [SYS_socket] = {"socket", 3},
    [SYS_newfstatat] = {"newfstatat", 4},
    [SYS_pread64] = {"pread64", 4},
    [SYS_prlimit64] = {"prlimit64", 4},
    [SYS_rseq] = {"rseq", 4},
    [SYS_sendfile] = {"sendfile", 4},
    [SYS_socketpair] = {"socketpair", 4},
    [SYS_mmap] = {"mmap", 6},
    [SYS_recvfrom] = {"recvfrom", 6},
    [SYS_sendto] = {"sendto", 6},
};

加载器将读取用户通过命令行参数提供的待追踪 ELF 文件的路径。然后，加载器会创建一个子进程，并使用 execve 来运行命令行参数中指定的程序。

父进程将处理加载和附加 eBPF 程序所需的所有设置。它还执行一项关键任务：通过 BPF 哈希映射将子进程的 ID 发送给 eBPF 程序。

// loader.c
int main(int argc, char **argv)
{
  if (argc < 2)
  {
    fatal_error("Usage: ./beetrace ");
  }
  const char *file_path = argv[1];
  pid_t pid = fork();
  if (pid == 0)
  {
    // Child process
    int fd = open("/dev/null", O_WRONLY);
    if(fd==-1){
        // error
    }
    dup2(fd, 1); // disable stdout for the child process
    sleep(2); // wait for the parent process to do the required setup for tracing
    execve(file_path, NULL, NULL);
  }
  else{
    // Parent process
  }
}

要追踪系统调用，我们需要编写由 tracepoint/raw_syscalls/sys_enter 和 tracepoint/raw_syscalls/sys_exit 跟踪点触发的 eBPF 程序。这些跟踪点提供了对系统调用号和参数的访问。对于给定的系统调用，tracepoint/raw_syscalls/sys_enter 跟踪点总是在 tracepoint/raw_syscalls/sys_exit 跟踪点之前触发。我们可以使用前者获取系统调用参数，使用后者获取返回值。

此外，我们将使用 eBPF 映射在用户空间程序和我们的 eBPF 程序之间共享信息。具体来说，我们将使用两种类型的 eBPF 映射：哈希映射和环形缓冲区。

// controller.c
// Hashmap
struct
{
  __uint(type, BPF_MAP_TYPE_HASH);
  __uint(key_size, 10);
  __uint(value_size, 4);
  __uint(max_entries, 256 * 1024);
} pid_hashmap SEC(".maps");
// Ring buffer
struct
{
  __uint(type, BPF_MAP_TYPE_RINGBUF);
  __uint(max_entries, 256 * 1024);
} syscall_info_buffer SEC(".maps");

确定了映射关系之后，我们就可以动手写代码了。首先，让我们来编写针对追踪点 tracepoint/raw_syscalls/sys_enter 的程序代码。

// loader.c
SEC("tracepoint/raw_syscalls/sys_enter")
int detect_syscall_enter(struct trace_event_raw_sys_enter *ctx)
{
  // Retrieve the system call number
  long syscall_nr = ctx->id;
  const char *key = "child_pid";
  int target_pid;
  // Reading the process id of the child process in userland
  void *value = bpf_map_lookup_elem(&pid_hashmap, key);
  void *args[MAX_ARGS];
  if (value)
  {
    target_pid = *(int *)value;
    // PID of the process that executed the current system call
    pid_t pid = bpf_get_current_pid_tgid() & 0xffffffff;
    if (pid == target_pid && syscall_nr >= 0 && syscall_nr < MAX_SYSCALL_NR)
    {
      int idx = syscall_nr;
      // Reserve space in the ring buffer
      struct inner_syscall_info *info = bpf_ringbuf_reserve(&syscall_info_buffer, sizeof(struct inner_syscall_info), 0);
      if (!info)
      {
        bpf_printk("bpf_ringbuf_reserve failed");
        return 1;
      }
      // Copy the syscall name into info->name
      bpf_probe_read_kernel_str(info->name, sizeof(syscalls[syscall_nr].name), syscalls[syscall_nr].name);
      for (int i = 0; i < MAX_ARGS; i++)
      {
        info->args[i] = (void *)BPF_CORE_READ(ctx, args[i]);
      }
      info->num_args = syscalls[syscall_nr].num_args;
      info->syscall_nr = syscall_nr;
      info->mode = SYS_ENTER;
      // Insert into ring buffer
      bpf_ringbuf_submit(info, 0);
    }
  }
  return 0;
}

同理，我们也能编写用于读取返回值并将其传递给用户态空间的程序代码。

// controller.c
SEC("tracepoint/raw_syscalls/sys_exit")
int detect_syscall_exit(struct trace_event_raw_sys_exit *ctx)
{
  const char *key = "child_pid";
  void *value = bpf_map_lookup_elem(&pid_hashmap, key);
  pid_t pid, target_pid;
  if (value)
  {
    pid = bpf_get_current_pid_tgid() & 0xffffffff;
    target_pid = *(pid_t *)value;
    if (pid == target_pid)
    {
      struct inner_syscall_info *info = bpf_ringbuf_reserve(&syscall_info_buffer, sizeof(struct inner_syscall_info), 0);
      if (!info)
      {
        bpf_printk("bpf_ringbuf_reserve failed");
        return 1;
      }
      info->mode = SYS_EXIT;
      info->retval = ctx->ret;
      bpf_ringbuf_submit(info, 0);
    }
  }
  return 0;
}

现在，让我们来完善加载器程序中父进程的功能部分。但在进行之前，我们需要理解几个关键函数的工作原理。
1、bpf_object__open: 通过打开由传递路径指向的 BPF ELF 对象文件并在内存中加载它，创建一个 bpf_object 结构体实例。

1	LIBBPF_API struct bpf_object bpf_object__open(const char path);

2、bpf_object__load: 将 BPF 对象加载到内核中。

1	LIBBPF_API int bpf_object__load(struct bpf_object *obj);

3、bpf_object__find_program_by_name: 返回指向有效 BPF 程序的指针。

1	LIBBPF_API struct bpf_program bpf_object__find_program_by_name(const struct bpf_object obj, const char *name);

4、bpf_program__attach: 根据自动检测的程序类型、附加类型和适用的额外参数，将 BPF 程序附加到内核。

1	LIBBPF_API struct bpf_link bpf_program__attach(const struct bpf_program prog);

5、bpf_map__update_elem: 允许在与提供的键对应的 BPF 映射中插入或更新值。

1	LIBBPF_API int bpf_map__update_elem(const struct bpf_map map, const void key, size_t key_sz, const void *value, size_t value_sz, __u64 flags);

6、bpf_object__find_map_fd_by_name: 给定一个 BPF 映射名称，返回该映射的文件描述符。

1	LIBBPF_API int bpf_object__find_map_fd_by_name(const struct bpf_object obj, const char name);

7、ring_buffer__new: 返回指向环形缓冲区的指针。

1	LIBBPF_API struct ring_buffer ring_buffer__new(int map_fd, ring_buffer_sample_fn sample_cb, void ctx, const struct ring_buffer_opts *opts);

第二个参数必须是一个可用于处理从环形缓冲区接收的数据的回调函数。

bool initialized = false;
static int syscall_logger(void *ctx, void *data, size_t len)
{
  struct inner_syscall_info *info = (struct inner_syscall_info *)data;
  if (!info)
  {
    return -1;
  }
  if (info->mode == SYS_ENTER)
  {
    initialized = true;
    printf("%s(", info->name);
    for (int i = 0; i < info->num_args; i++)
    {
      printf("%p,", info->args[i]);
    }
    printf("\b) = ");
  }
  else if (info->mode == SYS_EXIT)
  {
    if (initialized)
    {
      printf("0x%lx\n", info->retval);
    }
  }
  return 0;
}

它会打印系统调用的名称和参数。

8、ring_buffer__consume: 此函数处理环形缓冲区中可用的事件。

1	LIBBPF_API int ring_buffer__consume(struct ring_buffer *rb);

现在我们有了编写加载器所需的一切要素。

// loader.c
#include 
#include "controller.h"
#include 
#include 
#include 
#include 
#include 
void fatal_error(const char *message)
{
  puts(message);
  exit(1);
}
bool initialized = false;
static int syscall_logger(void *ctx, void *data, size_t len)
{
  struct inner_syscall_info *info = (struct inner_syscall_info *)data;
  if (!info)
  {
    return -1;
  }
  if (info->mode == SYS_ENTER)
  {
    initialized = true;
    printf("%s(", info->name);
    for (int i = 0; i < info->num_args; i++)
    {
      printf("%p,", info->args[i]);
    }
    printf("\b) = ");
  }
  else if (info->mode == SYS_EXIT)
  {
    if (initialized)
    {
      printf("0x%lx\n", info->retval);
    }
  }
  return 0;
}
int main(int argc, char **argv)
{
  int status;
  struct bpf_object *obj;
  struct bpf_program *enter_prog, *exit_prog;
  struct bpf_map *syscall_map;
  const char *obj_name = "controller.o";
  const char *map_name = "pid_hashmap";
  const char *enter_prog_name = "detect_syscall_enter"; 
  const char *exit_prog_name = "detect_syscall_exit";
  const char *syscall_info_bufname = "syscall_info_buffer";
  if (argc < 2)
  {
    fatal_error("Usage: ./beetrace ");
  }
  const char *file_path = argv[1];
  pid_t pid = fork();
  if (pid == 0)
  {
    int fd = open("/dev/null", O_WRONLY);
    if(fd==-1){
      fatal_error("failed to open /dev/null");
    }
    dup2(fd, 1);
    sleep(2);
    execve(file_path, NULL, NULL);
  }
  else
  {
    printf("Spawned child process with a PID of %d\n", pid);
    obj = bpf_object__open(obj_name);
    if (!obj)
    {
      fatal_error("failed to open the BPF object");
    }
    if (bpf_object__load(obj))
    {
      fatal_error("failed to load the BPF object into kernel");
    }
    enter_prog = bpf_object__find_program_by_name(obj, enter_prog_name);
    exit_prog = bpf_object__find_program_by_name(obj, exit_prog_name);
    if (!enter_prog || !exit_prog)
    {
      fatal_error("failed to find the BPF program");
    }
    if (!bpf_program__attach(enter_prog) || !bpf_program__attach(exit_prog))
    {
      fatal_error("failed to attach the BPF program");
    }
    syscall_map = bpf_object__find_map_by_name(obj, map_name);
    if (!syscall_map)
    {
      fatal_error("failed to find the BPF map");
    }
    const char *key = "child_pid";
    int err = bpf_map__update_elem(syscall_map, key, 10, (void *)&pid, sizeof(pid_t), 0);
    if (err)
    {
      printf("%d", err);
      fatal_error("failed to insert child pid into the ring buffer");
    }
    int rbFd = bpf_object__find_map_fd_by_name(obj, syscall_info_bufname);
    struct ring_buffer *rbuffer = ring_buffer__new(rbFd, syscall_logger, NULL, NULL);
    if (!rbuffer)
    {
      fatal_error("failed to allocate ring buffer");
    }
    if (wait(&status) == -1)
    {
      fatal_error("failed to wait for the child process");
    }
    while (1)
    {
      int e = ring_buffer__consume(rbuffer);
      if (!e)
      {
        break;
      }
      sleep(1);
    }
  }
  return 0;
}

以下便是 eBPF 程序的部分。所有的 C 语言源码最终会被编译整合成单一的对象文件。

// controller.c
#include "vmlinux.h"
#include 
#include 
#include 
#include "controller.h"
struct
{
  __uint(type, BPF_MAP_TYPE_HASH);
  __uint(key_size, 10);
  __uint(value_size, 4);
  __uint(max_entries, 256 * 1024);
} pid_hashmap SEC(".maps");
struct
{
  __uint(type, BPF_MAP_TYPE_RINGBUF);
  __uint(max_entries, 256 * 1024);
} syscall_info_buffer SEC(".maps");
SEC("tracepoint/raw_syscalls/sys_enter")
int detect_syscall_enter(struct trace_event_raw_sys_enter *ctx)
{
  // Retrieve the system call number
  long syscall_nr = ctx->id;
  const char *key = "child_pid";
  int target_pid;
  // Reading the process id of the child process in userland
  void *value = bpf_map_lookup_elem(&pid_hashmap, key);
  void *args[MAX_ARGS];
  if (value)
  {
    target_pid = *(int *)value;
    // PID of the process that executed the current system call
    pid_t pid = bpf_get_current_pid_tgid() & 0xffffffff;
    if (pid == target_pid && syscall_nr >= 0 && syscall_nr < MAX_SYSCALL_NR)
    {
      int idx = syscall_nr;
      // Reserve space in the ring buffer
      struct inner_syscall_info *info = bpf_ringbuf_reserve(&syscall_info_buffer, sizeof(struct inner_syscall_info), 0);
      if (!info)
      {
        bpf_printk("bpf_ringbuf_reserve failed");
        return 1;
      }
      // Copy the syscall name into info->name
      bpf_probe_read_kernel_str(info->name, sizeof(syscalls[syscall_nr].name), syscalls[syscall_nr].name);
      for (int i = 0; i < MAX_ARGS; i++)
      {
        info->args[i] = (void *)BPF_CORE_READ(ctx, args[i]);
      }
      info->num_args = syscalls[syscall_nr].num_args;
      info->syscall_nr = syscall_nr;
      info->mode = SYS_ENTER;
      // Insert into ring buffer
      bpf_ringbuf_submit(info, 0);
    }
  }
  return 0;
}
SEC("tracepoint/raw_syscalls/sys_exit")
int detect_syscall_exit(struct trace_event_raw_sys_exit *ctx)
{
  const char *key = "child_pid";
  void *value = bpf_map_lookup_elem(&pid_hashmap, key);
  pid_t pid, target_pid;
  if (value)
  {
    pid = bpf_get_current_pid_tgid() & 0xffffffff;
    target_pid = *(pid_t *)value;
    if (pid == target_pid)
    {
      struct inner_syscall_info *info = bpf_ringbuf_reserve(&syscall_info_buffer, sizeof(struct inner_syscall_info), 0);
      if (!info)
      {
        bpf_printk("bpf_ringbuf_reserve failed");
        return 1;
      }
      info->mode = SYS_EXIT;
      info->retval = ctx->ret;
      bpf_ringbuf_submit(info, 0);
    }
  }
  return 0;
}
char LICENSE[] SEC("license") = "GPL";

编译之前，我们不妨先构建一个测试程序，以便后续使用我们的工具对其进行追踪分析。

#include
int main(){
    puts("tracer in action");
    return 0;
}

可以利用下面提供的 Makefile 来完成所有相关组件的编译工作。

1
2
3

compile:
	clang -O2 -g -Wall -I/usr/include -I/usr/include/bpf -o beetrace loader.c -lbpf
	clang -O2 -g -target bpf -c controller.c -o controller.o

整个代码可以在以下的GitHub仓库中找到：
https://github.com/0xSh4dy/bee_tracer

参考链接：

Russ Cox 引退以及他的新项目 Oscar

2024-08-02T06:51:25.000Z

Go 第一代技术领导人 Rob Pike, 近两年已经隐居澳大利亚。
Go 第二代技术领导人 Russ Cox 2024 年 8 月 2 日宣布卸任，转战 AI 项目，聚焦 Oscar 项目。
Go 第三代技术领导人 Austin Clements, 同样和 Russ Cox 一样毕业于美国的一个计算机技术比较出名的一个学院，算是 Russ Cox 的师弟，Austin是Go语言运行时系统和垃圾收集器的主要贡献者之一，在运行时和内存管理等底层系统方面有深入的专长。

Russ Cox 他在网上的 ID 是 rsc，他是麻省理工学院 MIT 2008 届的博士毕业生，他本科和研究生都是在哈佛大学就读的，Go team 里的又一个学神。他所在的项目组是隶属于 MIT 计算机科学与人工智能实验室的并行与分布式操作系统组，据网上的资料 Austin Clements 也是在这个实验室这个组。

Russ 在哈佛大学就读期间就在 Bell Labs 贝尔实验室里实习（Russ 出生成长的家就在贝尔实验室附近，所以他从高中时期就一直在贝尔实验室的计算机科学部门泡着，所以大佬们是不是关注一下学区房，自己做不到也要为下一代考虑下：）），那时候他和 Rob Pike 一起开发贝尔实验室的分布式操作系统 Plan 9 (上世纪 80 年代末由贝尔实验室的 Ken Thompson 和 Rob Pike 等人发起并领导的项目)，后来他去 MIT 攻读博士学位期间顺便去了 Google 实习，就在他博士快毕业的时候，Rob Pike 和 Ken Thompson 一起和他介绍了他们正在设计的一门新语言 Go，并大概是这么对他说的：“嘿，我们正试图把我们以前在 Plan 9 开发软件时非常喜欢的所有东西用在那些我们想在 Google 里写的软件里，你想过来帮忙一起搞吗？”，然后 Russ 就这样被这两位传奇程序员拉拢进来，事实上 Russ 一直都认为他能在博士毕业以后直接加入 Go 团队是发生在他人生中最幸运的事之一，他说仿佛自己过去十年所学的一切东西就是为了这一刻而准备的。

他加入团队之后就接手了编译器和 Runtime 这两大核心模块，并协助一起开发了标准库，之后依靠这些先前的经验，他和其他人一起完成了标准库后续的所有重构和优化，这就是为什么当你去看 Go 语言的源码的时候会发现 Russ 的名字几乎无处不在，到处都是他的 commits。

在整个 Go 代码仓库中，Russ Cox 提交的代码量是最多的。（请注意，下图中的人物都是大佬，三代领导人都在里面，包括两巨头和 Ian）

考虑到Russ Cox在Go项目中的资历和地位以及大学的经历,他可能在某些方面扮演了Austin Clements的导师角色,但这只是推测。我同样推测 Russ Cox 和 Rob Pike 之间也有类似的师承关系。只不过国外可能没有咱们中国这种拜师的礼仪，没有磕头敬过酒。

从 Russ Cox 的信中，可以看到实际他领导 Go 项目已经 12 年，从曾经充满理想、热情澎湃的有志青年，已经进入到经历沧桑的中年，他也在思考自己的职业规划。

尤其最近几位知名 Gopher 大佬对他的批评，不知道是否导致他引退的导火索呢？或许大佬内心受伤了，心灰意冷了。

作为一个绝顶聪明，学历和资历都是金字塔的技术大牛，正处于正当打的年纪，你猜 Ross Cox 下一步会做些什么？

当然是结合当前炙热的 AI 技术，再结合 Go 的经验，做一点有意义的事情，说不定又会发展为一个明星的项目。

这个项目叫 Oscar （奥斯卡），一个开源的贡献者 Agent架构。事实上前几天 Russ Cox 已经透露了它的第一个原型：gabyhelp

Oscar 旨在通过创建用于开源维护的 自动化帮助 或 Agent 来改进开源软件开发。我们相信有很多机会可以减少维护大型和小型开源项目所涉及的辛苦。

这句话已经完全说明这个项目的远景了。

大型语言模型(LLMs)能够对自然语言(如问题报告或维护者指令)进行语义分析,并在自然语言指令和程序代码之间进行转换,这为代理与人更顺畅地交互创造了新的机会。LLMs可能最终只是整个图景中小小的(但关键的!)一部分; Agent的大部分行为将是执行标准的、确定性的代码。

Oscar与许多以开发为中心的LLMs使用方式不同,它完全不试图增强或取代编码过程。毕竟,编写代码是开发软件中最有趣的部分。相反,这个想法是专注于那些不那么有趣的部分,比如处理新提交的问题、将问题与现有文档匹配等。

奥斯卡在很大程度上是一个实验。其实 Russ Cox 目前也还不知道它最终会去哪里。即便如此，他们的第一个原型，即 @gabyhelp 机器人，已经在 Go 问题跟踪器中进行了许多成功的交互。这也许是让 Russ Cox 兴奋准备大干一场的动力吧。

目前，Oscar 是在 Go 项目的主持下开发的。在未来的某个时候，它可能会（也可能不会）被分拆成一个单独的项目。

Oscar项目的具体目标是：

减少维护人员解决问题的工作量 [请注意，解决并不总是意味着修复]
减少维护人员解决更改列表（CL）或拉取请求（PR）的工作量 [请注意，解决并不总是意味着提交/合并]
减少维护者解决论坛问题的工作量
让更多人成为高效的维护者

和 Copilot 等工具不同，自动化编码不是 Oscar目标。相反，我们专注于自动化维护人员的工作。

维护者的辛苦并不是 Go 项目所独有的，因此 Oscar的目标是构建一个任何软件项目都可以重用和扩展的架构，构建他们自己的 Agent，根据项目的需求进行定制。因此 Oscar 是：开源贡献者代理架构。等他们完成额差不多，国内的头部互联网也就会推出类似的产品了。

到目前为止， Russ Cox 已经确定了三项能力，它们将成为奥斯卡的重要组成部分：

在贡献者交互期间索引和显示相关的项目上下文。
使用自然语言来控制确定性工具。
分析问题报告和 CL/PR，以帮助在提交期间或提交后不久实时改进它们，并适当地标记和路由它们

具体的方法 Russ Cox 也在下面这篇文档中描述清楚了，大家可以进一步的了解。
Oscar，一个开源的贡献者代理架构

参考资料：

128位整数的原子操作

2024-06-16T03:42:29.000Z

我们已经知道，标准库中的 atomic 针对 int32/uint32、int64/uint64 提供了原子操作的方法和函数，但是如果针对 128 bit 的整数呢？

当然使用128 bit 整数的原子操作的场景可能比较少，也不会有太多人有这个需求，但是如果我们需要对几个 32 bit、64 bit 变量进行原子操作吗， atomic128 可能就很有用。

tmthrgd/atomic128 在几年前提供了 atomic 128 的实验性功能，最后放弃了，但是他提供了一个思路，可以使用 CMPXCHG16B 指令为 AMD 64 架构的CPU 提供 atomic 128 功能。

CAFxX/atomic128 fork 了上面的项目，继续维护，还是使用 CMPXCHG16B 指令，只为 AMD 64 架构提供原子操作。

首先我们看看它的功能然后再看一看它的实现，最后我们思路发散一下，看看使用 AVX 为 128 bit 甚至更多 bit 的整数提供原子操作是否可行。

atomic128 的方法

Package atomic128 实现了对 128 bit值的原子操作。在可能的情况下（例如，在支持 CMPXCHG16B 的 amd64 处理器上），它会自动使用 CPU 的原生特性来实现这些操作；否则，它会回退到基于互斥锁（mutexes）的方法。

Go 的基本整数中不包含 int128/uint128，所以这个库先定义了一个 Int128 的类型：

type Uint128 struct {
	d [3]uint64
	m sync.Mutex
}

然后类似标准库 atomic 中对各种整数的操作，它也提供了类似的方法：

func AddUint128(ptr *Uint128, incr [2]uint64) [2]uint64
func CompareAndSwapUint128(ptr *Uint128, old, new [2]uint64) bool
func LoadUint128(ptr *Uint128) [2]uint64
func StoreUint128(ptr *Uint128, new [2]uint64)
func SwapUint128(ptr *Uint128, new [2]uint64) [2]uint64
func OrUint128(ptr *Uint128, op [2]uint64) [2]uint64
func AndUint128(ptr *Uint128, op [2]uint64) [2]uint64
func XorUint128(ptr *Uint128, op [2]uint64) [2]uint64

可以看到，除了正常的 Add、CAS、Load、Store、Swap 函数，还贴心的提供了 Or、And、Xor 三个位操作的函数。

下面是一个简单的例子:

n := &atomic128.Uint128{}
v := atomic128.LoadUint128(n) // [2]uint64{0, 0}
		
atomic128.StoreUint128(n, [2]uint64{1, ^uint64(0)})
v = atomic128.LoadUint128(n) // [2]uint64{1, ^uint64(0)}
v = AddUint128(n, [2]uint64{2, 40})
v = atomic128.LoadUint128(n) // [2]uint64{3, 40}
v = atomic128.SwapUint128(n, [2]uint64{4, 50})
v = atomic128.LoadUint128(n) // [2]uint64{4, 50}
v = atomic128.CompareAndSwapUint128(n, [2]uint64{4, 50}, [2]uint64{5, 60})
v = atomic128.LoadUint128(n) // [2]uint64{5, 60}
v = atomic128.OrUint128(n, [2]uint64{0, 0})
v = atomic128.LoadUint128(n) // [2]uint64{5, 60}

atomic128 的实现

聪明的你也许看到Uint128的定义的时候就会感觉有一点不对劲，为啥128bit的整数要用3个64bit的整数来表示呢？ 2个Uint64不就够了吗？

这是为了保证128位对齐，类似的技术在Go 1.20之前的WaitGroup中也有使用。进一步了解可以查看：

通过包含三个Uint64元素的数组，我们总能通过下面的方法得到128位对齐的地址：

func addr(ptr *Uint128) *[2]uint64 {
	if (uintptr)((unsafe.Pointer)(&ptr.d[0]))%16 == 0 { // 指针已经128位对齐
		return (*[2]uint64)((unsafe.Pointer)(&ptr.d[0]))
	}
	return (*[2]uint64)((unsafe.Pointer)(&ptr.d[1])) // 必然ptr.d[1]是128位对齐的 (AMD64架构)
}

通过变量useNativeAmd64判断CPU是否支持CMPXCHG16B指令：

1
2
3

func init() {
	useNativeAmd64 = cpuid.CPU.Supports(cpuid.CX16)
}

如果不支持，回退到使用Mutex实现一个低效的atomic 128bit原子操作:

func CompareAndSwapUint128(ptr *Uint128, old, new [2]uint64) bool {
	if runtime.GOARCH == "amd64" && useNativeAmd64 {
		return compareAndSwapUint128amd64(addr(ptr), old, new)
	}
    // 不支持CMPXCHG16B指令，使用Mutex
	ptr.m.Lock()
	v := load(ptr)
	if v != old {
		ptr.m.Unlock()
		return false
	}
	store(ptr, new)
	ptr.m.Unlock()
	return true
}

如果支持CMPXCHG16B指令，直接调用compareAndSwapUint128amd64函数：

TEXT ·compareAndSwapUint128amd64(SB),NOSPLIT,$0
	MOVQ addr+0(FP), BP
	MOVQ old+8(FP), AX
	MOVQ old+16(FP), DX
	MOVQ new+24(FP), BX
	MOVQ new+32(FP), CX
	LOCK
	CMPXCHG16B (BP)
	SETEQ swapped+40(FP)
	RET

主要依赖CMPXCHG16B实现。

CMPXCHG16B是一条X86体系结构中的指令,全称为"Compare and Exchange 16 Bytes"。它用于原子地比较和交换16个字节(128位)的内存区域。
这条指令的作用是:

将要比较的16个字节的内存值加载到一个寄存器中。
将要写入的16个字节的值加载到另一个寄存器中。
比较内存中的值和第一个寄存器中的值是否相等。
如果相等,则用第二个寄存器中的值覆盖内存中的值。
根据比较结果,设置相应的标志位。

思路发散

当前很多号称性能优化的库，可能会使用SIMD指令集来提高性能，比如AVX、SSE等。那么，我们是否可以使用AVX指令集来实现对128位整数甚至256、512位整数的原子操作呢？

有一篇很好的文章介绍了这方面的探索:Aligned AVX loads and stores are atomic。

各家处理器手册中并没有为AVX指令集提供原子性的担保。The AMD64 Architecture Programmer’s Manual只是保证了内存操作最大8个字节，CMPXCHG16B是原子的。The Intel® 64 and IA-32 Architectures Software Developer’s Manual也做了类似的保证。此外，Intel手册明确指出AVX指令没有任何原子性保证。

这篇文章的作者做了实验，得出下面的结论:

尽管看起来对齐的 128 位操作室原子的，但是 CPU 提供商没有提供担保，我们还是使用 CMPXCHG16B 指令保险。

Go 朝着错误的方向发展

2024-06-11T14:02:06.000Z

这是 Aliaksandr Valialkin 昨天刚写的一篇文章, 心有戚戚焉，所以特意翻译成中文，个人感觉，自从Rob Pike退休后，Go在大方向迷失了，正如老貘(Go101)所说，目前Go的开发就像完成KPI一样，也许, 大师不会再回来了。

Aliaksandr Valialkin是fasthttp的作者，也是VictoriaMetrics开发者，一位资深的Go程序员。

以下是译文。

以下是对原文的地道中文翻译:

Go编程语言以易于使用而闻名。得益于经过深思熟虑的语法、特性和工具,Go允许编写任意复杂度的易读易维护的程序(参见GitHub上的这个列表)。

有些软件工程师称Go为"无聊"和"过时",因为它缺乏其他编程语言的高级特性,如单子、Option类型、LINQ、借用检查器、零开销抽象、面向方面编程、继承、函数和运算符重载等。虽然这些特性在特定领域可能可以简化编码,但它们除了好处之外还有非零的成本。这些特性通常对锻炼大脑有好处。但是在处理生产代码时,我们不需要额外的精神负担,因为我们已经很忙于解决业务任务了。所有这些特性的主要成本是增加了结果代码的复杂性:

仅仅通过阅读代码就变得更难理解正在发生的事情;
调试此类代码变得更加困难,因为您需要跳过数十个非平凡的抽象才能到达业务逻辑;
由于这些特性施加的限制,为此类代码添加新功能变得更加困难。

这可能会显著减慢甚至阻碍代码开发的进度。这就是Go一开始就没有这些特性的主要原因。

不幸的是,一些这样的特性开始出现在最新的Go版本中:

泛型已在Go1.18中添加。许多软件工程师希望Go有泛型,因为他们认为这将大大提高Go的生产力。Go1.18发布已经两年了,但没有迹象表明生产力有所提高。Go中泛型的整体采用率仍然很低。为什么?因为大多数实际的Go代码根本不需要泛型。另一方面,泛型显著增加了Go语言本身的复杂性。例如,尝试理解泛型添加后Go类型推断的所有细节。它的复杂性看起来已经非常接近于C++的类型推断了:)另一个问题是Go中的泛型缺乏C++模板中存在的基本特性。例如,Go泛型不支持泛型类型的泛型方法。它们也不支持模板特化和模板模板参数,以及许多其他需要充分利用泛型编程的特性。让我们将这些缺失的特性添加到Go中吧!等等,那我们就得到另一个过于复杂的C++克隆了。那么,为什么要一开始就将半生不熟的泛型添加到Go中呢?🤦
根据这个提交,Range over functions 又名迭代器、生成器或协程将在 Go 1.23 中添加。让我们仔细看看这个"特性"。

Go1.23 中的迭代器

如果你不太熟悉Go中的迭代器,请阅读这篇出色的介绍文章。本质上,这是一种语法糖,允许在具有特殊签名的函数上使用for...range循环。这使得可以编写遍历自定义集合和类型的自定义迭代器。听起来像是一个很棒的功能,不是吗?让我们试着弄清楚这一功能解决了哪些实际问题。这在这里有概述:

Go语言没有标准的方式来遍历一系列值。由于缺乏约定,我们最终使用了各种各样的方法。每种实现都是根据当时的上下文做出最合理的决定,但是孤立地做出的决策导致了用户的困惑。

仅在标准库中,我们就有archive/tar.Reader.Next、bufio.Reader.ReadByte、bufio.Scanner.Scan、container/ring.Ring.Do、database/sql.Rows、expvar.Do、flag.Visit、go/token.FileSet.Iterate、path/filepath.Walk、go/token.FileSet.Iterate、runtime.Frames.Next和sync.Map.Range,几乎没有任何一个在迭代的确切细节上达成一致。即使函数签名相同,语义也不总是一致。例如,大多数返回(T, bool)的迭代函数都遵循Go的惯例,即bool表示T是否有效。相反,runtime.Frames.Next返回的bool则表示下一次调用是否会返回有效的内容。

当你想要遍历某些内容时,你首先必须了解你调用的特定代码是如何处理迭代的。这种不统一阻碍了Go追求的在大型代码库中方便移动的目标。人们常常将Go代码看起来都大致相同作为一个优势,但对于包含自定义迭代的代码而言,这显然是不真实的。

再说一次,拥有在Go中遍历各种类型的统一方式听起来是合理的。但是对于作为Go主要优势之一的向后兼容性又如何呢?根据Go的兼容性规则,上面提到的标准库中所有现有的自定义迭代器将永远保留在标准库中。因此,所有新的Go版本在标准库中都将至少提供两种不同的方式来遍历各种类型 —— 旧的方式和新的方式。这增加了Go编程的复杂性,因为:

您需要了解遍历各种类型的两种方式,而不是单一方式。
您需要能够阅读和维护使用旧迭代器的旧代码,以及可能使用旧迭代器、新迭代器或同时使用两种迭代器类型的新代码。
在编写新代码时,您需要选择适当的迭代器类型。

Go1.23 中迭代器的其他问题

以下是对原文的地道中文翻译:

在Go 1.23之前,for...range循环只能应用于内置类型:整数(从Go1.22开始)、字符串、切片、映射和通道。这些循环的语义很清晰,易于理解(遍历通道的循环语义更加复杂,但如果你处理并发编程,那你应该很容易理解)。

从Go 1.23开始,for...range循环可以应用于具有特殊签名的函数(又称拉取和推送函数)。这使得单凭阅读代码就无法理解给定的看似无辜的for...range循环到底会在底层做什么。它可以做任何事情,就像任何函数调用一样。不同之处在于,Go中的函数调用一直都是显式的,比如f(args)，而for...range循环隐藏了实际的函数调用。另外,它还对循环体应用了一些不太明显的转换:

它隐式地将循环体包裹在一个匿名函数中,并隐式地将这个函数传递给推送迭代器函数。
它隐式地调用匿名的拉取函数,并将返回的结果传递给循环体。
它隐式地将return、continue、break、goto和defer语句转换为另一个不太明显的语句,存在于传递给推送迭代器函数的匿名函数中。

另外,在一般情况下,在循环迭代之后使用迭代器函数返回的参数是不安全的,因为迭代器函数可能会在下一次循环迭代时重用它们。

Go 曾因易于阅读和理解的显式代码执行路径而闻名。这一特性在 Go1.23 中不可逆转地被破坏了:(我们用什么来交换?另一种遍历类型的方式,它具有一些隐式的语义,而且在某些情况下行为与广告描述的不同。当遍历可能在迭代过程中返回错误的类型时(例如database/sql.Rows、path/filepath.Walk 或任何其他在迭代过程中进行 IO 操作的类型),这种新方式就无法按预期工作,因为你需要手动检查迭代错误,无论是在循环内部还是在循环之后,这与使用旧方法的做法是一样的。

即使你使用不会返回错误的迭代器,生成的 for ... range 循环也看起来比使用显式回调的旧方法更加不清晰。哪种代码更容易理解和调试?

1
2
3

tree.walk(func(k, v string) {
  println(k, v)
})

1
2
3

for k, v := range tree.walk {
  println(k, v)
}

请记住,后一个循环会被隐式地转换为前一个带有显式回调调用的代码。现在让我们从循环中返回一些东西:

for k, v := range tree.walk {
  if k == "foo" {
    return v
  }
}

它被隐式转换为难以跟踪的代码，类似于以下代码：

var vOuter string
needOuterReturn := false
tree.walk(func(k, v string) bool {
  if k == "foo" {
    needOuterReturn = true
    vOuter = v
    return false
  }
})
if needOuterReturn {
  return vOuter
}

看起来很容易调试:)

如果tree.walk通过从字节切片进行不安全转换将v传递给回调函数,那么这段代码可能会崩溃,因为v的内容在下一次循环迭代时可能会发生变化。因此,隐式生成的防弹代码必须使用strings.Clone()函数,这可能导致不必要的内存分配和复制:

var vOuter string
needOuterReturn := false
tree.walk(func(k, v string) bool {
  if k == "foo" {
    needOuterReturn = true
    vOuter = strings.Clone(v)
    return false
  }
})
if needOuterReturn {
  return vOuter
}

range over func这一特性对函数签名施加了限制。这些限制不适用于所有需要遍历集合元素的场景。这迫使软件工程师在使用for...range循环时进行丑陋的hack,以及编写理想情况下适合给定任务的显式代码之间做出艰难选择。

结论

令人遗憾的是,Go开始朝着增加复杂性和隐式代码执行的方向发展。也许我们需要停止添加增加Go复杂性的新功能,而是专注于Go的核心特性 - 简单性、高效性和性能。例如,最近Rust开始在对性能要求苛刻的领域取代Go的份额。我相信如果Go核心团队专注于优化热循环,比如循环展开和SIMD使用,这种趋势是可以扭转的。这不应该太过影响编译和链接速度,因为只有少量编译后的Go代码需要优化。没有必要试图优化所有简单代码的变体 - 这些代码即使优化了热循环也仍然会很慢。只需针对那些由注重代码性能的软件工程师故意编写的特定模式进行优化就足够了。
Go比Rust容易使用得多。为什么要在性能竞赛中输给Rust呢?
Go可以获得的另一个有用特性的例子是,在不增加语言本身和使用这些特性的Go代码复杂性的情况下,进行类似于小的改善代码质量的改进。

我是谁?

我是一名专门编写简单、面向性能的Go代码的软件工程师,如VictoriaMetrics、quicktemplate、fastjson、fasthttp、fastcache、easyproto等。多亏了Go,我一直试图遵循KISS(Keep It Simple,Stupid)设计原则。

Rob Pike 语录

2024-06-10T04:39:59.000Z

1. 计算机领域里，没有什么问题是加一层间接寻址解决不了的。

There's nothing in computing that can't be broken by another level of indirection.

这是 Rob Pike 的修改版。

经常 level of insriection 误引用为 abstraction layer。

原始版本出自 Butler Lampson
All problems in computer science can be solved by another level of indirection

但是 David Wheeler 完成了下半句：
All problems in computer science can be solved by another level of indirection, except for the problem of too many layers of indirection.

还有 Kevlin Henney 的下半句：
ll problems in computer science can be solved by another level of indirection, except for the problem of too many layers of indirection."

From Beautiful Code: Another Level of Indirection

这句话幽默地指出，在计算机编程中，通过引入额外的抽象层或中间层，几乎可以解决任何复杂的问题。这种思路在软件设计和架构中很常见。

2. 数据为王。如果你选择了正确的数据结构，并且组织得当，算法几乎总是不言自明的。编程的核心在于数据结构，而不是算法。

Data dominates. If you've chosen the right data structures and organized things well, the algorithms will almost always be self-evident. Data structures, not algorithms, are central to programming.

"数据为王"意味着在软件开发中，数据的组织和表示方式比实现算法的具体细节更加重要。
这个观点强调了良好的数据结构设计对于编程效率和代码质量的重要性。它鼓励程序员把更多精力放在思考如何组织和表示数据上，而不是过分关注算法的技巧性。

3. 面向对象设计就是计算机界的罗马数字。

Object-oriented design is the roman numerals of computing.

这是一句颇具争议性和挑衅性的话。罗马数字在数学史上曾经很重要，但现代计算中已被阿拉伯数字体系取代，因为后者更简单、更高效。这句话暗示面向对象设计（OOD）也是如此。

Pike认为，就像罗马数字对现代数学来说过于繁琐和低效一样，面向对象编程（OOP）的某些方面（如过度的类层次结构和封装）可能导致代码复杂、难以理解和维护。

这个比喻引发了编程圈内的热议。支持者认为它点出了OOP的一些问题，如过度设计和不必要的复杂性。反对者则认为OOP仍然是一个强大和有用的范式。

值得注意的是，Pike是Go语言的创始人之一，Go语言采用了一种不同于传统OOP的设计哲学，更注重简单性和数据结构。

4. 最后，我意识到光想是没什么出路的，该动手实践了。

Eventually, I decided that thinking was not getting me very far and it was time to try building.

这句话体现了一种在技术和创新领域常见的实用主义态度。

"光想没出路"是一种常见的中文表达，意思是仅靠思考而不付诸行动是难以取得进展的。

"动手实践"强调了在实践中学习和创新的重要性。在编程、创业等领域，这种"边做边学"的方法被广泛推崇。

但这并不是完全否定思考的价值。恰当的思考和规划仍然重要，只是强调不要陷入"分析瘫痪"（analysis paralysis），即过度分析导致迟迟不能行动的状态。

5. 见识短浅，想象力就会受限。

Narrowness of experience leads to narrowness of imagination.

更为甚者，见识短浅，反而将大师的作品视为平庸。一个讽刺性的文章： The Evolution of a Go Programmer

6. 这就是现代计算：简单的东西变得过于复杂，因为随意捣鼓太容易；复杂的东西依旧复杂，因为修复太难。

Such is modern computing: everything simple is made too complicated because it's easy to fiddle with; everything complicated stays complicated because it's hard to fix.

Rob Pike 作为一位推崇简洁设计的大师，他对当前计算机行业的复杂性提出了犀利的批评。

第一部分讽刺了一些程序员或设计师的倾向：明明有简单的解决方案，却偏爱使用复杂的技术，导致本来简单的问题变得难以理解和维护。

第二部分点出了一个现实问题：一旦系统变得复杂，就很难简化。原因可能包括兼容性问题、团队惯性、或者是简单地因为理解和重构复杂系统需要大量时间和资源。

它呼应了UNIX哲学中的一个核心原则：做好一件事。也就是说，程序应该简单、模块化，只专注于完成一个任务。

7. 过程名应该反映它做什么；函数名应该反映它返回什么。

Procedure names should reflect what they do; function names should reflect what they return

这是编程领域的一条重要命名规范，有助于提高代码的可读性和可维护性。

在中文编程圈，"过程"（procedure）和"函数"（function）的区别经常被讨论。简单来说：

"过程"执行一系列操作，通常不返回值，重点在于"做"。
"函数"计算并返回一个值，重点在于"得到"什么。

8. 花哨的算法在 N 小的时候很慢，而 N 通常都很小。

Fancy algorithms are slow when N is small, and N is usually small.

"N" 在算法分析中代表输入规模，如要排序的元素个数、要搜索的数据量等。"大 O 表示法"（如 O(n)、O(n²)）就是用 N 来描述算法在最坏情况下的时间复杂度。

这句话的启示：

不要过早优化。在数据量小的情况下，简单直白的算法可能更快、更易理解。
理解实际问题的规模。过度设计（用复杂算法解决小问题）可能适得其反。
= 在选择算法时，要考虑具体场景，不能只看理论复杂度。

俗语"大炮打蚊子"，就是类似的道理。有时候，简单的方法反而更有效。

9. UNIX不仅已经死了，臭的都快熏死人了。

Not only is UNIX dead, it's starting to smell really bad.

在1990年代，微软的Windows和IBM的OS/2等图形用户界面（GUI）操作系统开始流行，而基于命令行的UNIX看起来过时了。一些人认为，用户友好的GUI是未来，UNIX这样的系统已经落伍，注定会消亡。
讽刺的是，这个预言并没有完全实现：

Linux（一个UNIX类操作系统）在服务器领域占据主导地位。
macOS基于BSD（另一个UNIX变种）。
甚至Windows 10也加入了Linux子系统。

这句话现在常被用来嘲笑那些过早宣布某项技术"死亡"的人。

10. 想要杜绝傻瓜行为的编程语言，往往自己也变得傻不拉几。

Languages that try to disallow idiocy become themselves idiotic.

过度限制程序员可能弊大于利：

好的程序员应该被信任和赋能，而不是被当成"傻瓜"对待。
有时，所谓的"傻瓜行为"其实是创新和效率的源泉。
语言应该提供工具和指导，而不是强制规定唯一的"正确"方式。

这句话也反映了一个更广的设计哲学：过度设计来防止错误，可能带来更多问题。无论是编程语言、产品设计还是管理，给予用户或团队合理的自由和信任，往往比试图规避一切风险更有效。

11、缓存不是架构，只是个优化手段而已。

Caches aren't architecture, they're just optimization.

Pike的观点是：

不要因为缓存效果好，就把它当成架构的一部分。
如果没有缓存系统就崩溃，那可能是架构有问题。
缓存应该是"锦上添花"，而不是"救命稻草"。

但这并不意味着缓存不重要。实际上：

合理使用缓存可以极大提升性能。
在某些场景（如高并发网站），缓存几乎是必需的。

关键是平衡：

先有好的架构和算法。
在合适的地方加缓存，但不要让系统对缓存产生依赖。
缓存失效或穿透时，系统应该能够"优雅降级"。

用中文的一句话概括就是："先治本，再治标"。缓存是"标"（优化性能），好的架构才是"本"。

12、没有类型层次，就不用费劲去管理类型层次了。

When there is no type hierarchy you don't have to manage the type hierarchy.

它直指面向对象编程（OOP）中一个常见的复杂性来源。"类型层次"主要指面向对象语言中的类继承结构：

"没有类型层次"并非完全否定OOP，而是指一种不同的设计风格：

组合优于继承：用组合（has-a）而不是继承（is-a）来复用代码。
接口而非基类：定义行为协议，而不是强制继承关系。
简单类型：类的职责单一，减少复杂的层次结构。

这种思想在Go语言中很明显：

Go没有类和继承，但有结构体和接口。
结构体可以嵌入其他结构体来复用字段和方法，但不是继承。
接口是隐式的：只要一个类型实现了接口的所有方法，它就"是"那个接口。

13、按工程管理的规则，生产力最重要；可在工程师眼里，乐趣才是第一位。生产力源于乐趣。

Productivity is most important by engineering management rules, but enjoyment is most important for engineers. One stems from the other.

这里的"乐趣"不只是表面的快乐，更指：
- 解决有趣问题的满足感。
- 创造优雅代码的成就感。
- 与团队协作的归属感。
- 学习新技术的好奇心。
优秀的工程师往往被这些内在动机驱动，而不仅仅是外部压力。

Pike指出，高生产力实际上源于工程师的乐趣。
当工程师享受工作时，他们会：

自发加班，因为问题太有趣了。
主动优化代码，因为看到丑陋的代码会不舒服。
积极学习，因为新技术太酷了。
这些行为自然而然地提高了生产力。

这一观点在软件行业有广泛共识：

Google的20%时间：员工可以花20%工作时间做自己感兴趣的项目。许多重要产品（如Gmail）就是这样诞生的。虽然说现在Google已经去掉了20%工作时间的政策。
开源社区：大多数贡献者是因为热情而不是报酬。这种模式创造了Linux、Python等。
创业文化：舒适的办公环境、弹性工作制，都是为了让员工更快乐，从而更有创造力。

对管理者的启示：

不要只盯着KPI。创造让工程师愉悦的环境，生产力自然会提高。
理解并尊重工程师的动机。有时，让他们"玩"反而能得到更好的结果。

对工程师的启示：

追求技术乐趣并不自私。它能让你更高效，也让产品更优秀。
但也要有度。纯粹追求个人兴趣而忽视团队目标，同样问题。

14、第一法则：你猜不准程序会在哪里耗时。性能瓶颈总在意想不到的地方冒出来，所以别想当然去优化，除非你证实了那里就是瓶颈所在。

Rule 1. You can't tell where a program is going to spend its time. Bottlenecks occur in surprising places, so don't try to second guess and put in a speed hack until you've proven that's where the bottleneck is

"猜不准程序会在哪里耗时"：
- 程序性能不是直观的。即使是经验丰富的程序员，也常常错误预测哪部分代码最慢。
- 现代系统复杂（多线程、缓存、编译器优化等），让性能特征更难预测。
"性能瓶颈总在意想不到的地方冒出来"：
- "性能瓶颈"是限制整体性能的最慢部分。就像木桶，最短的那块板决定了水位。
- "意想不到"暗示即使是看似简单的代码，也可能因为被频繁调用或数据量大而成为瓶颈。
"别想当然去优化"：
"想当然"在中文里就是不经证实就认定。这在性能优化中很危险。
过早优化（premature optimization）是编程界臭名昭著的反模式。它可能导致：
- 代码复杂化，难以理解和维护。
- 浪费时间在实际上不慢的部分。
- 引入新的bug或性能问题。
"除非你证实了那里就是瓶颈所在"：
- "证实"是关键。不是猜测，而是通过性能分析工具（profiler）确定。
- 现代profiler可以精确定位耗时函数、内存分配等，让优化有的放矢。

这一法则的实践：

先让它跑起来（Make it work）
然后让它对（Make it right）
最后才是让它快（Make it fast）
每一步都用数据（profile）来指导，不猜测。

14、扩展

第14条事实上来源自Robe Pike的编程五原则, 包括上面的多条名言:

第一法则：你猜不准程序会在哪儿磨蹭。性能瓶颈总冒出在意想不到的地方，所以别瞎猜着去优化，除非你摸清楚了瓶颈的准确位置。
第二法则：先量化。没测量之前别瞎调速度，就算测出来了，也得是哪块代码严重拖后腿了才优化。
第三法则：花里胡哨的算法在数据小时龟速，而且数据往往就不大。花哨算法有大常数。除非你明摆着要处理大数据，别整那些花活。（就算真遇到大数据，也先用第二法则。）
第四法则：花哨的算法比简单的更容易藏bug，而且实现起来费劲得很。算法要简单，数据结构也要简单。
第五法则：数据为王。如果你选对了数据结构，组织得当，算法几乎都是呼之即来。编程的核心是数据结构，不是算法。

Pike的第一、二法则重申了Tony Hoare的名言："过早优化是万恶之源"。在中文里，"万恶之源"是个很重的词，用在这儿既有警示，也带点调侃。
Ken Thompson把Pike 的第三、四法则总结为："疑难杂症，暴力破解"。 "暴力破解"在中文程序员圈很常见，指不优雅但直接有效的解法。
第三、四法则体现了KISS（Keep It Simple, Stupid）设计哲学。中文常说"简单就是美"，或者IT圈的"能用短裤的地方，别穿西装"。
第五法则早先出现在Fred Brooks的《人月神话》中。程序员们常把它简化为"写傻瓜代码，用聪明对象"。这句话在中文圈也很流行，强调代码逻辑要直白，复杂性应该封装在良好设计的数据结构里。

15、如果POSIX线程算好东西，我都不敢想它比什么还好。

If POSIX threads are a good thing, perhaps I don't want to know what they're better than.

这是一句典型的程序员式嘲讽，直指他认为设计糟糕的一个技术标准。相当于说"它已经够糟了，居然还有比它更糟的？"

Pike为什么这么说？

复杂性：pthreads API被认为过于复杂和底层，容易出错。
死锁风险：错误使用pthreads很容易导致死锁、竞态条件等并发问题。
可移植性问题：尽管POSIX旨在提高可移植性，但不同系统的pthreads实现仍有差异。

16、缓存的bug，哪个不是妖魔鬼怪。

There's no such thing as a simple cache bug.

"缓存"在计算机中无处不在：CPU缓存（L1, L2, L3）、内存缓存（如Redis）、浏览器缓存、数据库查询缓存、CDN（内容分发网络）、DNS缓存等等。

Pike之所以这么说，是因为缓存bug的特点：

诡异性：缓存问题常常表现得不一致、间歇性，像"鬼打墙"。
隐蔽性：问题可能潜伏很久才暴露，像"潜伏的妖怪"。
牵连性：一个小小的缓存问题可能导致系统范围的故障，像"妖风四起"。
难调试：因为缓存常常是分布式的，跟踪问题如同"捉鬼"。
死灰复燃：以为修好了，问题却在高负载时死灰复燃，像"怪物再生"。

17、用 Unix 就跟只听大卫·卡西迪的歌似的，纯属乐坛井底之蛙。

Using Unix is the computing equivalent of listening only to music by David Cassidy.

Rob Pike在一次采访中说了这句话rob pike responds。

Rob Pike可是Unix的大佬级人物，和Ken Thompson、Dennis Ritchie一起在贝尔实验室创造了Unix。他怎么可能真的觉得Unix就像肤浅的流行乐？

现在的macOS（Mach内核）、Linux，甚至Windows（WSL）都有Unix的影子。
Pike仿佛预言般地讽刺："看看，大家最后都来听'大卫·卡西迪'了。"

Rob Pike这句话是典型的技术人的自嘲式炫耀。表面上自贬，实际上是在用幽默的方式表达："对，我们就是主流，因为我们简单好用。学院派笑话我们Low，但最后还不是得用我们的东西？"这种自黑中带着骄傲的调调。

18、"智能"终端可不是"自作聪明"的终端，而是你能调教的好帮手。

A smart terminal is not a smartass terminal, but rather a terminal you can educate.

Rob Pike这句话用带点烟火气的方式，点出了技术设计的一个关键：真正的"智能"不是自作聪明，而是在交互中学习和成长。就像中国老话说的，"学而不舍，才能化茧成蝶"。无论是终端还是人，都是这个道理。

19、Socket 是 IO 接口的 X Window。

Sockets are the X windows of IO interfaces.

表面上是在夸 Socket，就像当年吹捧 X Window 一样，实际上是 Pike 式的反话，意思是："Socket 复杂、难用，就跟 X Window 一样令人头疼。"

为什么 Pike 这么黑 Socket？

复杂性：Socket API 有很多参数、选项和状态，容易用错。
底层性：直接操作网络协议，程序员要处理字节流、缓冲区等底层细节。
错误处理难：网络环境复杂，Socket 编程中的错误情况多，很难全面处理。
跨平台坑多：不同操作系统的 Socket 实现有微妙差异，写出跨平台代码很烦。

20、搞个理论上不那么刺激的编程语言干嘛？因为好用啊，能用才是王道。

Why would you have a language that is not theoretically exciting? Because it's very useful.

这话当然还是出自Rob Pike。作为Unix和Go语言之父，他一贯秉持"实用主义者"的态度。

学院派追求"道"（理论和原则）。Pike强调"术"（实用技巧和方法）。

21、并发不是并行

Concurrency is not parallelism

22、 Go语言箴言

Go Proverbs

Rust tips #81 ~ #90

2024-06-09T03:36:28.000Z

Rust tips #61 ~ #80

2024-06-09T03:36:19.000Z

Tip #61

前几天有人问我关于智能指针的事。这里简单介绍一下 Rc 智能指针的基础知识：

Tip #62

这是一篇关于 Rust 中的错误处理以及如何应用 anyhow 库的精彩文章：

https://antoinerr.github.io/blog-website/2023/01/28/rust-anyhow.html

Tip #63

刚开始学习 Rust 编程时，我惊讶地发现示例中从未见过任何原始指针。常见的都是 Box<>(), Arc<>() 等智能指针。事实上，原始指针确实存在，但在惯用的 Rust 代码中很少使用。深入了解后，这里提供一个 C 语言与 Rust 原始指针的并排对比：

Tip #64

今天我学到了关于 NonZero 数值类型的知识，你可以确保在编译时数值不会为零。它也是一个真正的零成本抽象，因为如果你定义了例如 Option，那么 "0" 值就会映射到 "None"。非常巧妙！这里有个例子：

Tip #65

这里有一篇由 @ThePrimeagen 撰写的有益论述，列举了 Rust 中枚举（Enums）的优势：
RUST Enums ARE Better (youtube.com)

Tip #66

std::time::Instant 可以作为一种简便方式用于测量代码块的执行时间：

use std::time::Instant;
fn main() {
    let start = Instant::now();
    // Your code here
    let duration = start.elapsed();
    println!("Time elapsed: {:?}", duration);
}

Tip #67

单元结构体（Unit Struct）和元组结构体（Tuple Struct）是 Rust 类型系统中实用但不太为人知的构造体。

单元结构体：可以在类型层面表示一个概念，同时也是在无需数据的情况下实现trait的好帮手。
元组结构体：类似于元组，但能实现方法。

struct Unit;
struct Point(i32, i32, i32);
let a = Point(1, 2, 3);
println!("Point Value: ({}, {}, {})", a.0, a.1, a.2);

Tip #68

今天我发现可以在Trait中定义 #常量，而且在trait的具体实现（impl）中也可以重定义这些值。我还在权衡这样做的利弊。你会如何利用这个特性呢？分享你的想法吧！

trait MathConstants {
    const PI: f64;
    const E: f64;
}
struct MyMath;
impl MathConstants for MyMath {
    const PI: f64 = 3.141592653589;
    const E: f64 = 2.718281828459;
}

Tip #69

如果你遇到嵌套的 Option 情况，比如 Option>，你可以使用 .flatten() 方法去除一层嵌套:

fn main() {
    let x: Optioni32>> = Some(Some(42));
    let y: Option<i32> = x.flatten();
    println!("{:?}", y); // 输出: Some(42)
}

Tip #70

这条在 match 语句中使用的神秘语法特性是由一位关注者向我推荐的：

var_name @ match_value => ... 允许你在匹配块中捕获 match_value的值来使用。下面的代码示例应该能清晰地说明这是如何运作的：

let number: i32 = 42;
match number {
    1..=10 => {
        println!("Number is between 1 and 10 (inclusive)");
    }
    n: i32 @ 42 => {
        println!("Number is {}", n);
    }
    n: i32 @ 43..=100 => {
        println!("Number is between 43 and 100 (inclusive): {}", n);
    }
    _ => {
        println!("Number is not in any specified range");
    }
}

Tip #71

Rust 支持与 C 兼容的联合（union）类型。由于联合的成员共享相同的内存，它们本质上是不安全的。我能想到的最佳应用场景是与 C++ 交互，以及可能的二进制数据协议，比如将字节数组与其他类型联合在一起使用。

// Repr C makes the memory layout conform to C's schema.
#[repr(C)]
union MyUnion {
    f1: u32,
    f2: f32,
}
fn main() {
    let mut u = MyUnion { f1: 1 };
    unsafe {
        // Accessing a union's field is unsafe because Rust cannot guarantee
        // the type of data currently being stored in the union.
        u.f1 = 123;
        println!("f1: {}", u.f1);
    }
}

Tip #72

Rust 的数值类型真棒！你可以直接使用点符号表示法在数值上调用常见的数学函数。例如，只需通过调用 32.0.sin() 就能计算32.0的正弦值。这一特性增强了代码的可读性，减少了对冗长函数调用的需求。

fn main() {
    let x = 32.0;
    println!("Sin of {} is: {}", x, x.sin());
}

Tip #73

include_str!() 和 include_bytes!() 宏能够在编译时将文件作为字符串或字节数组包含进来。这样就避免了使用冗长且杂乱的多行字符串字面量。编译器甚至会检查文件是否存在，如果文件缺失，还会报错提示。

// Both of these files are read at compile time.
const FILE_STR: &str = include_str!("./path/to/the/file.txt");
const FILE_BYTES: &[u8] = include_bytes!("./path/to/image.png");
fn main() {
    // Outputs file content as string.
    println!("{}", FILE_STR);
}

Tip #74

Rust 中迭代器的 .zip() 函数能够让两个 Vec 转换成单一的元组 Vec。然而，其语法不如 Python 版本那样方便。但这个问题可以通过优雅地使用泛型来解决：

fn zip(vec1: Vec, vec2: Vec) -> Vec<(T, U)> {
    vec1.into_iter().zip(vec2.into_iter()).collect()
}
fn main() {
    let vec1: Vec<i32> = vec![1, 2, 3];
    let vec2: Vec<char> = vec!['a', 'b', 'c'];
    let zipped: Vec<(i32, char)> = zip(vec1, vec2);
    for pair: (i32, char) in zipped {
        println!("{:?}", pair);
    }
}

Tip 插播一条

标签通常与嵌套循环关联在一起使用。
在下面的例子中，我使用了 break 'outer 从内部循环跳出到外层循环之外。

但实际上，它们的功能远不止于此：你可以在任何 Rust 代码块上标注一个标签！
这开启了一个不错的编程模式，如下所示：

fn do_something() {
    'outer: for x in [0, 1, 2] {
        for y in [3, 4, 5] {
            // This breaks from the inner loop.
            break;
            // This breaks from the outer loop!
            break 'outer;
        }
    }
}

或者

'block: {
    let Some(b) = a else { break 'block };
    let Some(c) = b.c else { break 'block };
    let Some(d) = c.d else { break 'block };
    let Some(e) = d.e else { break 'block };
    return e.compute();
}
otherwise();

Tip #75

标有 Send 标记 trait的类型表示它们在多个线程之间移动是安全的。Rust 利用这一点来确保在编译时的线程安全性。

虽然编译器会自动为许多标准类型实现 Send，但对于自定义类型，我们依靠开发者——Send 是通过不安全代码块添加的：

1
2
3

struct MyType;
unsafe impl Send for MyType {}

Tip #76

快速入门：如何在你的 Rust 代码上运行调试器：

➡️ 使用调试符号构建：

1	cargo build

➡️ 使用 lldb（或更美观输出的 rust-lldb）启动你的程序：

1	lldb target/debug/your_app_name

➡️ 在特定行设置断点：

1	breakpoint set --file src/main.rs --line 10

➡️ 通过名称设置函数断点：

1	breakpoint set --name your_function_name

➡️ 运行你的程序

run

➡️ 运行时的调试命令

frame variable 会显示当前作用域内的所有变量
n 执行当前行然后暂停
s 进入当前行（调用最内层函数并停止）
c 继续执行直到下一个断点

Tip #77

Threads: working together. for CPU bound tasks.
Async: waiting together. for I/O bound tasks.

Tip #78

这里有一个很好的介绍文章，介绍如何从你的 Rust 代码中调用外部进程，并处理输出。

https://rust-lang-nursery.github.io/rust-cookbook/os/external.html

Tip #79

作为函数输入参数使用 &Option 还是 Option<&T>？

通常，Option<&T> 是首选的方式，因为它提供了更多的灵活性转换，并利用了空指针优化（pointer niche optimization）。这意味着它可以自然地接受 None（空值）或 &T（对某个值的引用），并且在内部实现上更为高效，特别是当与 Rust 的零值优化特性结合时。

argument	arg type : Option<&T>	&Option
foo: Option	foo.as_ref()	&foo
foo: Option<&T>	foo	can't be done
foo: T	Some(&foo)	&Some(foo)†
foo: &T	Some(foo)	can't be done

一个专门掰扯这个话题的帖视频：https://www.youtube.com/watch?v=6c7pZYP_iIE

Tip #80

我需要编写一个函数，能够灵活地在编译时定义输出数组的大小。事实证明，const 泛型对此非常有帮助。

"Const 泛型"使我们能够通过常量对类型进行参数化，因此得名。

这种特性允许你在定义泛型时使用编译时常量来指定类型的一部分，比如数组长度或结构体中的字段大小，从而在编译时就能确定这些值，而非运行时。这样可以提高代码效率，同时也增加了类型的灵活性和代码的重用性。

fn n_neighborhood<const N: usize>(tree: &Octree,
                                 coord: [f64; 3],
                                 radius: f64) -> [f32; N] {
    let res = [f32; N];
    
    // TODO: Find N neighbors in Octree.
    res
}
fn main() {
    const SRCH_N: usize = 4;
    // Result is of type [f32; 4]
    let result = n_neighborhood::(&tree, coord);
}

Rust tips #41 ~ #60

2024-06-09T03:36:11.000Z

Tip #41

类似于 Go 语言中的通道（Go 的 channel），Rust 中的 std::sync::mpsc 提供了一种线程间安全地读写数据的机制:

use std::sync::mpsc;
use std::thread;
fn main() {
    let (tx, rx) = mpsc::channel();
    thread::spawn(move || {
        let val = String::from("hi");
        tx.send(val).unwrap();
    });
    let received = rx.recv().unwrap();
    println!("Got: {}", received);
}

在这个例子中，我们创建了一个通道，然后在一个线程中发送了一个字符串。在主线程中，我们等待接收这个字符串并打印它。

Tip #42

希望在编码过程中，让编译器和代码检查工具实时地指出并协助解决出现的问题吗？

不妨试试Bacon

Tip #43

除了标准库中的 std::HashMap，Rust 还为特定场景提供了其他哈希表变体：

IndexMap（indexmap 库）：保持键的插入顺序。
BTreeMap（位于 std::collections）：按照键的排序顺序维护元素。
DashMap（dashmap 库）：无锁并发散列映射，适用于并发或多线程代码。

Tip #44

使用 actix_web 的 Rust 网页服务器，具备静态文件服务功能，并默认将请求路由到 index.html。几乎和 JavaScript 一样简单,对吗？

Tip #45

对于想要极度优化代码的你们，这里有一个有趣的小知识：

std::hint 允许你告诉编译器某个布尔表达式很可能是真的，从而启用优化的分支预测：

use std::hint::likely;
fn main() {
    let x = 42;
    if likely(x > 0) {
        println!("x is positive");
    } else {
        println!("x is not positive");
    }
}

Tip #46

你是否曾被 PartialEq 和 Eq 这两个 #trait搞晕过？这里有一个快速概览：

PartialEq：通过 eq 方法实现（不要与 Eq 混淆！），它启用了相等性（==）检查。如果项目不可比较，则 eq 返回 false。
Eq：一个没有自己方法的“标记Trait”。它告诉编译器所有元素都可以进行等价比较，并确保等价关系是自反的、对称的和传递的。

Tip #47

一些避免使用可怕的clone()方法的策略包括：

向只读函数传递借用（&）时使用引用
利用 Rc 或 Arc 来共享所有权
实现 Copy 特性（类似 C 语言中的 memcpy）
使用 Cow（写时复制）来半自动管理复制过程

Tip #48

Rust 在处理线程和读取它们的返回值方面真正大放异彩的一个例子是，这看起来比许多其他语言做起来要简单得多。下面是一个处理两个线程结果的简单示例：

use std::thread;
fn main() {
    let handle1 = thread::spawn(|| 1);
    let handle2 = thread::spawn(|| 2);
    let result1 = handle1.join().unwrap();
    let result2 = handle2.join().unwrap();
    println!("Result: {}", result1 + result2);
}

Tip #49

使用 Rayon 库对 for 循环进行简单并行化，只需添加导入并使用 Rayon 提供的 .par_iter() 并行迭代器。

该代码用于统计大于0的元素。预期的加速效果大约为 X 倍，其中 X 代表你拥有的 CPU 核心数量：

use rayon::prelude::*;
fn main() {
    let numbers = vec![1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
    let count = numbers.par_iter().filter(|&x| x > 0).count();
    println!("Count: {}", count);
}

Tip #50

如果你正在调试你的迭代器，并且只想测试数据的一个子集，你可以使用 myvec.iter().take(N) 来仅对前 N 个元素进行操作。

或者，你也可以对输入进行切片：&myvec[0..N].iter()

Tip #51

在迭代器中对一列可选值（Option）使用 map() 感到棘手？

filter_map() 巧妙地处理了这个问题，它会忽略 None 值，只处理 Some() 值：

fn main() {
    let numbers = vec![Some(1), None, Some(3), None, Some(5)];
    let sum: i32 = numbers.iter().filter_map(|&x| x).sum();
    println!("Sum: {}", sum);
}

Tip #52

Fn、FnMut 和 FnOnce 分别是什么？这些是用于将闭包作为函数参数传递的特殊trait。

Fn：不修改环境的闭包
FnMut：可以修改环境
FnOnce：运行一次并消耗环境

这里有一个展示 FnMut trait实际运用的例子：

fn main() {
    let mut x = 5;
    let mut add = |y| x += y;
    add(5);
    println!("x: {}", x); // 输出: x: 10
}

Tip #53

继续探讨“核心”或“系统” trait的主题，Drop trait非常有趣：任何超出作用域的数据类型都会自动调用Drop()。因此，如果你实现了Drop()，就可以在需要时执行自定义的清理操作。

Tip #54

在使用异步 Rust 开发时，如果需要执行两个（不相关）任务，你可以使用来自 futures #库的 join! 宏并行地调度它们。相比于依次调用 .await，这样做可以更高效：

use futures::join;
async fn task1() -> u32 {
    42
}
async fn task2() -> u32 {
    24
}
#[tokio::main]
async fn main() {
    let (result1, result2) = join!(task1(), task2());
    println!("Result: {}", result1 + result2);
}

Tip #55

我深入探索了 Rust 中声明式宏的世界。第一步是要理解基本语法……这确实很难用文字描述，所以我制作了一张（希望是有教育意义的）图片，涵盖了基础知识：

Tip #56

在上一条的宏话题基础上，今天我探讨了10个匹配器加上上次帖子中遗漏的 "ident" 匹配器。来看看这张展示了每个匹配器的示例的网格图吧：

Tip #57

在 Rust 中，你可以实现在三个主要位置编写测试：

作为文档的一部分（doctest）
代码下方的嵌入式测试（#[cfg(test)]属性包裹）
外部的测试文件夹中

👉 通过执行 "cargo test" 来运行测试

Tip #58

Rust 的类型系统允许我们定义“标记类型”，这些可以仅仅是带有名字的结构体，用来为特定类型编码元数据。以下是一个使用标记结构体示例，表示一个文档结构体可以处于 "草稿" 或 "已发布" 状态：

// Marker structs representing states
struct Draft;
struct Published;
// The Document struct, parameterized by its state
struct Document {
    content: String,
    _state: std::marker::PhantomData,
}
impl Document {
    // Constructor for a new draft document
    fn new(content: String) -> Document {
        Document {
            content,
            _state: std::marker::PhantomData,
        }
    }
    // Review the document
    fn review(self) -> Document {
        Document {
            content: self.content,
            _state: std::marker::PhantomData,
        }
    }
}
impl Document {
    // Publish the document
    fn publish(self) {
        println!("Publishing document: {}", self.content);
    }
}

Tip #59

我遇到了几次尝试实现一个扩展trait但编译器不允许的情况。事实证明，有两个规则需要注意：

如果trait是在你的crate中定义的，你可以为任何类型实现扩展，即使是其他crate中的类型。
如果trait是在另一个crate中定义的，你只能为你crate中定义的类型实现它。

扩展trait基本上允许基于trait定义，向一个类型添加新的功能。

Tip #60

当你在结构体上 #派生 Debug trait时，你会得到两种用于 println! 的格式化方式：

{:?} 默认的调试格式化器
{:#?} “美化打印”的调试格式化器

这两种输出的视觉差异是什么？让我们来看一下：

Rust tips #21 ~ #40

2024-06-08T10:51:42.000Z

Tip #21

在 Rust 中，我们经常使用 Clone() 或 Copy()。这两者之间的区别是什么？

Copy：支持 Copy 的类型可以安全地通过字节复制的方式进行复制，可以类比 C 语言中的 memcpy 函数。
Clone：支持 Clone 的类型也可以被复制，但它通常需要执行一些逻辑操作来完成深拷贝。

Tip #22

我之前忽略的一点是，Rust 中有 static 变量，可以用来追踪某些状态。当然，可变的静态变量（mutable static）是不支持的，但对于原始类型，可以考虑使用std::sync::atomic。这些可以被实例化为静态的，并且在后续可以被修改：

static COUNTER: AtomicUsize = AtomicUsize::new(0);
// Functions to get and increment *static* counter.
fn increment_counter() {
    COUNTER.fetch_add(1, order: Ordering::Relaxed);
}
fn get_counter() -> usize {
    COUNTER.load(order: Ordering::Relaxed)
}

Tip #23

对于大多数使用核心数据类型的结构体，你可以通过派生 Default trait自动生成一个基本的Default()实现：

1 2	[derive(Default)] struct MyStruct { ... }

Tip #24

探索智能指针：

Box 用于独占所有权，一旦它所在的作用域 {} 结束，它就会被释放。
Rc 是一种引用计数的智能指针。只有当它的所有引用都不存在时，它才会被释放。
Arc 是 Rc 的线程安全版本。

Tip #25

在Rust中，trait的工作方式类似于其他语言中的接口定义。实现某个trait的结构体或枚举，在契约上必须提供trait中指定签名的函数 :

// Define a trait `Describable`
trait Describable {
    fn describe(&self) -> String;
}
struct Person {
    name: String,
    age: u32,
}
// Implement the `Describable` trait for `Person`
impl Describable for Person {
    fn describe(&self) -> String {
        format!("{} is {} years old.", self.name, self.age)
    }
}

Tip #26

你知道Rust支持对大多数常见数据类型进行解构吗？这里有一个关于结构体的例子：

struct Rocket {
    name: String,
    num_engines: u32,
}
let falcon9: Rocket = Rocket{name: "Falcon 9".to_string(), num_engines: 9};
// Destructure name and engines
let Rocket {name: the_name: String, num_engines: the_engines: u32} = falcon9;
println!("Rocket name {}, num engines {}", the_name, the_engines);

这种解构方式允许你在一行中从结构体中提取多个字段，并给它们起新的名字或指定类型，这在处理复杂数据时非常有用。

Tip #27

Rust #区间表达式：

包含区间（包含a到b，b也包括在内）：a..=b
半开区间（包含a到b-1）：a..b
从a开始：a..
到b-1为止：..b
到b为止（包括b）：..=b
完整区间：..

Tip #28

区间表达式(继续)：
区间表达式可以应用于for循环，或用于创建迭代器。别忘了调用collect()来实际执行迭代器：

let mut squares_a: Vec<u32> = vec![];
for i: u32 in 1..=100 {
    squares_a.push(i * i);
}
// Map creates an iterator, but does not perform the computation.
let squares_b_it: impl Iteratoru32> = (1..=100).map(|x: u32| x * x);
// Apply collect to "run" the iterator.
let squares_b: Vec<u32> = (1..=100).map(|x: u32| x * x).collect();

Tip #29

迭代器可以通过 chain() 方法进行连续拼接。Rust 在处理可能含有或不含值的 Option 类型的连续操作时表现得尤为优雅。

let maybe_rocket = Some("Starship");
let rockets = vec!["falcon1", "falcon2"];
// Chain the two iterators together.
for i in rockets.iter().chain(maybe_rocket) {
    println!("🚀 {}", i);
}

Tip #30

如果需要以非可变方式将向量（vector）传递给函数，你可以使用 &[T]（等同于 &Vec）类型的参数，这也就是所谓的 切片（slice）。

切片的优势包括：它们避免了所有权的转移，并且对于 #并发或 #并行操作是安全的。

Tip #31

动态调度（dynamic dispatch）简单来说，是在程序运行时动态地处理不同类型的特性，通过一个公共的特质（trait）来实现，从而使得（具有 Rust 特色的）多态成为可能。

在 Rust 中，Box 通常表明使用了动态调度。

Tip #32

迭代器提供了一些非常方便的实用功能。其中之一是 all() 方法，它会检查迭代器中所有元素是否都满足给定的条件。

这使我们能够以优雅且符合习惯用法的方式重写难看的基于for循环的代码:

// 难看的代码
fn check_user_infos(user_infos: Vec) -> bool {
    for u in user_infos.iter() {
        if !unique_tags.contains(&u.user_name.as_str()) {
            return false;
        }
    }
    true
}
// 优雅的代码
fn check_user_infos(user_infos: Vec) -> bool {
    user_infos.iter().all(|u| unique_tags.contains(&u.user_name.as_str()))
}

Tip #33

let a: Arc>> 这样的声明在视觉上是否让你觉得困扰？这时可以使用 type关键字来定义类型别名（alias）:

1	type SharedSafeVec = Arc>>

这样，你就可以使用 SharedSafeVec 来代替 Arc>>。

Tip #34

Option.map() 是一种将选项（Option）从一种类型转换为另一种类型的极佳方式。它能透明地处理 None 值的情况。

请看以下示例，我们将 Option 转换为 Option：

fn main() {
    let number_option: Option<u32> = Some(42);
    let string_option: Option = number_option.map(|num| num.to_string());
    println!("{:?}", string_option); // 输出: Some("42")
    let none_option: Option<u32> = None;
    let empty_string_option: Option = none_option.map(|num| num.to_string());
    println!("{:?}", empty_string_option); // 输出: None
}

Tip #35

什么是 trait bound? 当我们向带有泛型参数的函数中传递额外的trait名称，以便限制该泛型类型时，就是在谈论trait bound：

1	fn some_function(param: T) { ... }

你可以使用 "+" 运算符来组合多个特质。这样一来，类型 T 就需要同时满足 TraitA 和 TraitB 这两个特质的要求。

Tip #36

如需从应用程序获取更详细的日志输出，尝试导出环境变量 RUST_LOG={error, warn, info, debug, trace}。

以下是一个使用 actix-web 运行的服务在 trace 模式下的示例，它会提供超级详尽的日志输出：
![[Pasted image 20240608183308.png]]

Tip #37

元组结构体对于封装值并附加可通过 Rust 的类型系统验证的元数据非常有用。

元组结构体的一个妙用是模拟计量单位——这样就不会再混淆英尺和米了：

struct Feet(i32); // 定义一个元组结构体，表示英尺
struct Meters(i32); // 定义另一个元组结构体，表示米
impl From for Meter {
    fn from(feet: Feet) -> Self {
        Meter(feet.0 * 0.3048) // 将英尺转换为米
    }
}
impl From for Feet {
    fn from(meters: Meters) -> Self {
        Feet(meters.0 / 0.3048) // 将米转换为英尺
    }
}
fn  is_longer_enough(meters: Meters) -> bool {
    meters.0 > 1
}
fn is_longer_enough(feet: Feet) -> bool {
    feet.0 > 3
}

Tip #38

正在编写一个函数但还没准备好最终完成？可以使用 todo!() 或 unimplemented!() 宏来让代码保持可编译状态。但要记住，如果你的程序运行时遇到这些点，它将会panic！这对于开发阶段非常理想。🚧

和第四条重复了

Tip #39

30秒速成指南：构建 Rust #模块

创建你的模块结构：

my_module/
│   ├── mod.rs
│   ├── component_1.rs
│   └── component_2.rs

在 mod.rs 中添加：

1 2	mod component_1; mod component_2;

或者新的方式：

my_module/ 
├── component_1.rs 
└── component_2.rs
my_module.rs

🌟 小贴士：使用pub 关键字来定义公有访问权限。

Tip #40

实际上，Rust 中有两种类型的宏。声明式宏（declarative）和更高级的 过程式宏（procedural）。下面是一个使用 macro_rules! 宏来生成 println 功能的声明式宏示例：

macro_rules! my_println {
    ($($arg:tt)*) => {
        println!($($arg)*);
    };
}
fn main() {
    my_println!("Hello, Rust!");
}

这段代码定义了一个名为 my_println! 的宏，它接收任意数量的参数并简单地将它们传递给标准库的 println! 宏，从而达到打印输出的目的。这是声明式宏的一个基本应用，它们基于规则匹配并在编译时展开。

如何将图片编码成base64?

2024-06-06T15:19:17.000Z

图片的 base64 编码在多种上下文中都很有用。当需要通过旨在处理文本数据的媒体存储或传输图片时，它通常会被使用，比如嵌入到网页或者通过 API 上传图片。这篇文章将介绍如何使用 Go 标准库得到任何图片的 base64 编码的值。

在 Go 中将图片转换为其 base64 表示很容易。所有你需要做的是将文件读取为字节 slice并使用包 encoding/base64 对其进行编码。

处理本地图片

首先，让我们处理本地文件系统中的图片文件：

package main
import (
	"encoding/base64"
	"fmt"
	"io/ioutil"
	"log"
	"net/http"
)
func toBase64(b []byte) string {
	return base64.StdEncoding.EncodeToString(b)
}
func main() {
	// 读取文件到 byte slice
	bytes, err := ioutil.ReadFile("./flower.jpg")
	if err != nil {
		log.Fatal(err)
	}
	var base64Encoding string
	// 得到当前文件的格式
	mimeType := http.DetectContentType(bytes)
    // 根据MIME 类型添加适当的 URI 方案头
	switch mimeType {
	case "image/jpeg":
		base64Encoding += "data:image/jpeg;base64,"
	case "image/png":
		base64Encoding += "data:image/png;base64,"
	}
    // 添加 base64 编码的输出
	base64Encoding += toBase64(bytes)
    // 打印图片的完整 base64 表示
	fmt.Println(base64Encoding)
}

第一步是通过 ioutil.ReadFile() 将图片文件读取为字节切片。接下来，用于获取 http.DetectContentType() 的 MIME 类型文件，以便将相应的数据 URI 方案标头附加到 base64 编码的输出。之后，调用该函数 toBase64() 它使用 base64.StdEncoding.EncodeToString() 方法检索图片的 base64 编码。此函数调用的结果将追加到 URI 方案标头。

运行此代码后，它会将图片的 base64 编码打印到提供的标准输出。

您可以复制 base64 字符串并将其直接粘贴到浏览器的地址栏中。它应该显示整个图片，如下所示。

处理远程图片

将通过URL提供的图片转换为其 base64 编码，与我们上面已经看到的没有太大区别。您需要做的就是对图片进行 GET 请求，然后将响应正文读取成字节切片。之后，该过程的其余部分与使用本地图片相同。

package main
import (
	"encoding/base64"
	"fmt"
	"io/ioutil"
	"log"
	"net/http"
)
func toBase64(b []byte) string {
	return base64.StdEncoding.EncodeToString(b)
}
func main() {
	resp, err := http.Get("https://freshman.tech/images/dp-illustration.png")
	if err != nil {
		log.Fatal(err)
	}
	defer resp.Body.Close()
	bytes, err := ioutil.ReadAll(resp.Body)
	if err != nil {
		log.Fatal(err)
	}
	var base64Encoding string
	mimeType := http.DetectContentType(bytes)
	switch mimeType {
	case "image/jpeg":
		base64Encoding += "data:image/jpeg;base64,"
	case "image/png":
		base64Encoding += "data:image/png;base64,"
	}
	base64Encoding += toBase64(bytes)
	fmt.Println(base64Encoding)
}

本文技术点是通过http.DetectContentType获取图片类型，以及如何编码图片的base4形式。

祝你阅读愉快。

翻译自 How to retrieve the base64 encoding for any image in Go

Rust tips #1 ~ #20

2024-06-06T01:26:42.000Z

Tip #001

Rust 不支持静态 vec(static vec),但是最接近的是静态数组。例如,如果你想存储三个字符串的数组,可以尝试这样: static STRINGS : [&str;3] = ["a", "b", "c"]

Tip #002

什么是可选值(optional)和 unwrap()? 可以将可选值想象成一个信封,它可以包含一个值(Some(item))或者什么都没有(None)。对可选值调用 unwrap() 要么返回包含的值,要么如果可选值是 None 的话就会使程序panic。

Tip #003

关于可选值( optional)的安全解包方式:

使用 match 语句明确处理不同情况
unwrap_or_default: 要么解包得到值,要么返回默认值
unwrap_or_else: 允许你指定一个函数来处理 None/Error 解包结果

Tip #004

如果你没有时间完成特定的一段代码,但仍然希望程序可以编译,可以考虑使用 todo!() 或 unimplemented!() 宏。你的代码会继续编译通过,但如果程序运行到包含这些宏的代码块中,它将会panic。

todo! 更适合临时标记,而 unimplemented! 则更适合长期未实现的情况。

Tip #005

如果你想测试一个枚举类型的实例是否符合枚举的特定变体,你可以使用 matches! 宏,例如:
let match_res = matches!(my_variable, enum_type);

你也可以匹配其他模式,如范围,例如: matches!(foo, 'A'..='Z')

Tip #006

你知道吗, {} 块可以像函数一样返回结果?这使得基于条件的赋值变得非常容易。例如:

let car_ready = {
      start_engine();
      match engine_state {
       Engine::running => true,
       Engine::error => false
   }
}

Tip #007

const和static之间有什么区别?

const值在编译期间会被替换("内联")到你的代码中。这对于在代码的各个地方使用的常量值来说是理想的。
static值在运行时有一个内存地址,并且会在整个应用程序的生命周期中存在。它们可以是可变的。如果你需要一个固定的位置来存放共享资源,例如硬件驱动程序或数据库接口,那么静态变量就很有用。

Tip #008

如果你想将几个相同或不同类型的值一起存储,元组类型就很有用。下面是一个将元组类型声明为结构体元组的示例,访问元组类型字段,以及从函数返回"匿名"元组类型:

struct MyTuple(String, i32);
fn flip(a: (i32, String)) -> MyTuple {
    let my_tuple = MyTuple(String::from("the answer"), 42);
    (a.1, a.0)
}

Tips #009

让我们来谈谈 string

在 Rust 中有两种基本的字符串类型: String 和 str。

String: (也称为 Owned String),在堆上分配内存并且可变。String 在运行时使用,当你想要创建和修改字符串时。你可以将 String 作为 &str 引用传递给只读函数。

str: (也称为 String Slice) 是对一序列 UTF8 数据的引用。你可以在编译时以常量、静态字面量的形式创建 str,或者在运行时从 String 对象获取它们。str 总是不可变的。

Tips #010

拼接 string 有两种方式可以将两个字符串连接,分别使用:

push_str
format! 宏

// 使用 push_str
let mut first = String::from("Hello, ");
first.push_str("world!");
assert_eq!(first, "Hello, world!");
// 使用 format! 宏
let second = String::from("Hello, ");
let combined = format!("{}{}", second, "world!");
assert_eq!(combined, "Hello, world!");

Tips #011

格式化打印宏

print!、println!: 在控制台打印文本。
您可以使用格式字符串打印变量的内容,例如, let a: i32 = 1234; println!("The value of a is: {}", a); 将打印出 "The value of a is 1234"
eprintln!: 打印到标准错误流(stderr)
dbg!: 打印变量的值和行号,对于轻量级调试很有用。

Tips #012

可选值解包使用 if let() 类似于 Swift , Rust 允许我们使用 if let 来测试一个可选值是否有值,这种方式便于保持程序流程的简洁:

fn main() {
    let optional_value: Option<i32> = Some(9);
    // 传统方式
    match optional_value {
        Some(value) => println!("The value is: {}", value),
        None => println!("There is no value"),
    }
    // 使用 if let
    if let Some(value) = optional_value {
        println!("The value is: {}", value);
    } else {
        println!("There is no value");
    }
}

Tips #013

使用 if let 解包多个可选值。继上一条 tip,如果你需要同时检查多个可选值是否都有值,你可以使用 if let 来测试和解包可选值的元组:

fn main() {
    let optional_tuple: (Option<i32>, Option<bool>) = (Some(5), Some(true));
    // 传统方式
    match optional_tuple {
        (Some(int_value), Some(bool_value)) => {
            println!("Received int: {} and bool: {}", int_value, bool_value);
        }
        _ => println!("One or more options were None"),
    }
    // 使用 if let
    if let (Some(int_value), Some(bool_value)) = optional_tuple {
        println!("Received int: {} and bool: {}", int_value, bool_value);
    } else {
        println!("One or more options were None");
    }
}

Tips #014

实例化 vector。
Vec是一种动态数组类型,非常适合存储相同数据类型的序列。下面是一些使用标准库调用和vec!宏实例化Vec的方式。注意类型是如何处理的:

// Type automatically inferred by the next push.
let mut a: Vec<i64> = Vec::new();
a.push(1_i64);
// Type set during instantiation.
let mut b: Vec<i64> = Vec::<i64>::new();
// Type defined explicitly, initialized using vec!
let mut c: Vec<i64> = vec![];
// Type automatically inferred, prefilled with vec!
let mut d: Vec<i64> = vec![1_i64, 2_i64, 3_i64];

// 空Vec
let mut vec1: Vec<i32> = Vec::new();
// 用值初始化
let mut vec2 = vec![1, 2, 3];
// 用指定数量的元素和默认值初始化
let mut vec3 = vec![0; 5]; // vec3 = [0, 0, 0, 0, 0]
// 从迭代器获取元素
let vec4 = (0..5).collect();
let vec5: Vec<_> = ["foo", "bar"].into_iter().collect();
// 用给定的初始容量初始化
let mut vec6 = Vec::with_capacity(10);

Tip #015

Vector迭代。

你可以使用 vec.iter() 来对 Vector进行迭代，使用 map() 或 for_each() 函数，这与例如 JavaScript 中的方式类似。

let numbers: Vec<i32> = vec![1, 2, 3, 4, 5];
// Using for_each to print each element
numbers.iter().for_each(|&x: i32| {
    println!("{}", x);
});
// Use map to transform a vector.
let squared: Vec<i32> = numbers.iter().map(|&x: i32| x * x).collect();
println!("{:?}", squared);

Tips #016

嘿,你有一些不错的HashMap,怎么初始化它们?除了创建一个新的HashMap并插入键值对之外,一种值得注意的方式是使用一个元组数组和一个#迭代器:

use std::collections::HashMap;
fn main() {
    // 从一个元组数组创建HashMap
    let codes: HashMap<_, _> = [
        (101, "abc"),
        (102, "def"),
        (103, "ghi"),
    ].iter().cloned().collect();
    println!("codes = {:?}", codes);
}

Tips #017

更好的方式来unwrap()
如果内容是None的话,unwrap()一个可选值会导致panic。以下是在unwrap时处理None的一些方法:

unwrap_or_default(): 如果可选值是None,返回默认值。
unwrap_or(): 提供一个替代值。
-unwrap_or_else(): 执行一个函数,如果可选值是None的话该函数返回某个值。

fn main() {
    let x: Option<i32> = None;
    // 返回默认值0
    println!("{}", x.unwrap_or_default()); 
    // 返回提供的替代值99
    println!("{}", x.unwrap_or(99));
    // 返回函数提供的值
    println!("{}", x.unwrap_or_else(|| "No value".to_string()));
}

Tips #018

Rust 允许我们轻松定义匿名函数(也称为lambda 或 closure 或闭包)。闭包通常与 iterator 一起使用,或者用于定义回调函数。以下是语法示例:

fn main() {
    let multiply = |a, b| a * b;
    let product = multiply(3, 4);
    println!("Product: {}", product); // 输出: Product: 12
    let add_two = |x| x + 2;
    let values = vec![1, 2, 3, 4, 5];
    let new_values: Vec<_> = values.iter().map(add_two).collect();
    println!("New values: {:?}", new_values); // 输出: New values: [3, 4, 5, 6, 7]
}

Tips #019

在闭包中使用 move 可以从周围作用域捕获变量。这意味着闭包将获取这些变量的所有权,而无需传递任何参数:

fn main() {
    let num = 5;
    let closure = || {
        println!("Num: {}", num); // 错误: `num` 不可借用
    };
    let closure_move = move || {
        println!("Num: {}", num); // 正确: `num` 被移动到闭包中
    };
    closure(); // 调用没有捕获变量的闭包
    closure_move(); // 调用捕获了 `num` 的闭包
}

Tips #020

实现 From() trait 提供了一种在复杂类型之间进行转换的机制。Rust 还会自动为对应的类型提供一个 Into() 实现。在下面的示例中,我们为 ColorFloat 实现了 From,但是可以使用 Color8Bit 的 Into():

struct Color8Bit {
    r: u8,
    g: u8, 
    b: u8,
}
struct ColorFloat {
    r: f32,
    g: f32,
    b: f32,
}
impl From for ColorFloat {
    fn from(color: Color8Bit) -> Self {
        ColorFloat {
            r: (color.r as f32) / 255.0,
            g: (color.g as f32) / 255.0,
            b: (color.b as f32) / 255.0,
        }
    }
}
fn main() {
    let color8 = Color8Bit { r: 230, g: 100, b: 50 };
    
    // 使用 Into 特性将 Color8Bit 转换为 ColorFloat
    let color_float: ColorFloat = color8.into();
    
    println!("Color Float: {}, {}, {}", color_float.r, color_float.g, color_float.b);
}

整理自 Daily Rust @rustoftheday

Redka - 父亲是Redis，母亲是SQLite

2024-06-03T23:28:39.000Z

Redka旨在使用SQLite重新实现Redis的优秀部分,同时保持与Redis API的兼容性。

有意思的特性:

数据不必完全装载在内存中。
支持ACID事务。
使用SQL视图以便于内省和报告。
同时提供进程内(Go API)和独立(RESP)服务器。
兼容Redis的命令和线路协议。

Redia 并不期望完全达到 Redis 那么高的性能，但是性能上也并不会落后很多。它的主要功能还是 SQL + Redis 的功能，集成了两种优秀产品 SQLite 和 Redis 的盛世美颜。

支持的 Redis 命令

字符串

Command      Go API                 Description
-------      ------                 -----------
DECR         DB.Str().Incr          Decrements the integer value of a key by one.
DECRBY       DB.Str().Incr          Decrements a number from the integer value of a key.
GET          DB.Str().Get           Returns the value of a key.
GETSET       DB.Str().SetWith       Sets the key to a new value and returns the prev value.
INCR         DB.Str().Incr          Increments the integer value of a key by one.
INCRBY       DB.Str().Incr          Increments the integer value of a key by a number.
INCRBYFLOAT  DB.Str().IncrFloat     Increments the float value of a key by a number.
MGET         DB.Str().GetMany       Returns the values of one or more keys.
MSET         DB.Str().SetMany       Sets the values of one or more keys.
PSETEX       DB.Str().SetExpires    Sets the value and expiration time (in ms) of a key.
SET          DB.Str().Set           Sets the value of a key.
SETEX        DB.Str().SetExpires    Sets the value and expiration (in sec) time of a key.
SETNX        DB.Str().SetWith       Sets the value of a key when the key doesn't exist.

暂时不支持的命令

1	APPEND GETDEL GETEX GETRANGE LCS MSETNX SETRANGE STRLEN SUBSTR

列表

Command      Go API                      Description
-------      ------                      -----------
LINDEX       DB.List().Get               Returns an element by its index.
LINSERT      DB.List().Insert*           Inserts an element before or after another element.
LLEN         DB.List().Len               Returns the length of a list.
LPOP         DB.List().PopFront          Returns the first element after removing it.
LPUSH        DB.List().PushFront         Prepends an element to a list.
LRANGE       DB.List().Range             Returns a range of elements.
LREM         DB.List().Delete*           Removes elements from a list.
LSET         DB.List().Set               Sets the value of an element by its index.
LTRIM        DB.List().Trim              Removes elements from both ends a list.
RPOP         DB.List().PopBack           Returns the last element after removing it.
RPOPLPUSH    DB.List().PopBackPushFront  Removes the last element and pushes it to another list.
RPUSH        DB.List().PushBack          Appends an element to a list.

暂时不支持的命令

1 2	BLMOVE BLMPOP BLPOP BRPOP BRPOPLPUSH LMOVE LMPOP LPOS LPUSHX RPUSHX

Set

Command      Go API                 Description
-------      ------                 -----------
SADD         DB.Set().Add           Adds one or more members to a set.
SCARD        DB.Set().Len           Returns the number of members in a set.
SDIFF        DB.Set().Diff          Returns the difference of multiple sets.
SDIFFSTORE   DB.Set().DiffStore     Stores the difference of multiple sets.
SINTER       DB.Set().Inter         Returns the intersection of multiple sets.
SINTERSTORE  DB.Set().InterStore    Stores the intersection of multiple sets.
SISMEMBER    DB.Set().Exists        Determines whether a member belongs to a set.
SMEMBERS     DB.Set().Items         Returns all members of a set.
SMOVE        DB.Set().Move          Moves a member from one set to another.
SPOP         DB.Set().Pop           Returns a random member after removing it.
SRANDMEMBER  DB.Set().Random        Returns a random member from a set.
SREM         DB.Set().Delete        Removes one or more members from a set.
SSCAN        DB.Set().Scanner       Iterates over members of a set.
SUNION       DB.Set().Union         Returns the union of multiple sets.
SUNIONSTORE  DB.Set().UnionStore    Stores the union of multiple sets.

暂时不支持的命令

1	SINTERCARD SMISMEMBER

Hash

Command       Go API                  Description
-------       ------------------      -----------
HDEL          DB.Hash().Delete        Deletes one or more fields and their values.
HEXISTS       DB.Hash().Exists        Determines whether a field exists.
HGET          DB.Hash().Get           Returns the value of a field.
HGETALL       DB.Hash().Items         Returns all fields and values.
HINCRBY       DB.Hash().Incr          Increments the integer value of a field.
HINCRBYFLOAT  DB.Hash().IncrFloat     Increments the float value of a field.
HKEYS         DB.Hash().Keys          Returns all fields.
HLEN          DB.Hash().Len           Returns the number of fields.
HMGET         DB.Hash().GetMany       Returns the values of multiple fields.
HMSET         DB.Hash().SetMany       Sets the values of multiple fields.
HSCAN         DB.Hash().Scanner       Iterates over fields and values.
HSET          DB.Hash().SetMany       Sets the values of one or more fields.
HSETNX        DB.Hash().SetNotExists  Sets the value of a field when it doesn't exist.
HVALS         DB.Hash().Exists        Returns all values.

暂时不支持的命令

1	HRANDFIELD HSTRLEN

Sorted Set

Command           Go API                  Description
-------           ------                  -----------
ZADD              DB.ZSet().AddMany       Adds or updates one or more members of a set.
ZCARD             DB.ZSet().Len           Returns the number of members in a set.
ZCOUNT            DB.ZSet().Count         Returns the number of members of a set within a range of scores.
ZINCRBY           DB.ZSet().Incr          Increments the score of a member in a set.
ZINTER            DB.ZSet().InterWith     Returns the intersection of multiple sets.
ZINTERSTORE       DB.ZSet().InterWith     Stores the intersection of multiple sets in a key.
ZRANGE            DB.ZSet().RangeWith     Returns members of a set within a range of indexes.
ZRANGEBYSCORE     DB.ZSet().RangeWith     Returns members of a set within a range of scores.
ZRANK             DB.ZSet().GetRank       Returns the index of a member in a set ordered by ascending scores.
ZREM              DB.ZSet().Delete        Removes one or more members from a set.
ZREMRANGEBYRANK   DB.ZSet().DeleteWith    Removes members of a set within a range of indexes.
ZREMRANGEBYSCORE  DB.ZSet().DeleteWith    Removes members of a set within a range of scores.
ZREVRANGE         DB.ZSet().RangeWith     Returns members of a set within a range of indexes in reverse order.
ZREVRANGEBYSCORE  DB.ZSet().RangeWith     Returns members of a set within a range of scores in reverse order.
ZREVRANK          DB.ZSet().GetRankRev    Returns the index of a member in a set ordered by descending scores.
ZSCAN             DB.ZSet().Scan          Iterates over members and scores of a set.
ZSCORE            DB.ZSet().GetScore      Returns the score of a member in a set.
ZUNION            DB.ZSet().UnionWith     Returns the union of multiple sets.
ZUNIONSTORE       DB.ZSet().UnionWith     Stores the union of multiple sets in a key.

不支持的命令

1
2
3

BZMPOP  BZPOPMAX  BZPOPMIN  ZDIFF  ZDIFFSTORE  ZINTERCARD
ZLEXCOUNT  ZMPOP  ZMSCORE  ZPOPMAX  ZPOPMIN  ZRANDMEMBER
ZRANGEBYLEX  ZRANGESTORE  ZREMRANGEBYLEX  ZREVRANGEBYLEX

Key

Command    Go API                    Description
-------    ------                    -----------
DBSIZE     DB.Key().Len              Returns the total number of keys.
DEL        DB.Key().Delete           Deletes one or more keys.
EXISTS     DB.Key().Count            Determines whether one or more keys exist.
EXPIRE     DB.Key().Expire           Sets the expiration time of a key (in seconds).
EXPIREAT   DB.Key().ExpireAt         Sets the expiration time of a key to a Unix timestamp.
FLUSHDB    DB.Key().DeleteAll        Deletes all keys from the database.
KEYS       DB.Key().Keys             Returns all key names that match a pattern.
PERSIST    DB.Key().Persist          Removes the expiration time of a key.
PEXPIRE    DB.Key().Expire           Sets the expiration time of a key in ms.
PEXPIREAT  DB.Key().ExpireAt         Sets the expiration time of a key to a Unix ms timestamp.
RANDOMKEY  DB.Key().Random           Returns a random key name from the database.
RENAME     DB.Key().Rename           Renames a key and overwrites the destination.
RENAMENX   DB.Key().RenameNotExists  Renames a key only when the target key name doesn't exist.
SCAN       DB.Key().Scanner          Iterates over the key names in the database.
TTL        DB.Key().Get              Returns the expiration time in seconds of a key.
TYPE       DB.Key().Get              Returns the type of value stored at a key.

不支持的命令

1
2
3

COPY  DUMP  EXPIRETIME  MIGRATE  MOVE  OBJECT  PEXPIRETIME
PTTL  RESTORE  SORT  SORT_RO  TOUCH  TTL  TYPE  UNLINK
WAIT  WAITAOF

事务

Command    Go API                 Description
-------    ------                 -----------
DISCARD    DB.View / DB.Update    Discards a transaction.
EXEC       DB.View / DB.Update    Executes all commands in a transaction.
MULTI      DB.View / DB.Update    Starts a transaction.

与 Redis 不同，Redka 的事务完全符合 ACID 属性，在发生故障时会自动回滚。

不支持的命令

1	UNWATCH WATCH

连接管理

Command    Go API                Description
-------    ------                -----------
ECHO       -                     Returns the given string.
PING       -                     Returns the server's liveliness response.

安装

你可以以独立的服务的形式安装。官方文档提供了方便的 Linux、macOS 的安装脚本，你也可以使用 docker 进行部署。

也可以在你的 Go 程序中当成一个库引用: go get github.com/nalgeon/redka，当然了你也必须引入 sqlite 的库，比如 github.com/mattn/go-sqlite3 或者 modernc.org/sqlite。

运行

你可以使用 redka [-h host] [-p port] [db-path] 启动一个 redka 服务，比如

1
2
3

./redka
./redka data.db
./redka -h 0.0.0.0 -p 6379 data.db

如果没有指定数据库文件，那么它就完全使用内存的方式。

如果当成一个库引入使用，你可以像这样在进程内使用:\

package main
import (
    "log"
    _ "github.com/mattn/go-sqlite3"
    "github.com/nalgeon/redka"
)
func main() {
    // Open or create the data.db file.
    db, err := redka.Open("data.db", nil)
    if err != nil {
        log.Fatal(err)
    }
    // Always close the database when you are finished.
    defer db.Close()
    // ...
}

如果是使用内存的方式，可以指定 sqlite 使用内存的方式打开:

1 2	// All data is lost when the database is closed. redka.Open("file:redka?mode=memory&cache=shared")

然后代码中就可以直接调用：

db.Str().Set("name", "alice")
db.Str().Set("age", 25)
count, err := db.Key().Count("name", "age", "city")
slog.Info("count", "count", count, "err", err)
name, err := db.Str().Get("name")
slog.Info("get", "name", name, "err", err)

下面的代码是使用事务的例子：

updCount := 0
err := db.Update(func(tx *redka.Tx) error {
    err := tx.Str().Set("name", "bob")
    if err != nil {
        return err
    }
    updCount++
    err = tx.Str().Set("age", 50)
    if err != nil {
        return err
    }
    updCount++
    return nil
})
slog.Info("updated", "count", updCount, "err", err)

性能

作者在 Apple M1 8-core CPU, 16GB RAM 的苹果机器和 Redis 进行了性能比较。
使用下面的场景进行比较(redis-benchmark -p 6379 -q -c 10 -n 1000000 -r 10000 -t get,set)：

10 parallel connections
1000000 requests
10000 randomized keys
GET/SET commands

比 Redis 慢 2~5 倍，这也合理，毕竟底层采用一个关系数据库进行存储。

给我们的启发

Redka 使用 redcon 进行 Redis 命令的解析，然后针对每种大类的 Redis 命令，会有一个单独的表进行存储。

rkey
---
id       integer primary key
key      text not null
type     integer not null    -- 1 string, 2 list, 3 set, 4 hash, 5 sorted set
version  integer not null    -- incremented when the key value is updated
etime    integer             -- expiration timestamp in unix milliseconds
mtime    integer not null    -- modification timestamp in unix milliseconds
len      integer             -- number of child elements
rstring
---
kid      integer not null    -- FK -> rkey.id
value    blob not null
rlist
---
kid      integer not null    -- FK -> rkey.id
pos      real not null       -- is used for ordering, but is not an index
elem     blob not null
rset
---
kid      integer not null    -- FK -> rkey.id
elem     blob not null
rhash
---
kid      integer not null    -- FK -> rkey.id
field    text not null
value    blob not null
rzset
---
kid      integer not null    -- FK -> rkey.id
elem     blob not null
score    real not null

既然它支持 sqlite, 我们可以把它 port 到其它的数据库上，比如 clickhouse，这样我们就可以支持巨量的数据了。

当然更深一步，我们还可以接入其他的 NoSQL 数据库，比如 RocksDB 等，类似的项目都有很多了。

这是一个很有意思的项目。

命令分发模式

2024-06-02T23:53:37.000Z

命令分发模式 (command dispatcher pattern)不属于23种经典的设计模式。它是一种不太为人所知的设计模式,它主要用于构建可扩展、可插拔的系统架构,将请求与执行请求的操作对象解耦。它类似于命令模式(Command Pattern),但更加灵活和动态。

虽然Command Dispatch Pattern不属于那23种经典模式,但它确实是一种很有价值的模式,可以应用于需要在运行时动态添加、修改或删除操作的系统中,使系统更加灵活和可扩展。

这种模式通过允许方便的添加、替换或移除任何命令处理器, 非常的灵活，将命令调用和命令处理解耦。而且每个命令可以由单独的命令处理器处理，代码组织和维护也很方便。

实际上，对于 Gopher 来讲，必然已经接触到这个模式了，只不过少有人指出或者梳理这种模式，但是在标准库和一些知名的项目中，其实已经自然的应用了，而且看起来整个架构也非常的清爽。

让我们看一个标准库实现 web 服务的例子：

package main
import (
	"fmt"
	"net/http"
)
// 定义 HTTP 处理程序函数
func homeHandler(w http.ResponseWriter, r *http.Request) {
	fmt.Fprint(w, "Welcome to the home page!")
}
func aboutHandler(w http.ResponseWriter, r *http.Request) {
	fmt.Fprint(w, "This is the about page.")
}
func main() {
	// 创建一个新的 ServeMux 实例
	mux := http.NewServeMux()
	// 注册处理程序函数
	mux.HandleFunc("/", homeHandler)
	mux.HandleFunc("/about", aboutHandler)
	// 启动 HTTP 服务器
	fmt.Println("Starting server at :8080")
	http.ListenAndServe(":8080", mux)
}

在这个示例中,我们可以把 http.ServeMux 看作是 Command Dispatcher,而 HTTP 请求就是一个命令。

通过 mux.HandleFunc ，将命令 (path，请求路径) 与命令处理程序 (handler, 处理程序函数) 进行绑定的过程。

新增一个命令，就注册一个新的处理程序。
移除一条命令，就删除那一条绑定语句。
修改一条命令，就替换对应的处理程序。

Http server 收到 HTTP 请求后，解析出路径信息，然后从注册的信息中找到这个路径对应的处理程序，然后调用这个处理程序。

这是一个经典的命令分发模式的应用。对于贝尔实验室出来的 Rob Pike、Russ Cox 来说，它们和 GoF 设计模式的这一派属于两个门派，所以在 Go 语言中 Rob Pike、Russ Cox 很少会讲到面向对象的设计模式，但是这种 HTTP 的这种实现方法我们可以把它归类为命令分发模式，而且是一个标准的模式实现。

接下来，我再给你介绍几种知名项目中使用这种模式的例子。毕竟，这种设计模式应用的场景之一就是微服务：

分布式系统：在分布式系统中，命令分发模式可以用于将命令分配到不同的服务或节点进行处理。
微服务架构：在微服务架构中，命令分发模式可以用于协调不同微服务之间的命令处理。
复杂应用：在复杂应用中，命令分发模式可以用于解耦命令的发出者和处理者，提高系统的灵活性和可维护性。

Rpc 中处理

Go 生态圈中知名的微服务框架之一 rpcx 实现了两种命令分发方式：

类似 Go 标准库的 rpc, 通过发射的方式找到对应的微服务方法，然后调用
第二种是类似 Go 标准库这种路由绑定的方法，通过绑定 handler 方式

这两种方式都属于命令分发的设计模式，但是第二种更直观。比如下面一个微服务的例子：

package main
import (
	"flag"
	example "github.com/rpcxio/rpcx-examples"
	"github.com/smallnest/rpcx/server"
)
var (
	addr = flag.String("addr", "localhost:8972", "server address")
)
func mul(ctx *server.Context) error {
	var args example.Args
	err := ctx.Bind(&args)
	if err != nil {
		return err
	}
	var reply example.Reply
	reply.C = args.A * args.B
	ctx.Write(reply)
	return nil
}
func main() {
	flag.Parse()
	s := server.NewServer()
	s.AddHandler("Arith", "Mul", mul)
	err := s.Serve("tcp", *addr)
	if err != nil {
		panic(err)
	}
}

这里例子以一个 乘法 的微服务做例子。函数 mul 是命令(微服务)处理函数。s.AddHandler 将微服务和命令处理函数进行绑定。这和 HTTP 的例子非常的类似。

server 就是一个分发器，它收到客户端的微服务请求，解析出微服务的名称 (名字和方法名)，找到注册的 handler, 把参数传给 handler 去处理。

lesismal 实现的一个高性能的 Go 微服务框架 arpc 也是采用的这种方式:

package main
import (
	"log"
	"github.com/lesismal/arpc"
)
func main() {
	svr := arpc.NewServer()
	// register router
	svr.Handler.Handle("/echo/sync", func(ctx *arpc.Context) {
		str := ""
		err := ctx.Bind(&str)
		ctx.Write(str)
		log.Printf("/echo/sync: \"%v\", error: %v", str, err)
	})
	// register router
	svr.Handler.Handle("/echo/async", func(ctx *arpc.Context) {
		str := ""
		err := ctx.Bind(&str)
		go ctx.Write(str)
		log.Printf("/echo/async: \"%v\", error: %v", str, err)
	})
	svr.Run("localhost:8888")
}

处理微服务、web 路由等这些场景。在基础架构的软件开发中，这种模式对于实现命令式的基础服务组件，也非常的合适，接下来我给你介绍实现自研 memcached 和 redis 服务的基于命令分发模式实现的架构。

在自研基础架构产品中的应用

自研类 memcached 的缓存系统

Memcached是一种分布式内存对象缓存系统,用于加速动态Web应用程序的响应速度。它基于一种高效的基于内存的键值对存储,设计用于缓存小的数据块。

Memcached的主要优势包括:

高性能:基于内存操作,能够提供非常高的读写性能。
减少服务器负载:通过缓存数据减轻了数据库的访问压力。
可扩展性:支持分布式集群部署,能够线性扩展。

Memcached的作者是Brad Fitzpatrick。也曾是 Go 开发团队成员之一，维护 Go HTTP 库等。也是 Go memcached client 库 bradfitz/gomemcache: 的作者。

这里我们介绍的是 Go memcached 服务端的库，在你实现类似 Memcached 服务的时候很有用。

Memcached 有文本和二进制两种协议，这里我们介绍的是文本协议，它比较简单，而且也方便使用 telenet 等命令测试。下面是一些常用的Memcached命令:

存储命令:
- set key flags exptime bytes [noreply]: 存储一个键值对,并设置可选的标志、过期时间、数据长度和noreply。
- add key flags exptime bytes [noreply]: 仅当键不存在时添加一个新的键值对。
- replace key flags exptime bytes [noreply]: 仅当键已存在时替换键的值。
检索命令:
- get key [key ...]: 获取一个或多个键的值。
- gets key: 获取带有CAS令牌的键值对,用于检查并设置操作。
操作命令:
- incr key value [noreply]: 将键的数值增加给定的值。
- decr key value [noreply]: 将键的数值减少给定的值。
- append key flags exptime bytes [noreply]: 将数据追加到一个已存在的键的值中。
- prepend key flags exptime bytes [noreply]: 将数据添加到一个现有键的值的开始部分。
- cas keyflags exptime bytes unique-cas-token [noreply]: 使用CAS令牌实现检查并设置操作。
删除命令:
- delete key [noreply]: 删除一个键值对。
统计命令:
- stats: 获取Memcached服务器统计信息。
- stats reset: 重置Memcached服务器统计信息。
其他命令:
- flush_all [delay] [noreply]: 清空整个Memcached服务器中的所有键值对数据。
- version: 获取Memcached服务器版本信息。
- quit: 关闭Memcached连接。

这些命令通过TCP连接以文本形式发送给Memcached服务器,服务器也以文本形式返回响应结果。例如,成功的响应以"OK"开头,错误响应以"ERROR"或"SERVER_ERROR"开头。

smallnest/gomemcached 是实现 memcache server 端的一个库，我们来看它的一个简单例子：

mockServer = NewServer(addr)
mockServer.RegisterFunc("get", DefaultGet)
mockServer.RegisterFunc("gets", DefaultGet)
mockServer.RegisterFunc("set", DefaultSet)
mockServer.RegisterFunc("delete", DefaultDelete)
mockServer.RegisterFunc("incr", DefaultIncr)
mockServer.RegisterFunc("flush_all", DefaultFlushAll)
mockServer.RegisterFunc("version", DefaultVersion)
mockServer.Start()

Server 是一个命令分发器，你可以注册你实现的命令处理函数。
你甚至扩展，为你的缓存产品增加 memcached 不支持的命令，比如 auth 等等。

自研类 Redis 的系统

如果你要开发类似 Redis 的服务，也有一个非常知名的库，甚至可以说是 Go 生态圈的首选，就是 tidwall/redcon

它基于命令分发模式，提供了一个通用的 Redis 服务端框架，下面是一个它的例子：

package main
import (
	"log"
	"strings"
	"sync"
	"github.com/tidwall/redcon"
)
var addr = ":6380"
func main() {
	var mu sync.RWMutex
	var items = make(map[string][]byte)
	var ps redcon.PubSub
	go log.Printf("started server at %s", addr)
	err := redcon.ListenAndServe(addr,
		func(conn redcon.Conn, cmd redcon.Command) {
			switch strings.ToLower(string(cmd.Args[0])) {
			default:
				conn.WriteError("ERR unknown command '" + string(cmd.Args[0]) + "'")
			case "ping":
				conn.WriteString("PONG")
			case "quit":
				conn.WriteString("OK")
				conn.Close()
			case "set":
				if len(cmd.Args) != 3 {
					conn.WriteError("ERR wrong number of arguments for '" + string(cmd.Args[0]) + "' command")
					return
				}
				mu.Lock()
				items[string(cmd.Args[1])] = cmd.Args[2]
				mu.Unlock()
				conn.WriteString("OK")
			case "get":
				if len(cmd.Args) != 2 {
					conn.WriteError("ERR wrong number of arguments for '" + string(cmd.Args[0]) + "' command")
					return
				}
				mu.RLock()
				val, ok := items[string(cmd.Args[1])]
				mu.RUnlock()
				if !ok {
					conn.WriteNull()
				} else {
					conn.WriteBulk(val)
				}
			case "del":
				if len(cmd.Args) != 2 {
					conn.WriteError("ERR wrong number of arguments for '" + string(cmd.Args[0]) + "' command")
					return
				}
				mu.Lock()
				_, ok := items[string(cmd.Args[1])]
				delete(items, string(cmd.Args[1]))
				mu.Unlock()
				if !ok {
					conn.WriteInt(0)
				} else {
					conn.WriteInt(1)
				}
			case "publish":
				if len(cmd.Args) != 3 {
					conn.WriteError("ERR wrong number of arguments for '" + string(cmd.Args[0]) + "' command")
					return
				}
				conn.WriteInt(ps.Publish(string(cmd.Args[1]), string(cmd.Args[2])))
			case "subscribe", "psubscribe":
				if len(cmd.Args) < 2 {
					conn.WriteError("ERR wrong number of arguments for '" + string(cmd.Args[0]) + "' command")
					return
				}
				command := strings.ToLower(string(cmd.Args[0]))
				for i := 1; i < len(cmd.Args); i++ {
					if command == "psubscribe" {
						ps.Psubscribe(conn, string(cmd.Args[i]))
					} else {
						ps.Subscribe(conn, string(cmd.Args[i]))
					}
				}
			}
		},
		func(conn redcon.Conn) bool {
			// Use this function to accept or deny the connection.
			// log.Printf("accept: %s", conn.RemoteAddr())
			return true
		},
		func(conn redcon.Conn, err error) {
			// This is called when the connection has been closed
			// log.Printf("closed: %s, err: %v", conn.RemoteAddr(), err)
		},
	)
	if err != nil {
		log.Fatal(err)
	}
}

redcon.ListenAndServe 是一个命令分发器，你可以注册你实现的命令处理函数。
在上面的例子中，每一个switch case是一种命令的处理，这里的例子很简单，就没有把每种命令的处理逻辑写成一个个独立的handler,而是直接在case中直接处理。如果我们要实现一个类Redis系统，最好的方式是把每种命令的处理逻辑写成一个个独立的handler，这样代码更清晰，更易维护。
这些handler最好按照redis命令的分类，分成几个文件，分别处理string、set等类型。

这样的设计，不仅符合命令分发模式，而且符合单一职责原则，代码更易维护。

从上面的几个例子来看，命令分发模式在实现类似 Memcached、Redis 这种基础架构产品中非常适用，它可以帮助我们实现一个灵活、可扩展的系统架构。本周的另外一篇文章，介绍一个基于SQLite的类Redisa的实现，也是采用了命令分发模式,请关注“鸟窝聊技术”公众号，及时获取最新的文章。

使用Rust捕获和解析网络包

2024-05-22T14:14:30.000Z

前两篇文章介绍了C++和Go中利用TCP Option中的时间戳实现计算网络时延。基于“用Rust重写一切”的哲学，今天我们来看看Rust中如何做这个事情。夜深人静，再肝一篇关于网络编程的文章。

Rust中还没有和 gopacket一样功能强大的包，它的pcap用来捕获网络包没有问题，但是缺乏解析的能力，所以我们使用另外一个包pdu来实现网络包的解析。

当然rust生态圈中还有其他的包捕获库如pnet、包解析库如etherparse等，但是我选择了pcap和pdu，因为针对这篇文章的场景，它们用起来很顺手。

为了简单起见，我们不像前两篇文章那样的程序那么复杂，还要解析参数，针对参数做不同的处理，这次Rust实现的程序中，我们主要实现其最核心的功能：

捕获 TCP 包
解析TCP选项中的时间戳
计算时延

我是在Mac mini的进行开发和运行的，理论在Linux上也是可以运行的。

你可能需要安装libpcap库。

Mac上可能你需要临时设置权限，才有可能正常运行程序：

1	sudo chmod 666 /dev/bpf*

首先看看程序运行的效果：

那么程序一开始，我们开始要使用pcap捕获包：

use std::net::{Ipv4Addr,Ipv6Addr};
use std::ops::Sub;
use std::time::{Duration, UNIX_EPOCH};
use chrono::{DateTime, Local};
use macaddr::MacAddr;
use pcap;
use pdu::*;
use libc;
fn main() {
    // 这个用来记录flow已经它被捕获的时间
    let mut map = std::collections::HashMap::new();
    // 在Mac上，使用en1网卡
    let mut cap = pcap::Capture::from_device("en1")
        .unwrap()
        .immediate_mode(true)
        .open()
        .unwrap();
    // 你可以设置filter，这里我们简化不进行设置了
    // cap.filter("host 127.0.0.1", true).unwrap();
    while let Ok(packet) = cap.next_packet() {
        // 得到捕获的包信息
        ......
    }
}

目前我们只能得到捕获的包信息，包括pcap增加的头信息(捕获时间、包长度等)和包的数据。

我们需要解析包的数据，得到TCP包，然后解析TCP选项中的时间戳。目前pcap不能帮助我们了。

我们在那个while循环中一步一步补充省略的代码：

let ethernet = EthernetPdu::new(&packet.data).unwrap();
// 实现代码，输出源和目的MAC地址,转换成MacAddr类型
let _src_mac = MacAddr::from(ethernet.source_address());
let _dst_mac = MacAddr::from(ethernet.destination_address());
// println!("ethernet: src_mac={}, dst_mac={}", src_mac, dst_mac);
let ei = ethernet.inner();
let (src_ip,dst_ip, tcp) = match ei {
    Ok(Ethernet::Ipv4(ref ip)) => {
        let src_ip = Ipv4Addr::from(ip.source_address()).to_string();
        let dst_ip = Ipv4Addr::from(ip.destination_address()).to_string();
        let tcp = match ip.inner() {
            Ok(Ipv4::Tcp(tcp)) => Some(tcp),
            _ => None
        };
        
        (src_ip,dst_ip,tcp)
    }
    Ok(Ethernet::Ipv6(ref ip)) => {
        let src_ip = Ipv6Addr::from(ip.source_address()).to_string();
        let dst_ip = Ipv6Addr::from(ip.destination_address()).to_string();
        let tcp = match ip.inner() {
            Ok(Ipv6::Tcp(tcp)) => Some(tcp),
            _ => None
        };
        (src_ip,dst_ip,tcp)
    }
    _ => (String::new(),String::new(),None)
    
};
......

首先解析出ethernet层,和gopacket调用方法不同，但是一样很简洁。

ethernet中包含源目的Mac地址，如果你需要，你可以调用相应的方法获取它们。本程序不需要这两个信息，忽略即可。

接下来解析IP层,这会涉及到ipv4和ipv6两种情况，我们分别处理。

let ei = ethernet.inner();
let (src_ip,dst_ip, tcp) = match ei {
    Ok(Ethernet::Ipv4(ref ip)) => {
        let src_ip = Ipv4Addr::from(ip.source_address()).to_string();
        let dst_ip = Ipv4Addr::from(ip.destination_address()).to_string();
        let tcp = match ip.inner() {
            Ok(Ipv4::Tcp(tcp)) => Some(tcp),
            _ => None
        };
        
        (src_ip,dst_ip,tcp)
    }
    Ok(Ethernet::Ipv6(ref ip)) => {
        let src_ip = Ipv6Addr::from(ip.source_address()).to_string();
        let dst_ip = Ipv6Addr::from(ip.destination_address()).to_string();
        let tcp = match ip.inner() {
            Ok(Ipv6::Tcp(tcp)) => Some(tcp),
            _ => None
        };
        (src_ip,dst_ip,tcp)
    }
    _ => (String::new(),String::new(),None)
    
};
    
if tcp.is_none() {
    continue;
}
let tcp = tcp.unwrap();

调用inner方法就可以得到IP层的信息，我们处理ipv4和ipv6两种情况，分别获取源目的IP地址和TCP层这三个数据。

因为一开始我们没有设置filter,所以这里捕获的包很多，比如UDP的包、ARP的包，我们在这里检查包是否是TCP包，如果不是，我们忽略这个包。当然最好是一开始就设置filter，性能会更好。

接下来我们解析TCP选项中的时间戳：

let ts = tcp.options().find_map(|option| {
    match option {
        TcpOption::Timestamp{val,ecr} => {
            Some((val, ecr))
        }
        _ => None
    }
});
if ts.is_none() {
    continue;
}
if ts.unwrap().1 == 0 && !tcp.syn(){
    continue;
}

pdu库的好处是方便解析TCP以及它的选项。TCP的选项可能有好几个，我们只match时间戳的那个，得到时间戳的值和echo reply的值。

接下来我们处理数据。首先根据五元组和tval为key,将这个flow的信息存储到map中：

let key = format!("{}:{}->{}:{}-{}",  src_ip, tcp.source_port(),dst_ip,tcp.destination_port(),ts.unwrap().0);
if !map.contains_key(key.as_str()) {
    map.insert(key, packet.header.ts);
}

然后我们找反向的key,如果存在，就说明有去向，当前处理的是回向，我们计算两个捕获的值的差，就是时延：

let reverse_key = format!("{}:{}->{}:{}-{}", dst_ip, tcp.destination_port(),src_ip,tcp.source_port(),ts.unwrap().1);
if map.contains_key(reverse_key.as_str()) {
    map.get(reverse_key.as_str()).map(|ts| {
        let rtt = timeval_diff_str(ts,&packet.header.ts);
        println!("{} {} {}:{}->{}:{}", timeval_to_current_time_str(&packet.header.ts), rtt,dst_ip, tcp.destination_port(),src_ip,tcp.source_port());
    });
}

当然为了避免map中的数据越积越多，我们可以定期清理一下，这里我们根据map中的元素的数量决定要不要清理：

if map.len() > 10_000 {
    map.retain(|_,v| {
        let now = std::time::SystemTime::now();
        let duration = now.duration_since(UNIX_EPOCH).unwrap();
        let ts = Duration::new(v.tv_sec as u64, v.tv_usec as u32 * 1000);
        duration.sub(ts).as_secs() < 60
    });
}

然后补充两个计算时间的辅助程序，这就是这个程序的全部代码了:

fn timeval_to_current_time_str(tv: &libc::timeval) -> String {
    let secs = tv.tv_sec as u64;
    let nsecs = (tv.tv_usec as u32 * 1000) as u64;
    let duration = UNIX_EPOCH + std::time::Duration::new(secs, nsecs as u32);
    let datetime = DateTime::::from(duration);
    datetime.format("%H:%M:%S").to_string()
}
fn timeval_diff_str(start: &libc::timeval, end: &libc::timeval) -> String {
    let secs = end.tv_sec as i64 - start.tv_sec as i64;
    let usecs = end.tv_usec as i64 - start.tv_usec as i64;
    let (secs, usecs) = if usecs < 0 {
        (secs - 1, usecs + 1_000_000)
    } else {
        (secs, usecs)
    };
    format_duration(secs, usecs as u32)
}
fn format_duration(secs: i64, usecs: u32) -> String {
    let duration = secs * 1_000_000 + usecs as i64;
    match duration {
        0..=999_999 => format!("{:.3}ms", duration as f64 / 1_000.0),
        _ => format!("{:.6}s", duration as f64 / 1_000_000.0),
    }
}

你对Rust实现的 pping 有什么看法，欢迎在评论区留下你宝贵的意见。

使用Go语言实现 pping

2024-05-20T15:15:55.000Z

大家好，我是鸟窝。

在前一篇“pping：被动式ping,计算网络时延”一篇中，我给大家介绍了 pping 这个工具的原理和使用方法。这篇文章中，我将使用 Go 语言实现 pping 工具。

通过这篇文章，你将了解到：

如何使用gopacket来捕获和解析网络数据包
如何设置捕获时长和过滤捕获的数据包
如何在CGO下静态编译库，如libpcap
了解TCP/IP协议栈的基本知识，如TCP Option
如何进行数据的统计和定时输出和清理
如何使用 pflag 来解析命令行参数

代码在: github.com/smallnest/pping-go

使用libpcap捕获数据包，并进行包过滤

我们并不直接使用libpcap，而是使用封装好的gopacket。

gopacket是一个用于处理数据包的库，它提供了一个高级的API，可以用来处理数据包的解析、分析和生成。它支持多种数据包格式，包括Ethernet、IPv4、IPv6、TCP、UDP、ICMP等。

我们可以使用gopacket来捕获数据包，然后使用gopacket/layers包来解析数据包的各个部分。


// 创建一个新的非活动 pcap 句柄, *liveInp是网卡的名称
inactive, _ := pcap.NewInactiveHandle(*liveInp)
// 使用 defer 关键字确保在函数结束时清理非活动句柄
defer inactive.CleanUp()
// 设置捕获的数据包的最大长度
inactive.SetSnapLen(snapLen)
// 激活非活动句柄，返回一个活动句柄和可能的错误
snif, err = inactive.Activate()
// 如果在激活句柄时出现错误，我们打印错误并退出程序
if err != nil {
	fmt.Printf("couldn't open %s: %v\n", *fname, err)
	os.Exit(1)
}

当然你也可以从一个tcpdump这样的工具捕获的pcap文件中解析包：

// 使用 pcap.OpenOffline 函数打开一个离线 pcap 文件，返回一个 pcap 句柄和可能的错误
		snif, err = pcap.OpenOffline(*fname)
		// 如果在打开文件时出现错误，我们打印错误并退出程序
		if err != nil {
			fmt.Printf("couldn't open %s: %v\n", *fname, err)
			os.Exit(1)
		}

之后设置filter进行包过滤, filter的格式和tcpdump使用的过滤格式一样，默认它会加上TCP,只处理TCP的包:

1 2	// 使用 SetBPFFilter 方法设置 BPF 过滤器，过滤器的规则由变量 filter 定义 snif.SetBPFFilter(filter)

之后处理这个包:

src := gopacket.NewPacketSource(snif, layers.LayerTypeEthernet)
// 使用 src.Packets() 获取一个数据包通道，我们可以从这个通道中读取数据包
packets := src.Packets()
for packet := range packets {
	processPacket(packet)
   ......
   // 如果结束或者需要定期打印统计信息，可以使用下面的代码
   ......
   // 如果需要清理过期的数据
   ......

解析包

从TCP Option中解析时间戳的函数是getTSFromTCPOpts，它的实现如下：

// getTSFromTCPOpts 用于从 TCP 选项中获取时间戳信息
func getTSFromTCPOpts(tcp *layers.TCP) (uint32, uint32) {
	var tsval, tsecr uint32
	opts := tcp.Options
	for _, opt := range opts {
		if opt.OptionType == layers.TCPOptionKindTimestamps && opt.OptionLength == 10 { // Timestamp 选项长度为 10 字节
			tsval = binary.BigEndian.Uint32(opt.OptionData[0:4])
			tsecr = binary.BigEndian.Uint32(opt.OptionData[4:8])
			break
		}
	}
	return tsval, tsecr
}

解析IP和TCP包，并从TCP包的Option解析出时间戳：

// processPacket 用于处理捕获到的数据包
func processPacket(pkt gopacket.Packet) {
	// 从数据包中获取 TCP 层
	tcpLayer := pkt.Layer(layers.LayerTypeTCP)
	if tcpLayer == nil {
		not_tcp++
		return
	}
	tcp, _ := tcpLayer.(*layers.TCP)
	// 从 TCP 选项中获取时间戳信息
	// 如果 TSval 为 0 或者 TSecr 为 0 并且不是 SYN 包，则不处理该数据包
	tsval, tsecr := getTSFromTCPOpts(tcp)
	if tsval == 0 || (tsecr == 0 && !tcp.SYN) {
		no_TS++
		return
	}
	// 从数据包中获取网络层
	// 如果网络层不是 IPv4 或 IPv6，则不处理该数据包
	netLayer := pkt.Layer(layers.LayerTypeIPv4)
	if netLayer == nil {
		netLayer = pkt.Layer(layers.LayerTypeIPv6)
		if netLayer == nil {
			not_v4or6++
			return
		}
	}

目前为止我们从包中解析除了IP包和TCP包，接下里我们得到源目IP和源目端口，以及捕获时间：

// 从网络层中获取源 IP 和目的 IP
// 从 TCP 层中获取源端口和目的端口
// 用于构建流的源和目的
var ipsStr, ipdStr string
if ip, ok := netLayer.(*layers.IPv4); ok {
	ipsStr = ip.SrcIP.String()
	ipdStr = ip.DstIP.String()
} else {
	ip := netLayer.(*layers.IPv6)
	ipsStr = ip.SrcIP.String()
	ipdStr = ip.DstIP.String()
}
srcStr := ipsStr + ":" + strconv.Itoa(int(tcp.SrcPort))
dstStr := ipdStr + ":" + strconv.Itoa(int(tcp.DstPort))
// 从数据包中获取捕获时间
captureTime := pkt.Metadata().CaptureInfo.Timestamp
// 如果 offTm 小于 0，则将捕获时间设置为 offTm
if offTm < 0 {
	offTm = captureTime.Unix()
	startm = float64(captureTime.Nanosecond()) * 1e-9
	// 如果 sumInt 大于 0，则打印第一个数据包的时间
	capTm = startm
	if sumInt > 0 {
		fmt.Printf("first packet at %s\n", captureTime.Format(time.UnixDate))
	}
} else {
	capTm = float64(captureTime.Unix()-offTm) + float64(captureTime.Nanosecond())*1e-9
}

接下来是从全局哈希表flows中查找流，如果没有则创建一个新的流，如果反向流已经存在，则设置反向流。如果反向流不存在，不处理。

fstr := srcStr + "+" + dstStr
fr, ok := flows[fstr]
if !ok { // 新流
    // 如果流的数量大于 maxFlows，则返回
    if flowCnt >= maxFlows {
        return
    }
    fr = &flowRec{
        flowname: fstr,
        min:      1e30,
    }
    flows[fstr] = fr
    flowCnt++
    // 如果反向流已经存在，则设置反向流
    if _, ok := flows[dstStr+"+"+srcStr]; ok {
        flows[dstStr+"+"+srcStr].revFlow = true
        fr.revFlow = true
    }
}
fr.last_tm = capTm
// 如果反向流不存在，不处理
if !fr.revFlow {
    uniDir++
    return
}

既然找到反向流了，说明正向反向的两个packet我们都获取到了了，那么就可以利用两次的捕获时间计算 RTT 了：

	// 统计流的发送字节数
	arr_fwd := fr.bytesSnt + float64(pkt.Metadata().Length)
	fr.bytesSnt = arr_fwd
	// 增加时间戳
	if !filtLocal || localIP != ipdStr {
		addTS(fstr+"+"+strconv.FormatUint(uint64(tsval), 10), &tsInfo{capTm, arr_fwd, fr.bytesDep})
	}
	// 处理对应的反向流
	ti := getTS(dstStr + "+" + srcStr + "+" + strconv.FormatUint(uint64(tsecr), 10))
	if ti != nil && ti.t > 0.0 {
		// 这是返回的数据包的捕获时间
		t := ti.t
		rtt := capTm - t
		if fr.min > rtt {
			fr.min = rtt // 跟踪最小值
		}
		// fBytes 存储了从源到目标的数据流的字节数
		fBytes := ti.fBytes
		// dBytes 存储了从目标到源的数据流的字节数
		dBytes := ti.dBytes
		// pBytes 存储了从上一次发送到现在的数据包的字节数
		pBytes := arr_fwd - fr.lstBytesSnt
		// 更新上一次发送的字节数为当前的发送字节数
		fr.lstBytesSnt = arr_fwd
		// 更新反向流的依赖字节数为 fBytes
		flows[dstStr+"+"+srcStr].bytesDep = fBytes
		if machineReadable {
			// 打印捕获时间戳、本次rtt值、此流的最小值、字节数信息
			fmt.Printf("%d.%06d %.6f %.6f %.0f %.0f %.0f", int64(capTm+float64(offTm)), int((capTm-float64(int64(capTm)))*1e6), rtt, fr.min, fBytes, dBytes, pBytes)
		} else {
			// 打印捕获时间、本次rtt值、此流的最小值、流的五元组
			fmt.Printf("%s %s %s %s\n", captureTime.Format("15:04:05"), fmtTimeDiff(rtt), fmtTimeDiff(fr.min), fstr)
		}
		now := clockNow()
		if now-nextFlush >= 0 {
			nextFlush = now + flushInt
		}
		ti.t = -t // 将条目标记为已使用,避免再次保存这个 TSval
	}
	pktCnt++
}

清理过期数据

如果不清理，flows和tsTbl中的数据会越来越多，最终撑爆。
我们遍历，删除过期的数据。

// 清理超期的数据
func cleanUp(n float64) {
	// 如果 TSval 的时间超过 tsvalMaxAge,则删除条目
	for k, ti := range tsTbl {
		if capTm-math.Abs(ti.t) > float64(tsvalMaxAge)/float64(time.Second) {
			delete(tsTbl, k)
		}
	}
	for k, fr := range flows {
		if n-fr.last_tm > float64(flowMaxIdle)/float64(time.Second) {
			delete(flows, k)
			flowCnt--
		}
	}
}

使用 pflag 解析参数

相对于标准库的 pflag, github.com/spf13/pflag功能更为强大。这里我们使用它解析参数，可以设置短参数和长参数:

var (
	liveInp   = pflag.StringP("interface", "i", "", "interface name")
	fname     = pflag.StringP("read", "r", "", "pcap captured file")
	filterOpt = pflag.StringP("filter", "f", "", "pcap filter applied to packets")
)
func main() {
	pflag.DurationVarP(&sumInt, "sumInt", "q", 10*time.Second, "interval to print summary reports to stderr")
	pflag.BoolVarP(&filtLocal, "showLocal", "l", false, "show RTTs through local host applications")
	pflag.DurationVarP(&timeToRun, "seconds", "s", 0*time.Second, "stop after capturing for  seconds")
	pflag.IntVarP(&maxPackets, "count", "c", 0, "stop after capturing  packets")
	pflag.BoolVarP(&machineReadable, "machine", "m", false, "machine readable output")
	pflag.DurationVarP(&tsvalMaxAge, "tsvalMaxAge", "M", 10*time.Second, "max age of an unmatched tsval")
	pflag.DurationVarP(&flowMaxIdle, "flowMaxIdle", "F", 300*time.Second, "flows idle longer than  are deleted")
	pflag.Parse()
    ...
}

静态编译

差点忘了。
我们使用gopacket来捕获数据包，它依赖于libpcap。我们需要在编译时链接libpcap库。但是在不同的操作系统上，libpcap的位置和名称可能不同。为了解决这个问题，我们可以使用CGO来链接libpcap库，然后使用go build来编译我们的程序。

1	go build -o pping .

不过如果你使用ldd查看这个程序，你会发现它有很多依赖的动态库:

[root@cypress pping]# ldd pping
	linux-vdso.so.1 =>  (0x00007ffcf33e1000)
	libpcap.so.1 => /lib64/libpcap.so.1 (0x00007f4b81933000)
	libresolv.so.2 => /lib64/libresolv.so.2 (0x00007f4b81719000)
	libpthread.so.0 => /lib64/libpthread.so.0 (0x00007f4b814fd000)
	libc.so.6 => /lib64/libc.so.6 (0x00007f4b8112f000)
	/lib64/ld-linux-x86-64.so.2 (0x00007f4b81b74000)

我们可以采用静态链接的方式，这样编译出来的pping,可以轻松的复制到其他的Linux机器上运行，不需要安装libpcap库。

[root@cypress pping]# go build -ldflags "-linkmode external -extldflags -static" .
# github.com/smallnest/pping
/tmp/go-link-79680640/000006.o：在函数‘_cgo_97ab22c4dc7b_C2func_getaddrinfo’中：
/tmp/go-build/cgo-gcc-prolog:60: 警告：Using 'getaddrinfo' in statically linked applications requires at runtime the shared libraries from the glibc version used for linking
//usr/local/lib/libpcap.a(nametoaddr.o)：在函数‘pcap_nametoaddr’中：
/root/libpcap-1.10.0/./nametoaddr.c:181: 警告：Using 'gethostbyname' in statically linked applications requires at runtime the shared libraries from the glibc version used for linking
//usr/local/lib/libpcap.a(nametoaddr.o)：在函数‘pcap_nametonetaddr’中：
/root/libpcap-1.10.0/./nametoaddr.c:270: 警告：Using 'getnetbyname_r' in statically linked applications requires at runtime the shared libraries from the glibc version used for linking
//usr/local/lib/libpcap.a(nametoaddr.o)：在函数‘pcap_nametoproto’中：
/root/libpcap-1.10.0/./nametoaddr.c:527: 警告：Using 'getprotobyname_r' in statically linked applications requires at runtime the shared libraries from the glibc version used for linking
[root@cypress pping]# ldd pping
	不是动态可执行文件

它的使用方法和标准库的flag类似。这样我们就能保证和c++的pping工具一样的参数解析了。

基于"Rust重写一切"的哲学，我期望早点能看到大家用Rust实现的 pping。

鸟窝

Go中秘而不宣的数据结构 runq, 难怪运行时调度那么好

runq

runqput

runqputbatch

runqget

runqdrain

runqgrab

runqsteal

gQueue 和 gList

global runq

Go中秘而不宣的数据结构 spmc, 10倍性能于 channel

poolDequeue

代码分析

PoolChain

与channel的性能比较

在 Rust 中同时支持异步和同步代码

介绍

第一种方法

老掉牙的复制粘贴大法

召唤 block_on

复制 crate

最终版是：maybe_async crate

问题

新特性解析器 v2

其他失败

修复 maybe_async

官方支持

结论

四种字符串和bytes互相转换方式的性能比较

一、强转

二、传统 unsafe 方式

三、新型 unsafe 方式

四、kubernetes 的实现

性能比较

性能分析

k8s实现的问题

总结

没有什么不可能：修改 Go 结构体的私有字段

通过反射设置一个变量的值

访问外部包的结构体的私有字段

设置结构体的私有字段

使用unexported字段的Value设置公开字段

给unaddressable的值设置值

回顾

使用eBPF编写系统调用跟踪器

先决条件

简介

目标

概念

编写 eBPF 程序

Russ Cox 引退以及他的新项目 Oscar

128位整数的原子操作

atomic128 的方法

atomic128 的实现

思路发散

Go 朝着错误的方向发展

Go1.23 中的迭代器

Go1.23 中迭代器的其他问题

结论

我是谁?

Rob Pike 语录

1. 计算机领域里，没有什么问题是加一层间接寻址解决不了的。

2. 数据为王。如果你选择了正确的数据结构，并且组织得当，算法几乎总是不言自明的。编程的核心在于数据结构，而不是算法。

3. 面向对象设计就是计算机界的罗马数字。

4. 最后，我意识到光想是没什么出路的，该动手实践了。

5. 见识短浅，想象力就会受限。

6. 这就是现代计算：简单的东西变得过于复杂，因为随意捣鼓太容易；复杂的东西依旧复杂，因为修复太难。

7. 过程名应该反映它做什么；函数名应该反映它返回什么。

8. 花哨的算法在 N 小的时候很慢，而 N 通常都很小。

9. UNIX不仅已经死了，臭的都快熏死人了。

10. 想要杜绝傻瓜行为的编程语言，往往自己也变得傻不拉几。

11、缓存不是架构，只是个优化手段而已。

12、没有类型层次，就不用费劲去管理类型层次了。

13、按工程管理的规则，生产力最重要；可在工程师眼里，乐趣才是第一位。生产力源于乐趣。

14、第一法则：你猜不准程序会在哪里耗时。性能瓶颈总在意想不到的地方冒出来，所以别想当然去优化，除非你证实了那里就是瓶颈所在。

14、扩展

15、如果POSIX线程算好东西，我都不敢想它比什么还好。

16、缓存的bug，哪个不是妖魔鬼怪。

17、用 Unix 就跟只听大卫·卡西迪的歌似的，纯属乐坛井底之蛙。

`gQueue` 和 `gList`

召唤 `block_on`

最终版是：`maybe_async` crate

修复 `maybe_async`

22、 Go语言箴言