Feb 3, 2022

跟着 Go 作者学泛型

大家好，我是 polarisxu。

在 GopherCon 2021 年大会上，Go 两位作者 Robert Griesemer 和 Ian Lance Taylor 做了泛型相关的演讲，即将在 Go1.18 发布的 Go 泛型，正是两位设计的。一直想着把他们的演讲做一个梳理，然后分享给大家。拖的有点久，趁春节假期整理出来了。

注意，本文中的 constraints 包，已经确定在 Go1.18 正式版中去除，放入 golang.org/x/exp 中。详细可以参考该文：Go1.18 这个包确定没了。

Go1.18 关于泛型部分，主要有三个特性：

Type parameters for functions and types，即函数和类型的类型参数
Type sets defined by interfaces，即由接口定义的类型集合
Type inference，即类型推断

1、类型参数

先看函数的类型参数。

类型参数列表（Type parameter lists）

类型参数列表看起来是带方括号的普通参数列表。通常，类型参数以大写字母开头，以强调它们是类型：

[P, Q constraint1, R constraint2]

看一个例子。

非泛型版本的求最小值：

func min(x, y float64) float64 {
  if x < y {
    return x
  }
  return y
}

如果有 int 类型的 min 版本需求，得另外写一个类似的函数，这完全是重复代码。

那泛型版本呢？

func min[T constraints.Ordered](x, y T) T {
  if x < y {
    return x
  }
  return y
}

注意和上面版本的区别。

多了一个 [T constraints.Ordered]，这就是类型参数列表，声明了一个类型 T，它的约束是 constraints.Ordered，即类型 T 满足它规定的条件
参数类型 float64 变成了 T，而不是具体的某个类型

那这个泛型函数如何调用呢？

m := min[int](2, 3)

是不是很奇怪？其实仔细一琢磨，好像没问题。因为函数声明中有 [T constraints.Ordered]，跟普通的函数参数有点像。调用时，提供 int，表明普通函数参数是 int 类型。

实例化

在调用时，会进行实例化过程：

1）用类型实参（type arguments）替换类型形参（type parameters）

2）检查类型实参（type arguments）是否实现了类型约束

如果第 2 步失败，实例化（调用）失败。

所以，调用过程可以分解为以下两步：

fmin := min[float64]
m := fmin(2.3, 3.4)

// 和下面等价
m := min[float64](2.3, 3.4)
// 相当于 m := (min[float64])(2.3, 3.4)

所以，实例化产生了一个非泛型函数。

类型的类型参数

类型也可以有类型参数。通过一个例子理解一下。

一个泛型版二叉树：

type Tree[T interface{}] struct {
	left, right *Tree[T]
	data        T
}

func (t *Tree[T]) Lookup(x T) *Tree[T]

var stringTree Tree[string]

注意其中的 [T interface{}] ，跟函数的类型参数语法是一样的，T 相当于是一个类型，所以，之后用到 Tree 的地方，T 都跟随着，即 Tree[T]，包括方法的接收者（receiver）。

注意实例化的地方：var stringTree Tree[string]，和上面两个实例化步骤中的第一步一样。

2、类型集合（Type sets）

先看值参数的类型（the type of value parameters）。

函数普通参数列表中的每个值参数都有一个类型，这个类型定义值的集合。比如 float64 定义了浮点数值的集合。

相应的有类型参数的类型（the type of type parameters），也就是说，类型参数列表中的每个类型参数都有一个类型，这个类型定义了类型的集合，这叫做类型约束（type constraint）：

func min[T constraints.Ordered](x, y T) T

这里的 constraints.Ordered 是类型参数列表中的 T 参数的类型，它定义了类型的集合，即类型约束。

constraints.Ordered 是 Go1.18 内置的一个类型约束，它有两个功能：

只有值支持排序的类型才能传递给类型参数 T；
T 类型的值必须支持 < 操作符，因为函数体中使用了该操作符。

类型约束是接口

大家都知道接口定义了方法集（method sets），演讲中给了一张图：

method sets

根据 Go 的规则，类型 P、Q、R 方法中包含了 a、b、c，因此它们实现了接口。

所以，反过来可以说，接口也定义了类型集（type sets）：

type sets

上图中，类型 P、Q、R 都实现了左边的接口（因为都实现了接口的方法集），因此我们可以说该接口定义了类型集。

既然接口是定义类型集，只不过是间接定义的：类型实现接口的方法集。而类型约束是类型集，因此完全可以重用接口的语义，只不过这次是直接定义类型集：

interface defines type sets

这就是类型约束的语法，通过接口直接定义类型集：

type Xxx interface {
  int | string | bool
}

而 constraints.Ordered 的定义如下：

// Ordered is a constraint that permits any ordered type: any type
// that supports the operators < <= >= >.
// If future releases of Go add new ordered types,
// this constraint will be modified to include them.
type Ordered interface {
	Integer | Float | ~string
}

Ordered 定义了所有 interger、浮点数和字符串类型的集合。所以，< 操作符也是支持的。这其中的 Integer、Float 也在 constraints 包有定义。

细心的朋友应该发现了 ~string，类型前面的 ~。~T 意味着包含底层类型 T 的所有类型集合。

如果约束中的所有类型都支持一个操作，则该操作可以与相应的类型参数一起使用

除了将约束单独定义为类型外，还可以写成字面值的形式，比如：

[S interface{~[]E}, E interface{}]

这看着有点晕，其实可以直接这么写：

[S ~[]E, E interface{}]

Go1.18 中，any 是 interface{} 的别名，因此可以进一步写为：

[S ~[]E, E any]

E 是切片的元素类型，~[]E 表示底层是 []E 切片类型的都符合该约束。

3、类型推断

在调用泛型函数时，提供类型实参感觉有点多余。Go 虽然是静态类型语言，但擅长类型推断。因此泛型这里，Go 也实现了类型推断。

调用泛型版的 min，可以不提供类型实参，而是直接由 Go 进行类型推断：

var a, b, m float64
m := min[float64](a, b)

类型推断的细节很复杂，但使用起来还是很简单，大部分时候，跟普通函数调用没有区别。

关于类型推断，演讲中给了一个例子：

func Scale[E constraints.Integer](s []E, c E) []E {
	r := make([]E, len(s))
	for i, v := range s {
		r[i] = v * c
	}
	return r
}

这个函数的目的是希望对 s 中的每个元素都乘以参数 c，最后返回一个新的切片。

接着定义一个类型：

type Point []int32

func (p Point) String() string {
	// 实现细节不重要，忽略
	return "point"
}

很显然，Point 类型的切片可以传递给 Scale：

func ScaleAndPrint(p Point) {
	r := Scale(p, 2)
	fmt.Println(r.String())
}

我们希望对 p 进行 Scale，得到一个新的 p，但发现返回的 r 根本不是 Point：

func main() {
	p := Point{3, 2, 4}
	ScaleAndPrint(p)
}

会报错：r.String undefined (type []int32 has no field or method String)。

所以，我们应该这样修改 Scale 函数：

func Scale[S ~[]E, E constraints.Integer](s S, c E) S {
	r := make(S, len(s))
	for i, v := range s {
		r[i] = v * c
	}
	return r
}

注意其中的变化：加入了泛型 S，以及额外的类型约束 ~[]E。

调用 Scale 时，不需要 r := Scale[Point, int32](p, 2)，因为 Go 会进行类型推断。

正确的完整代码如下：

package main

import (
	"constraints"
	"fmt"
)

func Scale[S ~[]E, E constraints.Integer](s S, c E) S {
	r := make(S, len(s))
	for i, v := range s {
		r[i] = v * c
	}
	return r
}

type Point []int32

func (p Point) String() string {
	// 实现细节不重要，忽略
	return "point"
}

func ScaleAndPrint(p Point) {
	r := Scale(p, 2)
	fmt.Println(r.String())
}

func main() {
	p := Point{3, 2, 4}
	ScaleAndPrint(p)
}

4、什么时候用泛型

泛型的加入，无疑增加了复杂度。我个人认为，能不用泛型就不用泛型。在演讲中，两位大佬提到，在以下场景可以考虑使用泛型：

对于 slice、map、channel 等类型，如果它们的元素类型是不确定的，操作这类类型的函数可以考虑用泛型
一些通用目的的数据结构，比如前面提到的二叉树等
如果一些函数行为相同，只是类型不同，可以考虑用泛型重构

注意，目前 Go 方法不支持类型参数，所以，如果方法有需要泛型的场景，可以转为函数的形式。

此外，不要为了泛型而泛型。比如这样的泛型就很糟糕：

func ReadFour[T io.Reader](r T) ([]byte, error)

而应该使用非泛型版本：

func ReadFour(r io.Reader) ([]byte, error)

5、总结

泛型是一把双刃剑。泛型的加入，让 Go 不那么简单了。有些代码写出来，可读性可能非常差。我们应该按没有泛型时候写代码，当发现在 Repeat Yourself 时，再考虑能不能用泛型重构，千万别玩什么花样！

最后，放上演讲的视频地址，有兴趣的可以观看：https://www.youtube.com/watch?v=Pa_e9EeCdy8。