1. 介绍

Go语言中的pprof指对于指标或特征的分析(Profiling),通过分析不仅可以查找到程序中的错误(内存泄漏、race冲突、协程泄漏),也能对程序进行优化(例如CPU利用率不足)。

由于Go语言运行时的指标不对外暴露,因此有标准库net/http/pprofruntime/pprof用于与外界交互。其中net/http/pprof提供了一种通过http访问的便利方式,用于用户调试和获取样本特征数据。

对特征文件进行分析要依赖谷歌推出的分析工具pprof,该工具在Go安装时即存在。

2. 收集样本

在通过pprof进行特征分析时,需要执行两个步骤:收集样本和分析样本

pprof 采样数据主要有三种获取方式:

  • net/http/pprof: 通过 http 服务获取Profile采样文件,简单易用,适用于对应用程序的整体监控。底层也是通过 runtime/pprof 实现。

  • runtime/pprof: 手动调用runtime.StartCPUProfile或者runtime.StopCPUProfile等 API来生成和写入采样文件,灵活性更高。

  • go test: 通过 go test -cpuprofile cpu.pprof -memprofile mem.pprof生成采样文件,适用对函数进行针对性测试。其中-cpuprofile:生成CPU性能测试信息; -memprofile:生成内存占用信息;

2.1 使用:net/http/pprof

1. 源码详情

package main

import (
"fmt"
"github.com/gin-gonic/gin"
"net/http"
_ "net/http/pprof" // 导入pprof
"strings"
"time"
)
func init() {
//开启http端口,用协程的方式监听,否则会阻塞
go func() {
if err := http.ListenAndServe(":6060", nil); err != nil {
fmt.Println("pprof err:",err)
}
}()
}
func main() {
engine := gin.Default()
engine.GET("/test", func(context *gin.Context) {
context.JSON(200,gin.H{
"msg":"success",
})
})
testPprofHeap()
_ = engine.Run(":8080")
}

// 模拟内存使用增加
func testPprofHeap() {
go func() {
var stringSlice []string
for {
time.Sleep(time.Second *2)
repeat := strings.Repeat("hello,world", 50000)
stringSlice = append(stringSlice,repeat)
fmt.Printf("time:%d length:%d \n",time.Now().Unix(),len(stringSlice))
}
}()
}

2. 访问端口

2.2 使用:runtime/pprof

通过http收集样本是在实践中最常见的方式,但有时可能不太适合,例如对于一个测试程序或只跑一次的定时任务。可以调用runtime/pprof的StartCPUProfile函数,这样,在程序调用StopCPUProfile函数停止之后,即可指定特征文件保存的位置。

1. 代码详情

package tests

import (
"os"
"runtime/pprof"
"testing"
"time"
)

func TestRuntimePProf(t *testing.T) {
// 打开文件
f, err := os.Create("./out.pprof")
if err != nil {
t.Errorf("文件打开失败:%v", err)
return
}
// 调用
err = pprof.StartCPUProfile(f)
defer pprof.StopCPUProfile()
if err != nil {
t.Errorf("StartCPUProfile:%v", err)
}
// 测试单独函数
testPprof()
}

// 模拟内存使用增加
func testPprof() {
ch := make(chan bool)
go func() {
for i := 0; i < 20; i++ {
time.Sleep(time.Millisecond * 200)
}
ch <- true
}()
<-ch
}

2. 运行测试

# 运行
➜ go test pprof_test.go -v
=== RUN TestRuntimePProf
--- PASS: TestRuntimePProf (5.05s)
PASS
ok command-line-arguments 5.448s
# 查看pprof
➜ go tool pprof out.pprof
Type: cpu
Time: Nov 15, 2021 at 4:09pm (CST)
Duration: 4.06s, Total samples = 0
No samples were found with the default sample value type.
Try "sample_index" command to analyze different sample values.
Entering interactive mode (type "help" for commands, "o" for options)
(pprof)

2.3 使用go test

使用格式 go test . -x 文件

  • -cpuprofile: 生成CPU性能信息。
  • -memprofile: 生成内存占用信息。
  • -mutexprofile:生成锁争用情况。

1. 代码详情

package tests

import (
"strings"
"testing"
"time"
)

func TestWithPProf(t *testing.T) {
ch := make(chan bool)
go func() {
var stringSlice []string
for i := 0; i < 20; i++ {
repeat := strings.Repeat("hello,world", 50000)
stringSlice = append(stringSlice,repeat)
time.Sleep(time.Millisecond * 500)
}
ch <- true
}()
<-ch
}

2. 运行测试

# 运行单元测试
➜ go test . -cpuprofile test.pprof -memprofile mem.pprof
# 查看内存pprof
➜ go tool pprof mem.pprof
Type: alloc_space
Time: Nov 15, 2021 at 4:22pm (CST)
Entering interactive mode (type "help" for commands, "o" for options)
(pprof)

3. 分析样本

pprof提供了很多维度的分析,若想分析某一个维度信息,可直接使用go tool pprof http://ip:port/debug/pprof/维度,进入交互式分析。

3.1 分析维度

  • allocs:查看过去所有内存分配的样本,访问路径为/debug/pprof/allocs
  • block:查看导致阻塞同步的堆栈跟踪,访问路径为/debug/pprof/block
  • cmdline:当前程序的命令行的完整调用路径。
  • goroutine:查看当前所有运行的 goroutines 堆栈跟踪,访问路径为/debug/pprof/goroutine
  • heap:查看活动对象的内存分配情况, 访问路径为/debug/pprof/heap
  • mutex:查看导致互斥锁的竞争持有者的堆栈跟踪,访问路径为/debug/pprof/mutex
  • profile:默认进行 30s 的 CPU Profiling,得到一个分析用的 profile 文件,访问路径为/debug/pprof/profile
  • threadcreate:查看创建新OS线程的堆栈跟踪,访问路径为/debug/pprof/threadcreate

最常用的4种pprof类型包括了堆分析heap、协程栈分析goroutine、CPU占用分析profile、程序运行跟踪信息trace

3.2 交互式分析

下面以堆内存(heap)分析为示例:

# 进入交互命令
➜ go tool pprof http://127.0.0.1:6060/debug/pprof/heap?debug=1
Fetching profile over HTTP from http://127.0.0.1:6060/debug/pprof/heap?debug=1
Saved profile in /Users/liuqh/pprof/pprof.alloc_objects.alloc_space.inuse_objects.inuse_space.003.pb.gz
Type: inuse_space
Entering interactive mode (type "help" for commands, "o" for options)
(pprof) top # top 列出以fat列从大到小排序的序列
Showing nodes accounting for 11004.99kB, 100% of 11004.99kB total
Showing top 10 nodes out of 18
flat flat% sum% cum cum%
9975.41kB 90.64% 90.64% 9975.41kB 90.64% strings.(*Builder).grow
517.33kB 4.70% 95.35% 517.33kB 4.70% regexp/syntax.(*compiler).inst
512.25kB 4.65% 100% 512.25kB 4.65% regexp.onePassCopy
0 0% 100% 517.33kB 4.70% github.com/go-playground/validator/v10.init
0 0% 100% 512.25kB 4.65% github.com/go-playground/validator/v10.init.0
0 0% 100% 9975.41kB 90.64% main.testPprofHeap.func1
0 0% 100% 1029.58kB 9.36% regexp.Compile
0 0% 100% 1029.58kB 9.36% regexp.MustCompile
0 0% 100% 1029.58kB 9.36% regexp.compile
0 0% 100% 512.25kB 4.65% regexp.compileOnePass

1.flat|flat%|sum%|cum|cum%

针对不同的维度,展示代表的含义也有所区别,比如:当分析维度是profile时,flat代表的是当前函数运行耗时,当分析维度是heapflat代表的是当前函数占用内存信息,**但是他们都表示的是当前函数..**,依次类推。

  • flat:只包含当前函数的X信息,不包括其调用函数X的信息。
  • flat%:函数自身X所占的总比例。
  • sum%:函数自身累积X占用总比例。
  • cum:函数自身及其调用函数的累计总X
  • cum%:函数自身及其调用函数的X总比例。

X 根据维度不同代表含义也不同

  • 内存分析时,代表所占内存大小
  • CPU分析时,代表所占运行耗时

2. 排查流程(找出最占内存的函数)

步骤一:使用top排序,步骤二:使用list,查看具体代码。

# 使用top -cum,根据累计占用内存排序
(pprof) top -cum
Showing nodes accounting for 11.37MB, 100% of 11.37MB total
flat flat% sum% cum cum%
0 0% 0% 11.37MB 100% main.testPprofHeap.func1
0 0% 0% 11.37MB 100% strings.(*Builder).Grow (inline)
11.37MB 100% 100% 11.37MB 100% strings.(*Builder).grow (inline)
0 0% 100% 11.37MB 100% strings.Repeat
# 使用list,查看具体代码信息;
(pprof) list testPprofHeap
Total: 11.37MB
ROUTINE ======================== main.testPprofHeap.func1 in /Users/liuqh/ProjectItem/GoItem/go-pprof/main.go
0 11.37MB (flat, cum) 100% of Total
. . 31:func testPprofHeap() {
. . 32: go func() {
. . 33: var stringSlice []string
. . 34: for {
. . 35: time.Sleep(time.Second *2)
. 11.37MB 36: repeat := strings.Repeat("hello,world", 50000)
. . 37: stringSlice = append(stringSlice,repeat)
. . 38: fmt.Printf("time:%d length:%d \n",time.Now().Unix(),len(stringSlice))
. . 39: }
. . 40: }()
. . 41:}

踩坑:No source information for

在使用list x,报错:No source information for

(pprof) list testPprofHeap
Total: 11.37MB
No source information for main.testPprofHeap.func1
(pprof) exit

解决方法:

# 使用下面格式替换: go tool pprof http://127.0.0.1:6060/debug/pprof/heap
➜ go tool pprof compileName http://127.0.0.1:6060/debug/pprof/heap

compileName:指的是编译后的程序文件

3.3 可视化分析

1. 安装graphviz

# mac 
brew install graphviz
# ubuntu
sudo apt install graphviz

更多安装方法:https://graphviz.org/download

2.方式一:web

# 在交互式命令行中输入:web,会自动打开浏览器
(pprof) web

3.方式二:-http :port

# 使用参数 -http :9090,直接在浏览器查询
➜ go tool pprof -http :9090 http://127.0.0.1:6060/debug/pprof/heap