Go编译原理之函数内联
本篇文章向大家介绍《Go编译原理之函数内联》,主要包括编译原理、函数内联,具有一定的参考价值,需要的朋友可以参考一下。
函数内联概述
我们知道每一个高级编程语言的函数调用,成本都是在与需要为它分配栈内存来存储参数、返回值、局部变量等等,Go的函数调用的成本在于参数与返回值栈复制、较小的栈寄存器开销以及函数序言部分的检查栈扩容(Go语言中的栈是可以动态扩容的,因为Go在分配栈内存不是逐渐增加的,而是一次性分配,这样是为了避免访问越界,它会一次性分配,当检查到分配的栈内存不够用时,它会扩容一个足够大的栈空间,并将原来栈中的内容拷贝过来)
下边写一段代码,通过Go的基准测试来测一下函数内联带来的效率提升
import "testing"
//go:noinline //禁用内联。如果要开启内联,将该行注释去掉即可
func max(a, b int) int {
if a > b {
return a
}
return b
}
var Result int
func BenchmarkMax(b *testing.B) {
var r int
for i:=0; i
<p style="text-align:center"><img alt="" src="/uploads/20221230/167240250563aed64948c91.png"></p>
<p>在编译的过程中,Go的编译器其实会计算函数内联花费的成本,所以只有简单的函数,才会触发函数内联。在后边函数内联的源码实现中,我们可以看到下边这些情况不会被内联:</p>
- 递归函数
- 函数前有如下注释的:
go:noinline、go:norace、go:nocheckptr、go:uintptrescapes等 - 没有函数体
- 函数声明的抽象语法树中节点数大于5000(我的Go版本是1.16.6)(也就是函数内部语句太多的情况,也不会被内联)
- 函数中包含闭包(
OCLOSURE)、range(ORANGE)、select(OSELECT)、go(OGO)、defer(ODEFER)、type(ODCLTYPE)、返回值是函数(ORETJMP)的,都不会内联
我们也可以构建或编译的时候,通过参数去控制它是否可以内联。如果希望程序中所有的函数都不执行内联操作
go build -gcflags="-l" xxx.go go tool compile -l xxx.go
同样我们在编译时,也可以查看哪些函数内联了,哪些函数没内联,以及原因是什么
go tool compile -m=2 xxx.go
看一个例子
package main
func test1(a, b int) int {
return a+b
}
func step(n int) int {
if n < 2 {
return n
}
return step(n-1) + step(n-2)
}
func main() {
test1(1, 2)
step(5)
}

可以看到test1这个函数是可以内联的,因为它的函数体很简单。step这个函数因为是递归函数,所以它不会进行内联
函数内联底层实现
这里边其实每一个函数调用链都很深,我这里不会一行一行的解释代码的含义,仅仅会将一些核心的方法拿出来介绍一下,感兴趣的小伙伴可以自己去调试一下(前边有发相关文章)(Go源码调试方法)
还是前边提到多次的Go编译入口文件,你可以在入口文件中找到这段代码
Go编译入口文件:src/cmd/compile/main.go -> gc.Main(archInit)
// Phase 5: Inlining
if Debug.l != 0 {
// 查找可以内联的函数
visitBottomUp(xtop, func(list []*Node, recursive bool) {
numfns := numNonClosures(list)
for _, n := range list {
if !recursive || numfns > 1 {
caninl(n)
} else {
......
}
inlcalls(n)
}
})
}
for _, n := range xtop {
if n.Op == ODCLFUNC {
devirtualize(n)
}
}
下边就看一下每个方法都在做哪些事情
visitBottomUp
该方法有两个参数:
xtop:前边已经见过它了,它存放的是每个声明语句的抽象语法树的根节点数组- 第二个参数是一个函数(该函数也有两个参数,一个是满足是函数类型声明的抽象语法树根节点数组,一个是bool值,true表示是递归函数,false表示不是递归函数)
进入到visitBottomUp方法中,你会发现它主要是遍历xtop,并对每个抽象语法树的根节点调用了visit这个方法(仅针对是函数类型声明的抽象语法树)
func visitBottomUp(list []*Node, analyze func(list []*Node, recursive bool)) {
var v bottomUpVisitor
v.analyze = analyze
v.nodeID = make(map[*Node]uint32)
for _, n := range list {
if n.Op == ODCLFUNC && !n.Func.IsHiddenClosure() { //是函数,并且不是闭包函数
v.visit(n)
}
}
}
而visit方法的核心是调用了inspectList方法,通过inspectList对抽象语法树按照深度优先搜索进行遍历,并将每一个节点作为inspectList方法的第二个参数(是一个函数)的参数,比如验证这个函数里边是否有递归调用等(具体就是下边的switch case)
func (v *bottomUpVisitor) visit(n *Node) uint32 {
if id := v.nodeID[n]; id > 0 {
// already visited
return id
}
......
v.stack = append(v.stack, n)
inspectList(n.Nbody, func(n *Node) bool {
switch n.Op {
case ONAME:
if n.Class() == PFUNC {
......
}
case ODOTMETH:
fn := asNode(n.Type.Nname())
......
}
case OCALLPART:
fn := asNode(callpartMethod(n).Type.Nname())
......
case OCLOSURE:
if m := v.visit(n.Func.Closure); m
<p>后边通过调用<code>visitBottomUp</code>的第二个参数传递的方法,对抽象语法树进行内联的判断及内联操作,具体就是<code>caninl</code>和<code>inlcalls</code>这两个方法</p>
<h3>caninl</h3>
<p>该方法的作用就是验证是函数类型声明的抽象语法树是否可以内联</p>
<p>这个方法的实现很简单,首先是通过很多的if语句验证函数前边是否有像<code>go:noinline</code>等这种标记</p>
<pre class="brush:go;">func caninl(fn *Node) {
if fn.Op != ODCLFUNC {
Fatalf("caninl %v", fn)
}
if fn.Func.Nname == nil {
Fatalf("caninl no nname %+v", fn)
}
var reason string // reason, if any, that the function was not inlined
......
// If marked "go:noinline", don't inline
if fn.Func.Pragma&Noinline != 0 {
reason = "marked go:noinline"
return
}
// If marked "go:norace" and -race compilation, don't inline.
if flag_race && fn.Func.Pragma&Norace != 0 {
reason = "marked go:norace with -race compilation"
return
}
......
// If fn has no body (is defined outside of Go), cannot inline it.
if fn.Nbody.Len() == 0 {
reason = "no function body"
return
}
visitor := hairyVisitor{
budget: inlineMaxBudget,
extraCallCost: cc,
usedLocals: make(map[*Node]bool),
}
if visitor.visitList(fn.Nbody) {
reason = visitor.reason
return
}
if visitor.budget
<p>这里边还有一个主要的方法就是<code>visitList</code>,它是用来验证函数里边是否有我们上边提到的go、select、range等等这些语句。对于满足内联条件的,它会将改写该函数声明抽闲语法树的内联字段(<code>Inl</code>)</p>
<h3>inlcalls</h3>
<p>该方法中就是具体的内联操作,比如将函数的参数和返回值转换为调用者中的声明语句等。里边的调用和实现都比较复杂,这里不粘代码了,大家可自行去看。函数内联的核心方法都在如下文件中</p>
<pre class="brush:bash;">src/cmd/compile/internal/gc/inl.go
今天关于《Go编译原理之函数内联》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于golang的内容请关注golang学习网公众号!
Golang 中的 unsafe.Pointer 和 uintptr详解
- 上一篇
- Golang 中的 unsafe.Pointer 和 uintptr详解
- 下一篇
- Go结合Gin导出Mysql数据到Excel表格
-
- Golang · Go教程 | 3分钟前 |
- Golang切片append扩容机制解析
- 383浏览 收藏
-
- Golang · Go教程 | 9分钟前 |
- Go语言高效筛选JSON数组技巧
- 325浏览 收藏
-
- Golang · Go教程 | 20分钟前 | golang 并发安全 HTTP服务 投票系统 sync.RWMutex
- Golang实现投票系统教程详解
- 116浏览 收藏
-
- Golang · Go教程 | 24分钟前 | golang module
- Golang依赖重新下载技巧全解析
- 452浏览 收藏
-
- Golang · Go教程 | 34分钟前 |
- Golang文件读取错误处理技巧
- 313浏览 收藏
-
- Golang · Go教程 | 41分钟前 |
- GolangRESTAPI版本控制方法解析
- 472浏览 收藏
-
- Golang · Go教程 | 1小时前 |
- Golang中间件日志记录技巧
- 426浏览 收藏
-
- Golang · Go教程 | 1小时前 |
- Golang中介者模式降低耦合技巧
- 193浏览 收藏
-
- Golang · Go教程 | 1小时前 |
- GolangSocket编程实战教程
- 355浏览 收藏
-
- Golang · Go教程 | 1小时前 |
- Go测试中相对路径资源加载技巧
- 375浏览 收藏
-
- Golang · Go教程 | 1小时前 |
- GolangBenchmark内存分配性能分析
- 280浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3176次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3388次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3417次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4522次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3796次使用
-
- Go语言编译原理之源码调试
- 2022-12-31 458浏览
-
- Go语言编译原理之变量捕获
- 2022-12-31 144浏览
-
- gojson编译原理XJSON实现四则运算
- 2022-12-31 191浏览

