当前位置:首页 > 文章列表 > Golang > Go教程 > Golang获取字符串长度的实用方法

Golang获取字符串长度的实用方法

2026-03-26 11:57:46 0浏览 收藏
Go语言中字符串的长度计算暗藏关键陷阱:len()函数返回的是UTF-8字节长度而非人类可读的字符数(rune数),例如"你好"用len()得6但实际只有2个字符;正确获取字符数必须使用utf8.RuneCountInString(),遍历时应优先用for range而非基于len()的下标循环,避免乱码或panic;转换为[]rune虽能支持随机访问,但有显著内存和性能开销,仅在必要时采用;在API限制、日志截断、数据库存储等真实场景中,必须明确区分字节长度与字符长度,否则极易引发跨语言兼容性问题和线上bug——掌握这一底层差异,是写出健壮国际化Go代码的第一道防线。

Golang怎么获取字符串长度_Golang如何区分字节长度和字符长度【技巧】

Go 里 len() 返回的是字节长度,不是字符个数

这是最常踩的坑:用 len("你好") 得到 6,不是 2。因为 Go 字符串底层是 UTF-8 编码的字节数组,len() 统计的是字节数,不是 Unicode 码点个数。

真正要算“人眼看到的字符数”,得用 utf8.RuneCountInString()

import "unicode/utf8"

s := "Hello 世界"
fmt.Println(len(s))                 // 13(H-e-l-l-o-空格-世-界,后两个各占 3 字节)
fmt.Println(utf8.RuneCountInString(s)) // 8(5 个 ASCII + 3 个汉字)
  • ASCII 字符(如英文、数字)一个字节一个 rune,len()utf8.RuneCountInString() 结果相同
  • 中文、emoji、带变音符号的字母(如 “café” 中的 é)通常占多个字节,但只算一个 rune
  • 别用 strings.Count() 或遍历 []rune 来凑数——前者逻辑错,后者开销大

遍历字符串时别直接用 for i := 0; i

这种写法按字节索引走,遇到多字节 rune 会切在中间,导致乱码或 panic(比如取 s[i] 得到非法 UTF-8 字节)。

正确方式只有两种:

  • for range s —— 自动按 rune 迭代,i 是字节起始位置,r 是当前 rune
  • 显式转成 []rune 再下标访问(仅当真需要随机访问第 N 个字符时才考虑,有内存和性能成本)

反例:for i := 0; i → 可能输出 或崩溃

string[]rune 的开销和适用边界

转成 []rune 是深拷贝,会重新分配内存并解码所有 UTF-8 字节。对长文本(比如几 MB 的 JSON 字符串)频繁转换,GC 压力明显。

  • 只在需要**随机访问**(如 runes[5])、**修改单个字符**(需先转切片再拼回 string)或**稳定索引计算**(比如分页截断)时才转
  • 单纯遍历、统计、查找?用 for rangeutf8.DecodeRuneInString() 流式处理更轻量
  • 注意:[]rune 长度 = 字符数,但它的每个元素是 rune(int32),不是字节,所以 len([]rune(s))utf8.RuneCountInString(s)

JSON、HTTP header 等场景下长度判断容易混淆

API 返回的 Content-Length 是字节长度;前端 JS 的 "中".length 是字符长度(JS 字符串是 UTF-16,但对 BMP 字符表现像 rune 计数)。两边不一致就会出 bug,比如限制“最多 10 个字符”的输入,在 Go 后端按 len() 检查,用户输 10 个 emoji 就可能超 HTTP body 限制。

  • 对外暴露长度限制时,明确文档写清是“Unicode 字符数”还是“UTF-8 字节数”
  • 做截断(如日志打点、数据库字段 truncation)必须统一标准:入库前用 utf8.RuneCountInString() 判断,截断用 []rune 转换后取前 N 个再转回 string
  • 别依赖 strings.RuneCount() —— 它只是 utf8.RuneCountInString() 的别名,名字有误导性

字符和字节的界限在 Go 里始终清晰,但一不留神就掉进默认按字节操作的惯性里。尤其是处理用户输入、国际化文本、协议头字段时,多看一眼 len()utf8.RuneCountInString() 的差别,比事后 debug 快得多。

好了,本文到此结束,带大家了解了《Golang获取字符串长度的实用方法》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!

转转官网链接及使用方法详解转转官网链接及使用方法详解
上一篇
转转官网链接及使用方法详解
Windows10任务栏图标修复教程
下一篇
Windows10任务栏图标修复教程
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    3089次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    2848次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    2796次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    3015次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    2964次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码