当前位置:首页 > 文章列表 > Golang > Go教程 > Go unique 实战:别再用全局 map 硬做字符串去重

Go unique 实战:别再用全局 map 硬做字符串去重

来源:Go 官方博客 2026-06-02 10:14:08 0浏览 收藏

很多 Go 项目跑久了以后,内存里会堆出一堆“看起来一样、实际重复存了很多份”的值:配置里的环境名、日志标签、租户 ID、IP zone、用户角色、路由名、状态枚举。单个字符串不大,但乘上千万对象,就会变成很扎眼的内存账单。

以前我们常见的办法是手写一个全局 map,把相同字符串复用起来。思路没错,但很快会遇到锁竞争、生命周期不好管、只能处理 string、回收困难这些问题。Go 标准库里的 unique 包,就是为“值规范化”这类事情准备的。今天这篇不吹新特性,只讲它适合放在哪、怎么用、哪里别用。

Go unique 包思维导图
思维导图:unique 的关键词不是缓存,而是值规范化、句柄比较和可回收的去重。

先把 unique 说成人话

unique.Make(v) 会返回一个 unique.Handle[T]。如果两个值相等,后面拿到的 handle 也会指向同一个规范化值。你可以通过 h.Value() 取回原值,也可以直接比较两个 handle。

它最核心的价值有两个:第一,重复值只保留一份规范化存储,能降低某些场景的内存占用;第二,比较 handle 比比较一大段结构体或长字符串更便宜,尤其是同一批重复值反复比较时。

package main

import "unique"

type Label struct {
    Key string
    Val string
}

func main() {
    h1 := unique.Make(Label{Key: "env", Val: "prod"})
    h2 := unique.Make(Label{Key: "env", Val: "prod"})

    // 相等值会得到可直接比较的 handle
    println(h1 == h2)
}

它不是万能缓存

这点一定要先讲清楚:unique 不是用来替代 Redis、本地 LRU、业务对象缓存的。它不会帮你设置过期时间,不会帮你限制容量,也不会帮你承载“查不到就加载数据库”的逻辑。

它处理的是可比较类型的“规范化值”。也就是说,你已经有一个值了,想把大量重复值压成一份,并且后面用 handle 做更便宜的比较。这跟缓存的读穿透、淘汰策略、热点保护不是一个问题。

手写全局 map 为什么容易翻车

不少项目会写一个类似 map[string]string 的池子,外面包一把锁,进来一个字符串就查一下,有就返回已有的,没有就塞进去。小数据量当然没毛病,但生产环境里问题会慢慢出来。

第一,锁竞争。高并发写入或大量规范化时,所有请求都抢同一把锁。第二,生命周期。你塞进 map 的值通常不会自动回收,除非自己实现引用计数或清理策略。第三,类型受限。今天池 string,明天又想池结构体,很容易复制出一堆差不多的工具。

Go unique 和手写全局 map 对比图
对比图:手写全局 map 最大的问题不是写不出来,而是并发、回收和泛型场景都会变复杂。

一个更贴近业务的例子:标签规范化

假设你有一个指标采集服务,每条样本都有一组标签。标签本身重复度极高,比如 env=prodregion=apservice=api。如果每条样本都复制一份完整标签,内存会很快膨胀。

这时可以把标签规范化成 handle,业务对象里只存 handle。真正需要输出或序列化时,再通过 Value() 取回原值。

type Label struct {
    Key string
    Val string
}

type Sample struct {
    Name   string
    Labels []unique.Handle[Label]
}

func internLabels(labels []Label) []unique.Handle[Label] {
    out := make([]unique.Handle[Label], 0, len(labels))
    for _, label := range labels {
        out = append(out, unique.Make(label))
    }
    return out
}

Handle 比较很适合做快速路径

如果两个业务对象里保存的是 unique.Handle[Label],比较时就不需要反复比较 KeyVal。handle 本身是可比较的,等价判断可以直接走 h1 == h2

这在“重复值多、比较频繁”的场景比较香。比如权限标签、配置项、路由元数据、指标维度、解析后的枚举状态。重点是两个条件都要满足:重复值多,比较频繁。只有一个条件满足,收益可能没你想象的大。

Go unique 代码审查案例图
代码案例图:把手写池替换成 unique,不只是少写 map,更是少维护锁、回收和类型扩展。

GC 回收这点很重要

手写全局 map 最大的隐患,是池子通常只涨不降。unique 的设计里,规范化值在没有 handle 引用后可以被回收,这让它更适合“值会重复,但集合不是永远固定”的系统。

当然,这不代表你可以随便把百万级高基数值都丢进去。比如用户输入的随机 token、请求 ID、一次性 UUID,这类值本来就不重复,放进 unique 反而会增加管理成本。低重复、高基数,是它不太适合的典型场景。

哪些类型可以用

unique 支持的是可比较类型,也就是泛型参数 T 要满足 comparable。字符串、数字、枚举、小结构体通常没问题;包含 slice、map、function 的结构体就不行。

这也是一个很好的提醒:如果你的对象很大、字段里还有很多不可比较内容,先别急着塞进 unique。更合理的做法是抽出真正重复、稳定、可比较的那一小块。

什么时候我会用 unique

第一类是配置和元数据。比如环境名、区域、机房、服务名、路由名,这些值重复度高,而且生命周期跟服务对象绑定。第二类是解析后的结构体。比如把文本配置解析成小结构体后,很多对象会共享同一组结果。

第三类是比较热点。比如你经常判断两个对象是否属于同一类标签、同一份策略、同一个小配置,handle 比较会让代码更干净。第四类是内存 profile 已经证明重复值占比较高的场景。注意这个顺序:先 profile,再优化。

什么时候别用

不要拿它处理一次性值,不要拿它替代业务缓存,不要为了“看起来高级”把所有字符串都包一层。尤其是请求 ID、trace ID、随机 token、用户输入搜索词,这些值重复率低,规范化意义不大。

也不要在还没看到内存问题时就把代码写复杂。unique.Handle[T] 是一种抽象,抽象就有理解成本。只有当它能明确减少重复值、简化比较或降低内存压力时,才值得引入。

我自己的 review 清单

  • 这个值的重复率够高吗?有没有用 profile 或统计证明?
  • 这个类型是否真的稳定、可比较、适合规范化?
  • 业务需要的是值规范化,还是带过期策略的缓存?
  • handle 保存在哪里?生命周期是否跟业务对象一致?
  • 是否避免把请求 ID、随机 token 这类高基数值放进去?
  • 替换后代码是否比手写全局 map 更清楚,而不是更绕?

最后聊两句

unique 这个包我挺喜欢,因为它解决的是一个很具体的工程问题:重复值太多、手写池太粗糙、比较又想更便宜。但它不是那种“所有项目都应该立刻用”的工具。

我的建议还是老规矩:先用内存 profile 找到重复值,再选一块小而稳定的类型试用。看得见收益,再推广。Go 的好工具很多,真正厉害的是知道把它放在刚好合适的位置。

参考资料:Go 官方博客:New unique packageunique 官方文档

版本声明
本文转载于:Go 官方博客 如有侵犯,请联系study_golang@163.com删除
Go FIPS 140-3 实战:别把合规开关当成一行环境变量Go FIPS 140-3 实战:别把合规开关当成一行环境变量
上一篇
Go FIPS 140-3 实战:别把合规开关当成一行环境变量
Go rand/v2 实战:抽奖、灰度和测试随机数别再混着用
下一篇
Go rand/v2 实战:抽奖、灰度和测试随机数别再混着用
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    5903次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    6332次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    6141次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    8116次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    6620次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码