当前位置:首页 > 文章列表 > Golang > Go问答 > `rand.intn` 函数的内部工作原理 - GoLang

`rand.intn` 函数的内部工作原理 - GoLang

来源:stackoverflow 2024-04-17 11:36:37 0浏览 收藏

学习知识要善于思考,思考,再思考!今天golang学习网小编就给大家带来《`rand.intn` 函数的内部工作原理 - GoLang》,以下内容主要包含等知识点,如果你正在学习或准备学习Golang,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!

问题内容

不知何故,我碰巧查看了 go 的源代码,了解它如何在传递数组长度时实现 random 函数。

这是调用代码

func randomformat() string {
    formats := []string{
        "hi, %v. welcome!",
        "great to see you, %v!",
        "hail, %v! well met!",
    }
    return formats[rand.intn(len(formats))]
}

go源代码:主要部分

func (r *rand) intn(n int) int {
    if n <= 0 {
        panic("invalid argument to intn")
    }
    if n <= 1<<31-1 {
        return int(r.int31n(int32(n)))
    }
    return int(r.int63n(int64(n)))
}

go 源代码:参考部分 - 大多数开发人员都已将其安装在他们的计算机或 go 存储库上。

// int31n returns, as an int32, a non-negative pseudo-random number in [0,n).
// it panics if n <= 0.
func (r *rand) int31n(n int32) int32 {
    if n <= 0 {
        panic("invalid argument to int31n")
    }
    if n&(n-1) == 0 { // n is power of two, can mask
        return r.int31() & (n - 1)
    }
    max := int32((1 << 31) - 1 - (1<<31)%uint32(n))
    v := r.int31()
    for v > max {
        v = r.int31()
    }
    return v % n
}
// it panics if n <= 0.
func (r *rand) int63n(n int64) int64 {
    if n <= 0 {
        panic("invalid argument to int63n")
    }
    if n&(n-1) == 0 { // n is power of two, can mask
        return r.int63() & (n - 1)
    }
    max := int64((1 << 63) - 1 - (1<<63)%uint64(n))
    v := r.int63()
    for v > max {
        v = r.int63()
    }
    return v % n
}
func (r *rand) int31() int32 { return int32(r.int63() >> 32) }
func (r *rand) int63() int64 { return r.src.int63() }

type source interface {
    int63() int64
    seed(seed int64)
}

我想了解随机函数如何封装所有内部函数。我对代码感到不知所措,如果有人必须用简单的英语来计划步骤,那会是什么?

例如,我不明白在 中执行负 1 的逻辑

if n <= 1<<31-1

然后,我没有得到 int31n 函数的任何头或脚

if n&(n-1) == 0 { // n is power of two, can mask
        return r.Int31() & (n - 1)
    }
    max := int32((1 << 31) - 1 - (1<<31)%uint32(n))
    v := r.Int31()
    for v > max {
        v = r.Int31()
    }
    return v % n

正确答案


这更像是一个关于算法的问题,而不是关于 go 的问题,但是有一些 go 的部分。无论如何,我都会从算法问题开始。

缩小均匀随机数生成器的范围

假设我们有一个均匀分布随机数生成器,它返回一个介于 0 和 7 之间的数字(包括 0 和 7)。也就是说,随着时间的推移,它将返回大约相同数量的 0、1、2、...、7,但它们之间没有明显的模式。

现在,如果我们想要一个 0 到 7 之间均匀分布的随机数,那么这个东西就完美了。这就是它返回的内容。我们只是使用它。但是如果我们想要一个 0 到 6 之间均匀分布的随机数怎么办?

我们可以这样写:

func randmod7() int {
    return generate() % 7
}

这样,如果 generate() 返回 7(有八分之一的机会这样做),我们将该值转换为零。但随后我们将在 8 次中获得 2 次归零,而不是在 8 次中获得 1 次。平均而言,我们将在 8 次中得到 1、2、3、4、5 和 6,并在 8 次中得到 2 次:每个实际零一次,每个 7 一次。

那么,我们需要做的是丢弃任何出现的 7:

func randmod7() int {
    for {
        if i := generate() < 7 {
            return i
        }
        // oops, got 7, try again
    }
}

现在,如果我们有一个名为 generate() 的统一随机数生成器,它返回 0 到 11(12 个可能值)之间的值,并且我们想要一个 0 到 3 之间的值(四个可能值) ),我们可以只使用 generate() % 4,因为 12 个可能的结果将以相同的概率分为 3 组,每组 4 个。如果我们想要一个介于 0 和 5 之间的值(包括 0 和 5),我们可以使用 generate() % 6,因为 12 个可能的结果将以相同的概率分为两组,每组 6 个。事实上,我们需要做的就是检查统一数生成器范围的质因数分解,看看哪些模起作用。 12的因数是2、2、3;所以 2、3、4 和 6 都在这里工作。任何其他模数(例如 generate() % 10)都会产生有偏差的结果:0 和 1 在 12 次中出现 2 次,但 2 到 9 在 12 次中出现 1 次。 (注意: generate() % 12 也有效,但有点毫无意义。)

在我们的特定情况下,我们有两个不同的均匀随机数生成器可用。其中之一是 int31(),生成 0 到 0x7fffffff(十进制 2147483647,或 231 - 1,或 1<<31 - 1)之间的值(含)。另一个 int63() 生成 0 到 0x7ffffffffffffffff 之间的值(9223372036854775807 或 263 - 1,或 1<<63 - 1)。这些范围分别包含 231 和 263 值,因此它们的质因数分解为 31 个 2 或 63 个 2。

这意味着我们可以计算 int31() mod 2k,对于 0 到 31 范围内的任何整数 k,而不会破坏我们的均匀性。使用 int63(),我们可以对 k 执行相同的操作,范围一直到 63。

介绍计算机

现在,从数学和计算机角度来说,给定 [0..0x7ffffff] 或 [0..0x7fffffffffffffff] 中的任何非负整数 n 和一个非负整数 k 在正确的范围内(分别不超过 31 或 63),计算整数 n mod 2k 产生 与计算该整数并使用 k 位集进行位掩码操作的结果相同。为了得到设置位数,我们需要使用 1< 并减去 1。如果 k 是 4,我们得到 1<<4 或 16。减去 1,我们得到 15 或 0xf,其中其中有四个 1 位。

所以:

n % (1 << k)

和:

n & (1<

产生相同的结果。具体来说,当k==4时,这是n%16n&0xf。当 k==5 时,这是 n%32n&0x1f。尝试 k==0k==63

go 语言简介

我们现在准备考虑在 go 中完成所有这些工作。我们注意到 int (简单、朴实的 int)保证能够分别保存 -2147483648 和 +2147483647(-0x80000000 到 +0x7fffffff)之间的值。它可能一直延伸到-0x8000000000000000到+0x7ffffffffffffff。

同时,int32 始终处理较小的范围,int64 始终处理较大的范围。普通的 int 是与其他两者不同的类型,但实现相同的范围作为两者之一。我们只是不知道是哪一个。

我们的 int31 实现返回 0..0x7ffffff 范围内的均匀分布随机数。 (它通过返回 r.int63() 的高 32 位来实现这一点,尽管这是一个实现细节。)我们的 int63 实现返回 0..0x7fffffffffffff 范围内的均匀分布的随机数。

此处显示的 intn 函数:

func (r *rand) intn(n int) int {
    if n <= 0 {
        panic("invalid argument to intn")
    }
    if n <= 1<<31-1 {
        return int(r.int31n(int32(n)))
    }
    return int(r.int63n(int64(n)))
}

仅根据 n 的值选择两个函数之一:如果它小于或等于 0x7fffffff (1<<31 - 1),则结果适合 int32,因此它使用 in t32(n)n 转换为int32,调用r.int31n,并将结果转换回int。否则,n 的值超过 0x7fffffff,这意味着 int 具有更大的范围,我们必须使用更大范围的生成器 r.int63n。除了类型之外,其余部分相同。

代码可以执行以下操作:

return int(r.int63n(int64(n)))

每次,但在 32 位机器上,64 位算术可能很慢,这可能会很慢。 (这里有很多可能可能,如果你今天自己写这篇文章,你应该从对代码进行分析/基准测试开始。go 作者做了 这样做,尽管这是很多年前的事了;在那个时候 做这些奇特的事情是值得的。)

更多位操作

函数 int31nint63n 的内部非常相似;主要区别在于所涉及的类型,以及在一些地方的最大值。同样,造成这种情况的原因至少部分是历史性的:在某些(大多数是现在较旧的)计算机上,int63n 变体比 int32n 变体慢得多。 (在某些非 go 语言中,我们可能将它们编写为泛型,然后让编译器自动生成特定于类型的版本。)因此,让我们看看 int63 变体:

func (r *rand) int63n(n int64) int64 {
    if n <= 0 {
        panic("invalid argument to int63n")
    }
    if n&(n-1) == 0 { // n is power of two, can mask
        return r.int63() & (n - 1)
    }
    max := int64((1 << 63) - 1 - (1<<63)%uint64(n))
    v := r.int63()
    for v > max {
        v = r.int63()
    }
    return v % n
}

参数 n 的类型为 int64,因此其值不会超过 263-1 或 0x7ffffffffffffff 或 9223372036854775807。但它可能为负数,负值将无法正常工作,因此我们做的第一件事就是测试这一点,如果是的话就恐慌。如果输入为零,我们也会感到恐慌(这是一个选择,但现在记下它很有用)。

接下来我们进行 n&(n-1) == 0 测试。这是对 2 的幂的测试,有一个小缺陷,它适用于多种语言(具有位掩码的语言):

  • 在数字的二进制表示形式中,2 的幂始终表示为单个设置位。例如,2本身是000000012,4是000000102,8是000001002,依此类推,直到128是100000002。 (因为我只“绘制”了 8 位,所以该系列的最大位数为 128。)

  • 从该数字中减去 1 会导致借位:该位变为零,所有较小的位都变为 1。例如,100000002 - 1 是 011111112.

  • 如果最初只设置了单个位,则将这两个值进行“与”运算会产生零。如果不是,例如,如果我们最初的值是 130 或 100000102,减去 1 会得到 100000012 - top 位,因此最高位在两个输入中都被设置,因此在 and 运算结果中也被设置。

稍有缺陷的是,如果初始值为零,则我们有 0-1,它会产生全 1; 0&0xffffffffffffffff 也为零,但零不是 2 的整数次幂。 (20 是 1,而不是 0。)这个小缺陷对于我们的目的来说并不重要,因为我们已经确保对这种情况感到恐慌:它只是不会发生。

现在我们有了最复杂的一行:

    max := int64((1 << 63) - 1 - (1<<63)%uint64(n))

这里重复出现 63 是因为我们的值范围从 0 到 263-1。 1<<63 - 1 是(仍然、再次、始终)9223372036854775807 或 0x7fffffffffffffff。同时,1<<63,如果不减1,则为9223372036854775808或0x8000000000000000此值不适合 int64,但它确实适合 uint64。因此,如果我们将 n 转换为 uint64,我们可以计算 uint64(9223372036854775808) % uint64(n),这就是 % 表达式的作用。通过使用 uint64 进行此计算,我们确保它不会溢出。

但是:这个计算到底是为了什么呢?好吧,回到我们的例子,使用 generate() 生成 [0..7] 中的值。当我们想要 [0..5] 中的数字时,我们必须丢弃 6 和 7。这就是我们在这里要做的:我们想要找到高于该值的值 >丢弃值。

如果我们取 8%6,我们会得到 2。8 比我们的 3 位 generate() 生成的最大值大 1。 8%6 == 2 是我们必须丢弃的“高值”的数量:8-2 = 6 并且我们要丢弃 6 或更多的值。减去 1,我们得到 7-2 = 5;我们可以接受此输入范围内的数字,从 0 到 5(含)。

因此,这种用于设置 max 的有点奇特的计算只是找出我们喜欢最大值的一种方法。大于 max 的值需要被丢弃。

即使 n 远小于我们的生成器返回值,这种特殊的计算也能很好地工作。例如,假设我们有一个四位生成器,返回 [0..15] 范围内的值,并且我们想要 [0..2] 内的数字。因此,我们的 n 是 3(表示我们想要 [0..2] 中的数字)。我们计算 16%3 得到 1。然后我们取 15(比我们的最大输出值小一)- 1 得到 14 作为我们的最大可接受值。也就是说,我们允许 [0..14] 中的数字,但排除 15。

如果 63 位生成器返回 [0..9223372036854775807] 中的值,并且 n==3,我们会将 max 设置为 9223372036854775805。这就是我们想要的:它抛出两个偏置值 9223372036854775806 和 922337203685477 5807.

代码的其余部分只是这样做:

    v := r.Int63()
    for v > max {
        v = r.Int63()
    }
    return v % n

我们选择一个 int63 范围数字。如果它超过 max,我们选择另一个并再次检查,直到我们选择一个在 [0..max] 范围内的值,包括 max

一旦我们得到一个在范围内的数字,我们就可以根据需要使用 % n 缩小范围。例如,如果范围是 [0..2],我们使用 v % 3。如果 v 为(比如说)14,则 14%3 为 2。我们的实际最大值再次为 9223372036854775805,无论 v 是什么,在 0 和该值之间,v%3 都在 0 和 2 之间,并且保持均匀分布,没有轻微偏差为 0 和 1(9223372036854775806 将为我们提供一个额外的 0,而 9223372036854775807 将为我们提供一个额外的 1)。

(现在对 int32321<<32 重复上述操作,以获取 int31 函数。)

以上就是《`rand.intn` 函数的内部工作原理 - GoLang》的详细内容,更多关于的资料请关注golang学习网公众号!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
叮咚买菜第四季度营收 49.9 亿元,经调净利润 1630 万元叮咚买菜第四季度营收 49.9 亿元,经调净利润 1630 万元
上一篇
叮咚买菜第四季度营收 49.9 亿元,经调净利润 1630 万元
如何解决Windows 10系统中控制面板打开为空白页面的问题
下一篇
如何解决Windows 10系统中控制面板打开为空白页面的问题
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    9次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    9次使用
  • AI音乐实验室:一站式AI音乐创作平台,助力音乐创作
    AI音乐实验室
    AI音乐实验室(https://www.aimusiclab.cn/)是一款专注于AI音乐创作的平台,提供从作曲到分轨的全流程工具,降低音乐创作门槛。免费与付费结合,适用于音乐爱好者、独立音乐人及内容创作者,助力提升创作效率。
    9次使用
  • SEO标题PixPro:AI驱动网页端图像处理平台,提升效率的终极解决方案
    PixPro
    SEO摘要PixPro是一款专注于网页端AI图像处理的平台,提供高效、多功能的图像处理解决方案。通过AI擦除、扩图、抠图、裁切和压缩等功能,PixPro帮助开发者和企业实现“上传即处理”的智能化升级,适用于电商、社交媒体等高频图像处理场景。了解更多PixPro的核心功能和应用案例,提升您的图像处理效率。
    9次使用
  • EasyMusic.ai:零门槛AI音乐生成平台,专业级输出助力全场景创作
    EasyMusic
    EasyMusic.ai是一款面向全场景音乐创作需求的AI音乐生成平台,提供“零门槛创作 专业级输出”的服务。无论你是内容创作者、音乐人、游戏开发者还是教育工作者,都能通过EasyMusic.ai快速生成高品质音乐,满足短视频、游戏、广告、教育等多元需求。平台支持一键生成与深度定制,积累了超10万创作者,生成超100万首音乐作品,用户满意度达99%。
    12次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码