当前位置:首页 > 文章列表 > Golang > Go问答 > 优化 Go 中高精度计算的性能

优化 Go 中高精度计算的性能

来源:stackoverflow 2024-03-20 16:15:34 0浏览 收藏

为在 Go 中优化高精度计算,可以使用 int64 和字符串操作来代替 math/big。int64 方法比 float64 方法快约 25%,同时代码也更易于阅读。int64 版本还提供了比带浮点数的版本快 40% 的速度提升。

问题内容

注意! 最初的问题是因为我对 32 位系统上的 64 位类型感到困惑。结果我原来的代码失败了,因为我使用了 float32 作为一个应该是 float64 的值。该错误让我认为我无法在32位系统上使用float64。评论中很快就纠正了这一点。感谢@burakserdar 和@adrian。 为了不使评论无效,我将原来的问题留在了下面。

我已经重构了我的代码,并且有两个可行的替代方案。一种是基于@pakuula 发布的答案,使用 int64 和字符串操作。另一种是使用 float64。 float64 解决方案的执行时间提高了约 25%,但代码似乎更易于阅读。

在 raspberry pi3 上运行基准测试得出两种方法的结果如下:

benchmarkall/int64method-4            286648          3977 ns/op          32 b/op          3 allocs/op
benchmarkall/float64method-4          242878          5000 ns/op          24 b/op          2 allocs/op

float64方法

func float64method(msg []byte) string {
    payload := msg[6:]

    latfloat := float64(int32(binary.littleendian.uint32(payload[8:12])))
    precfloat := float64(int8(payload[24])) / 100

    latsum := (latfloat + precfloat) / 1e7
    return fmt.sprintf("%2.9f", latsum)
}

int64方法

func int64method(msg []byte) string {
    payload := msg[6:]

    rawlatuint32 := binary.littleendian.uint32(payload[8:12])
    rawlatint32 := int32(rawlatuint32)
    rawlatint64 := int64(rawlatint32)
    fixlat8 := int8(payload[24])
    
    highpreclat := rawlatint64*100 + int64(fixlat8)
    negative := (highpreclat < 0)
    sign := ""
    if negative {
        sign = "-"
        highpreclat = -highpreclat
    }

    latint := highpreclat / precision
    latfrac := highpreclat % precision
    return fmt.sprintf("%s%d.%09d", sign, latint, latfrac)
}

go 演示的工作示例:https://go.dev/play/p/cqo67gmdwgs

我正在寻找一种将 4 字节小端值直接转换为 int32 的方法。它似乎不存在于内置包中。

原帖 我正在使用 raspberry pi3(32 位)和 ublox m8 gps 接收器创建地形测量系统。 代码将用 go 编写。 (转到1.19.2)

ublox 接收器在字节消息中生成高精度 gps 位置。纬度和经度值均由 4 字节有符号整数 (i4) 和 1 字节有符号整数 (i1) 组成。字节值是 littleendian。

高精度坐标通过将 i4 和 i1 添加在一起,如下所示: 度 * 1e-7 = i4 + (i1 * 1e-2)

纬度/经度位置将显示为保留 9 位小数的度数,例如:纬度:48.944665243°,经度:-13.117730989°

这就是我因 go(和数学)知识有限而遇到问题的地方。 没有任何内置数据类型可以对这种大小的数字进行算术运算(我的系统是 32 位),因此我使用 math/big 来获得正确的结果。然而,数学/大似乎需要大量的处理能力。我让代码在 64 位系统上运行,我可以使用内置类型和字符串格式来获得正确的结果。使用 math/big 导致处理时间增加四倍。

我正在寻找有关如何改进这段代码的建议。我不知道是否有更好的方法可以在不使用数学/大的情况下做到这一点。另外我真的不知道我对 math/big 的使用是否正确。

latFloat := big.NewFloat(float64(int32(binary.LittleEndian.Uint32(payload[12:16]))))
    precFloat := big.NewFloat(float64(int8(payload[25])) / 100)
    latSum := big.NewFloat(0.0)
    latSum.Add(latSum, latFloat)
    latSum.Add(latSum, precFloat)
    multip := big.NewFloat(0.0000001)
    latSum.Mul(latSum, multip)
    h.Lat = fmt.Sprint(latSum.Text('f', 9))

go 演示中有一个可用的示例:https://go.dev/play/p/ean4ymqeuwo

此外,我想知道关于binary.littleendian解码的问题。有没有办法在不使用binary.littleendian 的uint32 方法的情况下执行此操作。似乎没有必要通过 uint32 到 int32 来获取正确的值。


正确答案


为什么不使用int64? go 运行时在 32 位平台上非常有效地支持它。

重新设计

这里是一个例子:https://go.dev/play/p/XRVKaGvNMrw

const precisionfactor = 1_000_000_000
// convert fixed-precision int to a string
func intstringwithprecision(val int64) string {
    negative := (val < 0)
    sign := ""
    if negative {
        sign = "-"
        val = -val
    }
    deg := val / precisionfactor
    frac := val % precisionfactor
    return fmt.sprintf("%s%d.%09d", sign, deg, frac)
}
// convert a float to a string with 9 digits after dot
func floatstringwithprecision(val float64) string {
    return fmt.sprintf("%0.9f", val)
}

// parse payload as a fixed-precision int
func getlatasint(payload []byte) int64 {
    rawlatuint32 := binary.littleendian.uint32(payload[12:16])
    rawlatint32 := int32(rawlatuint32)
    rawlatint64 := int64(rawlatint32)

    fixlat8 := int8(payload[25])

    return rawlatint64*100 + int64(fixlat8)
}

// parse payload as a float
func getlatasfloat(payload []byte) float64 {
    latfloat := float64(int32(binary.littleendian.uint32(payload[12:16])))
    precfloat := float64(int8(payload[25])) / 100

    return (latfloat + precfloat) / 1e7
}

诀窍是我们将 9 位精度保留在整数内,并通过 1e9 的整数等效项将 divmod 拆分为整数和小数部分。

输出是:

test(305419896, -112)
using integer: 30.541989488
using float:   30.541989488
test(100, -56)
using integer: 0.000009944
using float:   0.000009944
test(1, 2)
using integer: 0.000000102
using float:   0.000000102
test(-1, 2)
using integer: -0.000000098
using float:   -0.000000098
test(-10, 20)
using integer: -0.000000980
using float:   -0.000000980
test(-305419896, 9)
using integer: -30.541989591
using float:   -30.541989591

如您所见,结果是相同的

基准:https://go.dev/play/p/zdeqTQuDxmS

goos: linux
goarch: amd64
pkg: example.org
cpu: Intel(R) Core(TM) i7-7700 CPU @ 3.60GHz
BenchmarkInt-8                      985913821            1.219 ns/op           0 B/op          0 allocs/op
BenchmarkFloat-8                    616161028            1.990 ns/op           0 B/op          0 allocs/op
BenchmarkToStringInt-8               6727627           175.8 ns/op        24 B/op          2 allocs/op
BenchmarkToStringFloat-8             4459144           269.1 ns/op        24 B/op          2 allocs/op
BenchmarkToStringNegativeInt-8       5851466           204.7 ns/op        40 B/op          3 allocs/op
BenchmarkToStringNegativeFloat-8     4456899           271.2 ns/op        24 B/op          2 allocs/op

int64 版本比带浮点数的版本快 40%,int64 的 tostring 更快

当然,我的 cpu 是 64 位,管道中支持浮点,在 32 位纯整数 cpu 上结果会有所不同。仍然 int 应该优于 float 版本。

今天关于《优化 Go 中高精度计算的性能》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
什么是Linux Oops?解析错误信息什么是Linux Oops?解析错误信息
上一篇
什么是Linux Oops?解析错误信息
确定条码扫描仪(模拟 USB 键盘输入)的数据源
下一篇
确定条码扫描仪(模拟 USB 键盘输入)的数据源
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    15次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    24次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    30次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    40次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    35次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码