在 Go 中将元数据从一个 JPEG 复制到另一个
目前golang学习网上已经有很多关于Golang的文章了,自己在初次阅读这些文章中,也见识到了很多学习思路;那么本文《在 Go 中将元数据从一个 JPEG 复制到另一个》,也希望能帮助到大家,如果阅读完后真的对你学习Golang有帮助,欢迎动动手指,评论留言并分享~
我正在尝试将 exif 标签从一个 jpeg 复制到另一个没有元数据的 jpeg 中。我尝试按照此评论中的描述进行操作。
我的想法是复制标签源文件中的所有内容,直到排除第一个 ffdb
为止,然后从包含的第一个 ffdb
开始复制图像源文件(没有标签)中的所有内容。生成的文件已损坏(缺少 sos 标记)。
完整的重现器,包括 luatic 的建议,可在 https://go.dev/play/p/9bljuzk5qlr 上找到。只需在包含带有标签的 test.jpg 文件的目录中运行它即可。
这是执行此操作的 go 代码草案。
func copyExif(from, to string) error { os.Rename(to, to+"~") //defer os.Remove(to + "~") tagsSrc, err := os.Open(from) if err != nil { return err } defer tagsSrc.Close() imageSrc, err := os.Open(to + "~") if err != nil { return err } defer imageSrc.Close() dest, err := os.Create(to) if err != nil { return err } defer dest.Close() // copy from tagsSrc until ffdb, excluded buf := make([]byte, 1000000) n, err := tagsSrc.Read(buf) if err != nil { return err } x := 0 for i := 0; i < n-1; i++ { if buf[i] == 0xff && buf[i+1] == 0xdb { x = i break } } _, err = dest.Write(buf[:x]) if err != nil { return err } // skip ffd8 from imageSrc, then copy the rest (there are no tags here) skip := []byte{0, 0} _, err = imageSrc.Read(skip) if err != nil { return err } _, err = io.Copy(dest, imageSrc) if err != nil { return err } return nil }
检查结果文件,代码似乎执行了我之前描述的操作。
左上角是标签的来源。左下角是图像来源。右边是结果。
有人知道我错过了什么吗?谢谢。
正确答案
事实证明这比预想的要困难。我参考了 this resource,它解释了 jpeg 作为段流的一般结构,唯一的例外是保存实际图像数据的“熵编码段”(ecs)。
您的方法存在问题
我的想法是复制标签源文件中的所有内容,直到排除第一个 ffdb
为止,然后从包含的第一个 ffdb
开始复制图像源文件(没有标签)中的所有内容。生成的文件已损坏(缺少 sos 标记)。
这对 jpeg 文件做出了非常强烈的假设,但这是不成立的。首先,ffdb
很可能出现在段内的某个位置。段的顺序也非常松散,因此您无法保证 ffdb
(定义量化表的段)之前或之后的内容。即使它在大多数情况下确实有效,它仍然是一个非常脆弱、不可靠的解决方案。
正确的方法
正确的方法是迭代所有片段,仅从提供元数据的文件中复制元数据片段,并且仅从提供图像数据的文件中复制非元数据片段。
使事情变得复杂的是,由于某种原因,ecs 不遵循段约定。因此,在读取 sos(扫描开始)后,我们需要通过查找下一个段标记跳到 ecs 的末尾: 0xff
后跟一个既不是数据(零)也不是“重新启动标记”的字节(0xd0
- 0xd7
)。
为了进行测试,我使用了 this image with EXIF metadata。我的测试命令如下所示:
cp exif.jpg exif_stripped.jpg && exiftool -all= exif_stripped.jpg && go run main.go exif.jpg exif_stripped.jpg
我使用exiftool
剥离exif元数据,然后通过读取它来测试go程序。然后,我使用 exiftool exif_stripped.jpg
(或您选择的图像查看器)查看元数据,并与 exiftool exif.jpg
的输出进行比较(旁注:您可能可以通过使用 exiftool
完全废弃这个 go 程序)。
我编写的程序替换了 exif 元数据、注释和版权声明。我添加了一个简单的命令行界面用于测试。如果您只想保留 exif 元数据,只需将 ismetatagtype
函数更改为
func ismetatagtype(tagtype byte) bool { return tagtype == exif }
完整程序
package main import ( "os" "io" "bufio" "errors" ) const ( soi = 0xD8 eoi = 0xD9 sos = 0xDA exif = 0xE1 copyright = 0xEE comment = 0xFE ) func isMetaTagType(tagType byte) bool { // Adapt as needed return tagType == exif || tagType == copyright || tagType == comment } func copySegments(dst *bufio.Writer, src *bufio.Reader, filterSegment func(tagType byte) bool) error { var buf [2]byte _, err := io.ReadFull(src, buf[:]) if err != nil { return err } if buf != [2]byte{0xFF, soi} { return errors.New("expected SOI") } for { _, err := io.ReadFull(src, buf[:]) if err != nil { return err } if buf[0] != 0xFF { return errors.New("invalid tag type") } if buf[1] == eoi { // Hacky way to check for EOF n, err := src.Read(buf[:1]) if err != nil && err != io.EOF { return err } if n > 0 { return errors.New("EOF expected after EOI") } return nil } sos := buf[1] == 0xDA filter := filterSegment(buf[1]) if filter { _, err = dst.Write(buf[:]) if err != nil { return err } } _, err = io.ReadFull(src, buf[:]) if err != nil { return err } if filter { _, err = dst.Write(buf[:]) if err != nil { return err } } // Note: Includes the length, but not the tag, so subtract 2 tagLength := ((uint16(buf[0]) << 8) | uint16(buf[1])) - 2 if filter { _, err = io.CopyN(dst, src, int64(tagLength)) } else { _, err = src.Discard(int(tagLength)) } if err != nil { return err } if sos { // Find next tag `FF xx` in the stream where `xx != 0` to skip ECS // See https://stackoverflow.com/questions/2467137/parsing-jpeg-file-format-format-of-entropy-coded-segments-ecs for { bytes, err := src.Peek(2) if err != nil { return err } if bytes[0] == 0xFF { data, rstMrk := bytes[1] == 0, bytes[1] >= 0xD0 && bytes[1] <= 0xD7 if !data && !rstMrk { break } } if filter { err = dst.WriteByte(bytes[0]) if err != nil { return err } } _, err = src.Discard(1) if err != nil { return err } } } } } func copyMetadata(outImagePath, imagePath, metadataImagePath string) error { outFile, err := os.Create(outImagePath) if err != nil { return err } defer outFile.Close() writer := bufio.NewWriter(outFile) imageFile, err := os.Open(imagePath) if err != nil { return err } defer imageFile.Close() imageReader := bufio.NewReader(imageFile) metaFile, err := os.Open(metadataImagePath) if err != nil { return err } defer metaFile.Close() metaReader := bufio.NewReader(metaFile) _, err = writer.Write([]byte{0xFF, soi}) if err != nil { return err } { // Copy metadata segments // It seems that they need to come first! err = copySegments(writer, metaReader, isMetaTagType) if err != nil { return err } // Copy all non-metadata segments err = copySegments(writer, imageReader, func(tagType byte) bool { return !isMetaTagType(tagType) }) if err != nil { return err } } _, err = writer.Write([]byte{0xFF, eoi}) if err != nil { return err } // Flush the writer, otherwise the last couple buffered writes (including the EOI) won't get written! return writer.Flush() } func replaceMetadata(toPath, fromPath string) error { copyPath := toPath + "~" err := os.Rename(toPath, copyPath) if err != nil { return err } defer os.Remove(copyPath) return copyMetadata(toPath, copyPath, fromPath) } func main() { if len(os.Args) < 3 { println("args: FROM TO") return } err := replaceMetadata(os.Args[2], os.Args[1]) if err != nil { println("replacing metadata failed: " + err.Error()) } }
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于Golang的相关知识,也可关注golang学习网公众号。

- 上一篇
- 如何在 Go 中强制从 Shell 进行垃圾回收

- 下一篇
- linux中间件的含义是什么
-
- Golang · Go问答 | 1年前 |
- 在读取缓冲通道中的内容之前退出
- 139浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 戈兰岛的全球 GOPRIVATE 设置
- 204浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何将结构作为参数传递给 xml-rpc
- 325浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何用golang获得小数点以下两位长度?
- 477浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何通过 client-go 和 golang 检索 Kubernetes 指标
- 486浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 将多个“参数”映射到单个可变参数的习惯用法
- 439浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 将 HTTP 响应正文写入文件后出现 EOF 错误
- 357浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 结构中映射的匿名列表的“复合文字中缺少类型”
- 352浏览 收藏
-
- Golang · Go问答 | 1年前 |
- NATS Jetstream 的性能
- 101浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何将复杂的字符串输入转换为mapstring?
- 440浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 相当于GoLang中Java将Object作为方法参数传递
- 212浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何确保所有 goroutine 在没有 time.Sleep 的情况下终止?
- 143浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 16次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 13次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 12次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 16次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 17次使用
-
- GoLand调式动态执行代码
- 2023-01-13 502浏览
-
- 用Nginx反向代理部署go写的网站。
- 2023-01-17 502浏览
-
- Golang取得代码运行时间的问题
- 2023-02-24 501浏览
-
- 请问 go 代码如何实现在代码改动后不需要Ctrl+c,然后重新 go run *.go 文件?
- 2023-01-08 501浏览
-
- 如何从同一个 io.Reader 读取多次
- 2023-04-11 501浏览