当前位置:首页 > 文章列表 > Golang > Go教程 > 在go中闻和验证的即时内容类型

在go中闻和验证的即时内容类型

2025-02-15 18:19:10 0浏览 收藏

有志者,事竟成!如果你在学习Golang,那么本文《在go中闻和验证的即时内容类型》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~

在go中闻和验证的即时内容类型

验证、消毒和安全地处理用户生成的内容是一个复杂且庞大的课题。本文仅关注其中一个方面:利用魔术字节嗅探用户上传内容的类型,并拒绝与验证规则不符的文件。

本文重点介绍:

  • 如何在不缓冲整个文件到内存的情况下嗅探内容类型
  • 如何编写简洁易用且可复用的代码

使用 http.DetectContentType

标准库中的 http.DetectContentType 函数正是我们需要的。文档描述如下:

根据 https://mimesniff.spec.whatwg.org/ 描述的算法确定给定数据的 MIME 类型。最多考虑前 512 字节的数据。DetectContentType 始终返回有效的 MIME 类型:如果无法确定更具体的 MIME 类型,则返回 "application/octet-stream"。

让我们看看如何在实践中使用它。考虑一个典型的文件上传处理程序,它将文件直接复制到 S3:

func handleUpload(w http.ResponseWriter, r *http.Request) {
    // 验证请求头
    // ...

    // 将请求体直接复制到 S3
    uploader := s3manager.NewUploader(sess)

    _, err := uploader.Upload(&s3manager.UploadInput{
        Bucket: aws.String("my-bucket"),
        Key:    aws.String("filename.jpg"),
        Body:   r.Body,
    })
    if err != nil {
        w.WriteHeader(500)
    }
}

如果我们手动使用 http.DetectContentType 只允许上传图像,代码如下。记住,我们不想缓冲整个文件到内存:

    // 读取请求体的前一部分
    var first512 [512]byte
    n, err := io.ReadFull(r.Body, first512[:])
    if err != nil && !errors.Is(err, io.ErrUnexpectedEOF) && !errors.Is(err, io.EOF) {
        w.WriteHeader(500)
        return
    }

    // 检测并验证内容类型
    contentType := http.DetectContentType(first512[:n])
    if !strings.HasPrefix(contentType, "image/") {
        w.WriteHeader(400)
        return
    }

    // 重新组合请求体
    reqBody := io.MultiReader(bytes.NewReader(first512[:n]), r.Body)

这种方法有几个缺点:

  • 代码冗长,易出错
  • 错误处理分散,难以维护
  • 需要在每个上传处理程序中重复此模式

让我们将此逻辑封装到一个可复用的组件中,该组件为我们处理复杂性。

我们需要什么?

让我们看看目标。我们想要一个自定义的读取器包装器——NewContentTypeReader,它会在读取正文时自动检测内容类型并调用用户提供的回调函数。回调函数将执行所有必要的验证,并可以选择返回错误。我们的 HTTP 处理程序如下所示:

var errNotImage = errors.New("not an image")

func handleUpload(w http.ResponseWriter, r *http.Request) {
    // 验证请求头
    // ...

    // 自定义读取器,用于检测和验证内容类型
    reqBody := NewContentTypeReader(r.Body, func(contentType string) error {
        if !strings.HasPrefix(contentType, "image/") {
            return errNotImage
        }
        return nil
    })

    // 将请求体直接复制到 S3
    uploader := s3manager.NewUploader(sess)

    _, err := uploader.Upload(&s3manager.UploadInput{
        Bucket: aws.String("my-bucket"),
        Key:    aws.String("filename.jpg"),
        Body:   reqBody,
    })
    if errors.Is(err, errNotImage) {
        // 捕获自定义读取器的错误
        w.WriteHeader(400)
        return
    }
    if err != nil {
        w.WriteHeader(500)
    }
}

如果请求体看起来不像图像,则任何尝试从 reqBody 读取的尝试都将失败。

实现读取器包装器

现在我们已经了解了如何使用包装器,让我们看看如何实现它。我们可以使用 io.MultiReader 使用与上述相同的方法,尽管在无法读取前 512 个字节的情况下,某些非致命错误(例如 I/O 超时)可能会导致并发症。相反,我们的包装器只代理所有读取调用,但也累积内部缓冲区,直到有足够的数据来调用 http.DetectContentType 函数。

type ctReader struct {
    buf     []byte
    reader  io.Reader
    handler func(contentType string) error
}

// NewContentTypeReader 返回一个读取器,它嗅探内容类型并将其传递给处理程序。
func NewContentTypeReader(r io.Reader, handler func(contentType string) error) io.Reader {
    return &ctReader{
        reader:  r,
        handler: handler,
    }
}

func (r *ctReader) Read(p []byte) (n int, err error) {
    n, err = r.reader.Read(p)

    if r.handler != nil {
        // 累积缓冲区
        r.buf = append(r.buf, p[:min(512, n)]...)

        // 缓冲区足够大或达到 EOF
        if len(r.buf) >= 512 || errors.Is(err, io.EOF) {
            contentType := http.DetectContentType(r.buf)
            if err2 := r.handler(contentType); err2 != nil {
                err = err2 // 替换原始错误
            }

            // 确保我们不再调用处理程序
            r.handler = nil
            r.buf = nil
        }
    }
    return
}

func min(a, b int) int {
    if a < b {
        return a
    }
    return b
}

结论

我们已经构建了一个可复用的文件上传内容类型检测解决方案:

  • 即时验证文件,无需完全缓冲到内存
  • 集成 Go 的 io.Reader 接口和标准库
  • 可与 Amazon S3 等云存储服务自然协作

魔术字节检测对于大多数常见的文件类型是可靠的,但记住它只是一层防御。对于生产系统,应将其与其他安全措施结合使用,例如文件大小限制、恶意软件扫描和正确的访问控制。

原文发表于 destel.dev

好了,本文到此结束,带大家了解了《在go中闻和验证的即时内容类型》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!

用于循环编号模式:用于循环编号模式:
上一篇
用于循环编号模式:
当今爪哇的序列化和5
下一篇
当今爪哇的序列化和5
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    3342次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    3094次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    3047次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    3255次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    3204次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码