当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 计算机视觉之图片分类

计算机视觉之图片分类

来源:51CTO.COM 2023-04-17 16:41:12 0浏览 收藏
推广推荐
免费电影APP ➜
支持 PC / 移动端,安全直达

珍惜时间,勤奋学习!今天给大家带来《计算机视觉之图片分类》,正文内容主要涉及到等等,如果你正在学习科技周边,或者是对科技周边有疑问,欢迎大家关注我!后面我会持续更新相关内容的,希望都能帮到正在学习的大家!

本文转载自微信公众号「 AI源起」,作者北上。转载本文请联系AI源起公众号。

你会分辨数字吗?

说起AI,大家心里想到的一定是如“流浪地球2”中的MOSS一样的带有智慧的硬件生物,仿佛无所不知、无所不能,只要给他Internet就会像复联2中的奥创一样,利用网络把自身传播的无处不在,总想着消灭人类达到“世界和平”的计划。

图片

然而实际来说,现阶段的AI离大家在影视作品中感受和体会到的,还有相当大的差距,今天就拿图片数字识别为例,一起探索下AI到底是以一种什么形式实际存在的。文章会以一些关键问题为索引,带你一步步理解。Follow me, let’s go ~

这是一张带有数字的图片,相信你一定是看到后立刻就能反应过来,这是一张带有数字“3”的图片(即便它比较模糊)。

图片

第一个问题:真正的智慧体——你为什么能清楚的知道这是数字“3”?这背后代表了什么?

当你看向这张图片,你的眼睛通过光反射在视网膜上将光学信号转换为大脑能识别的生物信号,并将这部分信息暂存(仅辅助理解,实际并不是?)在了你的视网膜上。大脑接受到信号后,通过你聪明的小脑袋迅速认识到这是一个数字“3”,此时你已经对这张图片完全理解了,它就是一张“3”。当然,这一切的基础上,是你从小被教育过,这种形状的数字「等价于」数字3,而不是5、6等其他数字。

图片

第二个问题:眼睛、视网膜——计算机对于实体世界的认知是通过什么形式输入的?

计算机和AI什么关系呢?我们可以简单理解为AI是需要计算机的算力和体系结构一种伪智慧能力,就好比我们自身带有智慧和生命,但是其实本质上就是碳基生物。众所周知,计算机世界里是二进制世界,何谓二进制,简单来说就是非0即1。我知道你此时肯定有疑惑,就靠非0即1的二进制,就能实现这么多功能,有这么强大的算力吗?但先别急,这里需要明确一个概念,就是二进制可以表示任何进制的数字(可以先认为是对的,具体为什么需要的话,咱们后续再聊),比如我们常用的十进制下数字13,在二进制下是 1101,想仔细学习的小伙伴可以看下面图片的解释。

图片

因此我们能明确出,对于一个数字,计算机都能够通过二进制来“理解”。如果图片能够转化成一串数字,计算机是不是就能从一个只知道0和1的呆瓜,变成可以将图片进行信息输入(理解不理解先搁一边,就像孩子长个总得先会吃饭)。如下图,图片每个小区域可以认为是一个像素,一个像素点就代表了一种颜色,那又要众所周知了,任何一种颜色都能通过红色(Red)、绿色(Green)、蓝色(Blue)的不同配比调制出来,那我们按照从左到右,从上到下的顺序,就能形成一个数字列表,那把这些内容送给计算机。

图片

到这一步,不管计算机理解与否,我们已经将图片转换为了计算机能够接受的信号,那计算机的大脑是怎么识别图片中的数字是“3”呢

第三个问题:所谓的AI——计算机应该如何判断这张图片中的数字是“3”

给计算机这样两张图片,它能告诉你左边这张图片是数字“3”,你认为他是具有人工智能吗?你可能觉得这也太naive了,这3岁小孩都知道。但是如果像右图是1万张蓝脚鲣鸟等稀奇鸟类的图片,计算机只用了几秒钟就能以99%的准确率一字不差的判断出来各种稀奇生物,那是不是就有点AI那味了?

图片

传统识别方法——具体来说,我们已经能够将图片转换为数字矩阵了,传统的图片识别方法会将对图片中的特征进行抽取,比如会利用一些硬规则当做特征。对于数字“3”,在我们人脑中一看到这个形状,就下意识反应出来这是“3”,但是对于计算机他是一串数字呀。所以早期在做类似图片分类任务的时候,工程师需要对数字“3”映射下的数字序列进行处理,这可真令人头大。所以如何做特征就是在传统图片识别分类中,一个至关重要,但是极其繁琐的过程。

传统识别方法优势在于,当识别结果出错时候,你可以通过显示特征大致判断错误原因,弊端在于特征工程繁琐。那有没有这样一种方法,可以弱化特征工程(虽然后面很多任务,特征工程也极其重要),给一种端到端的解决方案。所谓端到端,就是我只需要给一张数字图片,和它的分类结果,让计算机自己学习出识别的解决方案(是不是有点像人类的学习思路了)。这里经过时代变迁和计算机的算力大幅提升,基于神经网络的深度学习算法逐渐有了用武之地。

图片

深度神经网络识别方法——这几个字很深奥,不学计算机不搞算法的可能直接被唬住了,我用一句话翻译翻译什么叫深度神经网络(狗头.jpg):输入数据和指定标签之间存在某种非线性的关联,神经网络就是通过多个非线性函数去近似拟合上述的非线性关联。如下图,就是一个简单的深度神经网络,最左侧的图片(字母“A”),右侧呢就是将图片转换为数字后,进行“智能”运算的结构体,可以理解为“大脑”。

图片

本篇关于《计算机视觉之图片分类》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
边缘人工智能:部署前需要考虑的三个技巧边缘人工智能:部署前需要考虑的三个技巧
上一篇
边缘人工智能:部署前需要考虑的三个技巧
人工智能简化业务流程的四种方式
下一篇
人工智能简化业务流程的四种方式
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3214次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3429次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3458次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4567次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3835次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码