当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > TensorFlow应用技术拓展—图像分类

TensorFlow应用技术拓展—图像分类

来源:51CTO.COM 2023-04-28 19:22:49 0浏览 收藏

怎么入门科技周边编程?需要学习哪些知识点?这是新手们刚接触编程时常见的问题;下面golang学习网就来给大家整理分享一些知识点,希望能够给初学者一些帮助。本篇文章就来介绍《TensorFlow应用技术拓展—图像分类》,涉及到,有需要的可以收藏一下

1.科研平台环境部署操作拓展

针对于机器学习中的模型训练,本人推荐大家多学习TensorFlow官方的课程或资源,比如中国大学MOOC上的两门课程​《 TensorFlow 入门实操课程 》​​和​《 TensorFlow 入门课程 - 部署篇 》​​。科研或者工作过程中涉及的模型分布式训练,可能一个资源平台往往会非常耗时,无法及时满足个人需求。在这里,我将就上一篇​​《初步了解TensorFlow框架学习》​​提到的九天毕昇平台的使用进行一个具体的拓展,来方便学生和用户来更快捷地进行模型训练。该平台可以进行数据管理,模型训练等任务,是一个方便快捷的科研任务实践平台。在模型训练中具体操作步骤为:

(1)注册并登录九天毕昇平台,由于后续训练任务需消耗算力豆,而新用户的算力豆数量有限,但可以通过分享好友等任务来完成算力豆的获取。同时针对大型模型训练任务,为获取更多的模型训练存储空间,可邮件方式联系该平台的工作人员进行了控制台的升级,从而达到了日后所需的训练存储要求。存储和算力豆详情如下图:

TensorFlow应用技术拓展—图像分类

(2)进入数据管理界面部署科研项目模型使用的数据集,通过将科研任务所需的数据集进行打包上传,完成模型训练所需数据集在该平台上的部署。

TensorFlow应用技术拓展—图像分类

(3)在模型训练窗口新增项目训练实例,选择之前导入的数据集和所需的CPU资源。创建后的实例即为科研所需要训练的单个模型文件。新增项目实例的详情如下图所示:

TensorFlow应用技术拓展—图像分类

TensorFlow应用技术拓展—图像分类

(4)运行新增的项目实例,即运行项目训练环境,运行成功后,则可以选择jupyter编辑器创建和编辑所需的代码文件。

TensorFlow应用技术拓展—图像分类

TensorFlow应用技术拓展—图像分类

(5)后续代码编写和模型训练即可使用jupyter编辑器进行操作即可。

2. 图像分类技术拓展

图像分类,顾名思义就是根据图像之间差异性来对不同图像进行类别判断。而针对图像之间地差异性去设计判别模型就是机器学习中需要去掌握的知识。图像分类的基本知识和操作过程可以参考中国大学MOOC上的《TensorFlow入门实操课程》,快速了解TensorFlow基础应用与设计思路。。​https://www.icourse163.org/learn/youdao-1460578162?tid=1461280442#/learn/content?type=detail&id=1239107268&cid=1260057739

本章主要是想通过拓展图像分类技术来让接触该课程的用户更加深入地理解图像分类。

2.1 卷积操作有什么用?

说到对图像进行处理或者分类,必然绕不开一个操作,这个操作就是卷积。具体的卷积操作通过学习视频基本都能了解,但是更多的读者可能也只是停留在会如何进行卷积操作的程度上,而对于为什么去进行卷积,卷积操作有什么用这些仍然是一知半解。这里为大家进行一定拓展来帮助大家更好理解卷积。

基本的卷积过程下图所示,以图像为例,使用一个矩阵来表示图像,矩阵的每个元素即为图像中对应的像素值。卷积操作就是通过将卷积核逐乘对应的矩阵,从而得到这些小区域的特征值。而提取到的特征会因为卷积核的不同而有所差异,这也是后续会有人对图像不同通道进行卷积操作来获取图像不同通道的特征,来更好地进行后续分类任务。

TensorFlow应用技术拓展—图像分类

在日常地模型训练中,具体地卷积核并不需要进行人工设计,而是通过给定图像的真实标签,使用网络来自动训练出来的,但是这样的过程不利于人们去理解卷积核和卷积过程,或者说不直观。因此为了帮助大家更好理解卷积操作的意义,在这举一个卷积操作的例子。如下图矩阵所示,数值表示图形的像素,为了方便计算,在这里只取了0和1, 不难看出该矩阵图形的特点上面一半图形是明亮的,下面一半图形是黑的,因此该图像具有很清晰的一道分界线,即具有很明显的水平特征。

TensorFlow应用技术拓展—图像分类

因此为了很好地提取上述矩阵的水平特征,设计的卷积核应该也要具有水平特征提取的属性。而采用垂直特征提取属性的卷积核相对而言在特征提取的明显程度上会略显不足。 如下所示,采用提取水平特征的卷积核进行卷积:

TensorFlow应用技术拓展—图像分类

由得到的卷积结果矩阵可知,原始图形的水平特征被很好地提取出来,并且图形地分界线会更加明显,因为图形有颜色的部分像素值加深了,很好地提取并突出了图形的水平特征。当采用提取垂直特征的卷积核进行卷积时:

TensorFlow应用技术拓展—图像分类

由得到的卷积结果矩阵可知,原始图形的水平特征也能被提取出来,但是会产生两条分界线,图形变化由特别明亮到明亮再到黑,反映到真实图形上的情况也就变成由明到暗再到黑的情况,与真实原始图形反应的水平特征有所差别。

由上述例子不难得知,卷积核的不同会影响最终提取的图形特征的优劣程度,同时不同图形所反应出来的特征也有所不同,如何根据图形特征属性的不同来设计出网络模型来更好地学习和设计出卷积核也尤为关键。在实际地图形分类项目中,就需要根据图像的差异来选择提取合适的特征,并且往往需要有所取舍的去考虑。           

2.2 如何考虑卷积来更好的进行图像分类?

在上一节中通过卷积操作的作用可以知道,设计网络模型来更好地去学习出适配图像的卷积核尤为重要。但在实际应用中,都是通过给定图像类别的真实标签,将类别标签转成机器能够理解的向量数据,来自动学习训练。当然,也不是完全无法通过人工设置来改善的。虽然数据集的标签是固定好的,但是我们可以根据数据集的图片类型去选择不同的网络模型,针对不同的网络模型的优劣势去考虑往往会有不错的训练效果。

同时在提取图像特征时,也可以考虑使用多任务学习的方法,在已有的图像数据中,再次同样使用一次图像数据去提取一些额外的图像特征(例如图像的通道特征和空间特征等),然后对之前提取到的特征进行一个补充或者填充,来完善最终提取到的图像特征。当然,有时候这种操作会造成提取的特征冗余,取得的分类效果往往适得其反,因此需要根据实际训练的分类结果去酌情考量。

2.3 网络模型选择的一些建议

图像分类领域发展已经有很长一段时间了,从最初经典的AlexNet网络模型到近几年火热的ResNet网络模型等,图像分类技术已经发展地比较完善,对于一些常用的图像数据集的分类准确率已经趋于100%。目前该领域中,大多数人采用的网络模型都是选择最新的,并且在大多数图像分类任务中,使用最新的网络模型确实可以带来很明显的分类效果,由此很多人在这一领域中往往会忽略以前的网络模型,直接去学习最新的、流行的网络模型。

在这,本人还是建议各位读者能够对图形分类领域的一些经典的网络模型都需要去进行一个熟悉,因为技术的更新迭代是非常快的,即使现在最新的网络模型今后也可能会被淘汰,但是基本的网络模型运行的原理是大致相通的,通过掌握经典的网络模型,不仅可以掌握基本的原理,还可以明白不同网络模型之间的差异和针对不同任务处理时的优劣性。例如,当你的图像数据集比较小时,采用最新的网络模型训练起来可能会非常复杂耗时,但是提升的效果微乎其微,因此为了可以忽略不计的效果去牺牲自己的训练时间成本反而得不偿失。因此,对于图像分类网络模型的掌握需要做到知其然还能知其所以然,这样今后选择图像分类模型时真正能做到有的放矢。

作者介绍:

稀饭,51CTO社区编辑,曾任职某电商人工智能研发中心大数据技术部门,做推荐算法。目前从事自然语言处理方向研究,主要擅长领域有推荐算法、NLP、CV,使用代码语言有Java、Python、Scala。发表ICCC会议论文一篇。

理论要掌握,实操不能落!以上关于《TensorFlow应用技术拓展—图像分类》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
GPT-3:能写作的人工智能GPT-3:能写作的人工智能
上一篇
GPT-3:能写作的人工智能
Nature子刊:新算法可提前一周预测两个街区内的犯罪,在美国8个城市准确率达90%
下一篇
Nature子刊:新算法可提前一周预测两个街区内的犯罪,在美国8个城市准确率达90%
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    18次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    15次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    43次使用
  • MeowTalk喵说:AI猫咪语言翻译,增进人猫情感交流
    MeowTalk喵说
    MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
    44次使用
  • SEO标题Traini:全球首创宠物AI技术,提升宠物健康与行为解读
    Traini
    SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
    38次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码