当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 合成数据能让人工智能变得更好吗?

合成数据能让人工智能变得更好吗?

来源:51CTO.COM 2023-04-30 08:30:23 0浏览 收藏

哈喽!大家好,很高兴又见面了,我是golang学习网的一名作者,今天由我给大家带来一篇《合成数据能让人工智能变得更好吗?》,本文主要会讲到等等知识点,希望大家一起学习进步,也欢迎大家关注、点赞、收藏、转发! 下面就一起来看看吧!

尽管人工智能 (AI) 由于指数级的发展而变得更加先进,但这种现代技术的局限性仍然存在。

那么,合成数据能否成为所有与人工智能相关的问题的解决方案?

在第四次工业革命中,每个行业都发现了现代技术的潜力;比如人工智能(AI)和机器学习(ML)。

几乎所有其他组织都在部署 AI 以创建更高效的业务流程并确保更好的客户满意度。但是,初创公司、SOHO 和中小型企业 (SMB) 在采用 AI 时面临一个重大问题——这就是所谓的 冷启动问题。虽然初创公司和中小企业一般没有资源收集大数据,但冷启动问题基本上是缺乏此类相关数据。

另一方面,行业巨头已经拥有资源来收集真实世界的数据并将这些数据应用于训练他们的人工智能系统。因此,对中小型企业的胜算很大。在这种情况下,合成数据可能是必要的启动器。

合成数据可以成为数据驱动的商业模式背后的驱动力。此外,研究表明 合成数据产生与真实数据相同的结果。 与真实数据相比,合成数据被认为更便宜且处理时间更短。因此,合成数据的出现可以平衡目前由大公司主导的竞争环境,有利于中小企业和初创公司。

发现合成数据的好处

合成数据是基于用户指定参数的计算机生成的人工数据,以确保数据尽可能接近真实世界的历史数据。通常,Unreal 引擎和 Unity 等游戏引擎通常用作模拟环境,用于测试和训练基于 AI 的应用,例如自动驾驶汽车。基于合成数据开发人工智能驱动的应用程序有很多优势。其中一些优势包括:

合成数据能让人工智能变得更好吗?

1.开发原型

查找、聚合和建模大量相关的真实数据是一个乏味的过程。因此,生成合成数据可能是最佳解决方案。此类数据将能够在大规模生产之前构建原型并测试此类原型以获得所需的结果。与真实数据相比,使用合成数据构建原型更高效、更具成本效益。

非营利性人工智能研究公司 Open AI 正在开发大量基于人工智能的应用。在这些应用中,研究人员开发了用合成数据训练的机器人,可以在看到一个动作只执行一次后学习一项新任务。一家美国加州科技初创公司正在开发一个人工智能平台,其愿景类似于 Amazon Go。这家初创公司旨在借助合成数据为便利店和零售商提供免结账解决方案。他们还引入了人工智能驱动的智能系统来监控商店中的每一位购物者,以识别和分析他们的学习模式。

2. 确保数据隐私

2018 年 11 月,  5 亿万豪客户在一次备受瞩目的数据泄露事件中受到影响。在这 5 亿人中,有 3.27 亿用户的护照信息、电子邮件地址、邮寄地址和信用卡信息等数据被盗。由于此类事件,人们担心其数据的安全性和隐私性。

合成数据可以有效地解决此类隐私问题。合成数据不包括任何个人数据。因此,可以轻松确保数据隐私。合成数据在为医疗保健应用训练 AI 系统方面非常有用。人工智能系统通常需要真实的患者数据。这威胁到患者的隐私。合成数据允许在医疗保健领域开发先进的人工智能应用程序,同时保持患者的机密性。

例如,来自 Nvidia 的研究人员正在与明尼苏达州的 Mayo Clinic 以及波士顿的 MGH 和 BWH 临床数据科学中心合作,正在 使用生成对抗网络来生成用于训练神经网络的合成数据。 生成的合成数据包含来自阿尔茨海默病神经影像学倡议数据集的 3,400 个 MRI 和来自多模态脑肿瘤图像分割基准数据集的 200 个 4D 脑 MRI 和肿瘤。同样,模拟 X 射线也可以与实际 X 射线一起使用,以训练 AI 系统识别多种健康状况。

3. 前所未有的场景测试和训练

开发 AI 驱动的应用最重要的过程之一是测试系统性能。如果系统没有产生所需的输出,则需要对其进行重新训练。在这种情况下,合成数据可以证明是有益的。合成数据可以生成场景来测试 AI 系统,而不是使用真实数据或在真实环境中测试系统。这种方法比获取真实数据便宜且耗时更少。

同样,合成数据还可以针对未来可能出现的缺乏真实数据或事件的场景训练新的或现有的系统。通过这种方法,研究人员可以开发更具未来感的人工智能应用。此外,使用合成数据重新训练 AI 系统更简单,因为生成合成数据比收集准确的真实数据要简单。

由于这些好处,合成数据已成为测试和训练自动驾驶汽车的一种可访问的替代方案。许多自动驾驶汽车开发人员正在使用 GTA V 等模拟游戏环境来训练他们的基于人工智能的系统。同样,May Mobility 正在通过使用合成数据训练他们的车辆来构建自动驾驶微型交通服务。

另一家名为 Waymo 的自动驾驶汽车开发商已经通过在模拟道路上行驶 50 亿英里和在真实道路上再行驶 800 万英里来测试其自动驾驶汽车。合成数据方法允许开发人员在模拟道路上测试他们的自动驾驶汽车,这比在实际道路上直接测试要安全得多。

4. 提高数据灵活性

获取真实数据是一个乏味的过程,包括支付注释费用并确保避免任何侵犯版权的行为。此外,真实数据只能用于在特定领域具有足够历史数据的特定场景。与真实数据不同,合成数据可以立即呈现对象、场景、事件和人员的任意组合。合成数据可以生成能够发现利基应用的通用数据集。因此,研究人员可以利用合成数据探索无限的可能性。几家初创公司 通过开发满足客户要求的训练数据集, 创造了开放的数据经济。

5. 探索合成数据的局限性

尽管合成数据可以帮助 AI 到达未被发现的领域,但其局限性可能成为其主流部署的主要障碍。对于初学者来说,合成数据模拟了真实世界数据的多个属性,但它不会完全复制原始数据。 在对此类合成数据进行建模时,人工智能系统只会在真实数据中寻找共同的趋势和情况。因此,现实世界数据中极端案例中包含的罕见场景可能永远不会包含在合成数据中。 

此外,研究人员尚未开发出一种机制来检查数据是否准确。发现真实数据中的缺陷并减少它们比使用合成数据更简单。人工智能驱动的系统已经有 阴暗面 这会助长无意的偏见。使用合成数据,预测这种偏见的范围和影响可能还为时过早。

6. 克服挑战

企业组织需要了解合成数据是一个相当新的发现。此类数据的效率和准确性尚未根据当前的行业标准进行评估。因此,合成数据不应被视为独立的数据源。尤其是在面临安全问题的应用中,例如医疗保健应用和自动驾驶汽车,合成数据必须与现实世界数据相结合,以开发 AI 系统。但零售业的应用具有较低的风险因素,很容易依赖合成数据。

出于测试目的,合成数据是一种可行且成本低廉的解决方案。但是,出于其他目的,在采用合成数据作为独立解决方案之前,需要彻底研究和分析人工智能系统的结果。随着进一步的研究,合成数据对于多种操作可能会变得更加可靠。

以上就是《合成数据能让人工智能变得更好吗?》的详细内容,更多关于人工智能,机器学习,数据的资料请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
Rokid算法负责人王文兵:AR下的“声”临“奇”境Rokid算法负责人王文兵:AR下的“声”临“奇”境
上一篇
Rokid算法负责人王文兵:AR下的“声”临“奇”境
不用花钱钱,把机器人领回家;开源 AI 套装满足你
下一篇
不用花钱钱,把机器人领回家;开源 AI 套装满足你
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    7次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    7次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    6次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    13次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    14次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码