当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 实施稳健的AI治理以实现数据民主化

实施稳健的AI治理以实现数据民主化

来源:51CTO.COM 2024-04-22 20:36:37 0浏览 收藏

本篇文章给大家分享《实施稳健的AI治理以实现数据民主化》,覆盖了科技周边的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。

 

实施稳健的AI治理以实现数据民主化

GenAI的出现加快了人们释放数据潜力的步伐,为获取新见解和更佳决策提供了机会。然而,要实现更广泛的数据访问,需要一种完善的数据治理策略。那些能够在数据民主化和严格数据治理之间取得平衡的企业,将通过释放独特的数据驱动洞察力而在市场上脱颖而出。

根据Gartner的数据,到2026年,超过80%的企业将使用GenAI API和模型,或在生产中部署启用GenAI的应用程序,而去年这一比例不到5%。GenAI的自然语言界面允许非技术用户,从部门负责人到一线工作人员,更轻松地访问和使用数据。这在获取信息和技能方面创造了公平的竞争环境,Gartner称这是“本十年最具颠覆性的趋势之一”。 

如果公司要避免隐私、安全和数据质量方面的风险增加,以这种方式实现数据民主化就会使强有力的治理变得更加关键,这意味着准确地知道你拥有什么数据、驻留在哪里、谁有权访问这些数据以及每种类型的用户被允许如何使用这些数据,但一个企业如何在不压制创新的情况下实施全面控制? 

在更高级别上,推崇的方法是将数据整合到一个综合的存储库中,这样不同团队和工作组就可以便捷、安全地共享这个存储库。通过统一数据,企业能够实现集中管理,并扩大对数据的访问范围,同时最大程度地减少复杂性并优化成本。这种集中存储数据的方法有助于确保数据的一致性和准确性,避免数据重复和不一致性带来的问题。此外,这也有助于提高数据的安全性和保护隐私,因为可以更容易地实施访问控制和监控措施。因此,建立一个统一的数据存储库对企业来说是非常重要的,

在实际操作中,这可能会带来一些挑战,因为数据主权法规要求某些数据必须存储在特定的国家或地区。面对这种情况,企业需要努力消除数据孤岛,并在其数据平台上实施一致的治理框架。

此外,一些特定的方法和技术有助于确保企业能够保持有效的治理,同时在GenAI扩大数据访问的同时保持安全。这些方法包括基本的治理实践,适用于各种环境,但随着GenAI推动数据访问进一步民主化,这些实践变得尤为关键。

针对隐私和法规遵从性的精细控制 

随着员工对数据的访问量增加,数据泄露和个人身份信息(PII)被未授权用户访问的风险也在增加。因此,实施严格的访问控制策略以及使用匿名化和身份识别技术对于确保合规性和防止数据被不当访问至关重要。

在我们分析雪花数据云趋势的新《数据趋势2024》报告中,我们注意到治理功能的使用显著增加,这些功能在提供对数据的精细控制的同时,还适当地将其提供给更多的用户,用于更多的用例,例如,在截至2024年1月31日的12个月中,应用的掩码或行访问策略的使用量与去年同期相比增加了98%,与此同时,分配了掩码策略的列数增长了97%。 

然而,值得注意的是,针对受策略保护的对象运行的查询总数上升了142%,这个数字意义重大,因为它表明良好的数据治理不是说“不”和限制数据使用。尽管看到越来越多的治理通过使用标签和屏蔽政策,但报告指出,使用这些数据所做的工作量正在迅速上升。 

在某些情况下,员工可能希望检查他们不能被授予直接访问权限的数据集,在这种情况下,差异隐私是一项强大的技术,因为它允许用户通过查看数据集内的模式来共享和探索数据集,而不会泄露任何个人用户的PII。更进一步,数据净化室允许多方在不向彼此披露原始数据的情况下就数据进行协作,数据净化室通常用于在不同企业之间共享数据,但我们正在看到内部使用的技术来满足日益增长的监管和隐私需求,它可以成为在GenAI界面环境中探索PII数据的有效技术。 

一致、协调的安全性 

安全应该构建在数据平台的结构中,而不是试图稍后为个别数据集和用户固定它,支持对话界面的技术不应该复制数据上的身份和其他核心权限,这将导致脆弱的设置。如果两个或多个系统都在跟踪谁可以访问哪些数据,则出错和未经授权访问的可能性会大大增加。 

在保护GenAI用例的数据方面发挥关键作用的技术包括持续的风险监控和保护、基于角色的访问控制(RBAC)和细粒度授权策略。基于角色的标记和基于标记的掩码策略允许你通过将掩码策略分配给标记,然后在一个或多个数据库对象上设置该标记,从而在列级别保护数据。 

数据孤岛是良好治理的敌人 

将数据的副本或片段存储在不同的系统中,使得跟踪谁可以访问哪些信息以及保持访问和控制策略的一致性变得极其困难,这就是为什么数据孤岛是强大治理的敌人。 

数据孤岛还使得很难确保员工查询的是最新、最准确的数据,这可能会导致代价高昂的错误。为了通过GenAI实现对数据的广泛访问,企业需要一个单一的真实来源,以确保所有员工都在查看相同的信息,并且可以在所有数据中全面应用和更新控制和策略。 

确保数据质量以获得准确的结果 

即使你消除了孤岛并拥有适当的权限,也不能保证员工访问的信息是正确的,数据质量框架基于应用于表中特定列或一组列的可配置数据质量规则,可以帮助检测质量问题并确保准确的信息。 

此外,到目前为止,我们都知道,GenAI有时会产生幻觉,并产生实际上没有根据的答案,这对于企业使用来说是不可接受的。企业可以通过将大型语言模型(LLM)与他们知道值得信任的数据源相结合来解决这一问题,例如内部客户数据库或来自可信第三方提供商的经过审查的数据集。 

这些受信任的数据源可以使用需要LLM定制(如微调)或不需要LLM定制(如即时工程或检索增强生成(RAG))的过程合并。无论是哪种情况,这些技术都有助于确保员工收到准确、高质量的结果,同时遵守内部云环境中内置的治理标准。 

数据访问和通用搜索的威力 

GenAI治理的一个重要方面是让员工很容易找到合适的数据集和数据产品来帮助他们进行分析,人工智能如此强大的一个原因是,它允许员工在不通过中央团队的情况下与数据交互,但这需要这些员工知道他们可以获得什么数据,以及如何找到这些数据。 

搜索功能提供了这一功能,允许用户查找和查询数据集和数据产品,这一搜索功能本身可以由LLM提供支持,使数据搜索更加直观-这是我们在Snowflake开发的,作为我们通用搜索的一部分。 

治理是数据民主化的基础 

商业用户渴望更广泛地利用他们组织的数据,而GenAI最终使这成为可能。多亏了LLMS和自然语言处理,财务、人力资源、销售和运营等领域的员工现在可以针对自己的角色制定问题,并获得他们做出更明智决策所需的答案。 

但要满足企业的安全和法规遵从性需求,这只能在具有强大治理的环境中发生,治理越强,你的员工就越能自由地浏览数据,而不会给公司带来额外的风险,GenAI为真正的数据民主化打开了大门,而良好的治理是使之成为可能的基础。

本篇关于《实施稳健的AI治理以实现数据民主化》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
如何使用 NaCl 对大文件进行签名?如何使用 NaCl 对大文件进行签名?
上一篇
如何使用 NaCl 对大文件进行签名?
通过删除 golang 中的子字符串将字符串分成两部分
下一篇
通过删除 golang 中的子字符串将字符串分成两部分
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    2次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    2次使用
  • AI音乐实验室:一站式AI音乐创作平台,助力音乐创作
    AI音乐实验室
    AI音乐实验室(https://www.aimusiclab.cn/)是一款专注于AI音乐创作的平台,提供从作曲到分轨的全流程工具,降低音乐创作门槛。免费与付费结合,适用于音乐爱好者、独立音乐人及内容创作者,助力提升创作效率。
    2次使用
  • SEO标题PixPro:AI驱动网页端图像处理平台,提升效率的终极解决方案
    PixPro
    SEO摘要PixPro是一款专注于网页端AI图像处理的平台,提供高效、多功能的图像处理解决方案。通过AI擦除、扩图、抠图、裁切和压缩等功能,PixPro帮助开发者和企业实现“上传即处理”的智能化升级,适用于电商、社交媒体等高频图像处理场景。了解更多PixPro的核心功能和应用案例,提升您的图像处理效率。
    2次使用
  • EasyMusic.ai:零门槛AI音乐生成平台,专业级输出助力全场景创作
    EasyMusic
    EasyMusic.ai是一款面向全场景音乐创作需求的AI音乐生成平台,提供“零门槛创作 专业级输出”的服务。无论你是内容创作者、音乐人、游戏开发者还是教育工作者,都能通过EasyMusic.ai快速生成高品质音乐,满足短视频、游戏、广告、教育等多元需求。平台支持一键生成与深度定制,积累了超10万创作者,生成超100万首音乐作品,用户满意度达99%。
    3次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码