中关村科金副总裁邓江 :AI音视频技术在金融场景下的应用实操
来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习科技周边相关编程知识。下面本篇文章就来带大家聊聊《中关村科金副总裁邓江 :AI音视频技术在金融场景下的应用实操》,介绍一下,希望对大家的知识积累有所帮助,助力实战开发!
传统金融业面临运营低效、风险管控不力、获客成本高等痛点。通过金融与科技的融合破解传统业务痛点和难点是当前金融业创新发展的重要支撑。
日前,在51CTO主办的AISummit全球人工智能技术大会上,中关村科金副总裁邓江带来了主题演讲《AI音视频技术在金融场景下的应用实操》,从应用、技术、作用与价值三个层面来介绍音视频技术与金融的技术应用与思考。
在过去的三年,疫情对整个经济社会都造成了很大的影响。严重依赖于线下场景的金融业务也不例外。
AI音视频技术在金融场景下的应用
在前几年疫情的大环境下,金融业务受到了很大影响,国家也出台了一系列的管理办法,来推动无接触金融的发展。
在新环境的要求下,在新技术的驱动下,由传统的人工驱动的服务模式(线下人工驱动的服务模式)迭代为AI驱动的智能服务模式(线上+线下全渠道人机系统的服务模式)。传统人工驱动的服务模式下,只能实现线下面对面、文字、电话语音、音视频等服务模式,在AI驱动下,可以实现智能/无人网点、智能客服、智能IVR/外呼、AI智能视频、AI虚拟员工等服务。
为了实现远程银行,邓江表示,有五大核心技术在驱动整个技术的进步。五大核心技术包括,人工智能技术、实时计算、生物识别及身份核验、数据决策数据计算、隐私保护。
在实现过程中,还有三大核心算法及四大核心技术能力,是技术落地过程中的另外两部分技术需要。三大AI核心算法:语音技术、自然语言处理、机器视觉。四大核心技术能力:全渠道高质量的音视频通信能力、全渠道SDK封装及适配能力、基于音视频的AI算法深度整合应用能力、灵活可视化的视频服务场景编排能力。
金融场景下,智能视频云建设的技术实操
邓江表示,智能视频云是一种推动基础视频的数字化升级,以AI智能化、RPA流程自动化,构建"人机协同、人机自助"的视频服务新模式。其在基础云计算资源的支撑下,底层构建支持高并发、快速响应的音视频平台,包括ASR、TTS、NLP、OCR、人脸识别、防翻拍、活体检测等。在业务中台层面,实现客户的流程管理,高并发下的智能排队,相关信息的统计分析,订单的管理,一系列的中台支撑。
在前端,除了多端介入的支持以外,一系列对于仿冒身份的多模态的生物的核验,客户端的自助和客服的远程视频,以及对现场视频的实时计算和捕捉。最前端是业务场景端,像理财、保险、信托等等一系列的业务所对应的相关线上线下结合的流程办理。
依托于强大的底层基础,形成五大核心产品:多模态身份核验、AI现场视频服务、AI自助视频服务、AI远程视频服务、AI智能音视频质检。并对AI视频云的视频服务体系进行了介绍,拆解产品体系,介绍产品特性、流程管理及产品价值。
AI音视频技术在金融场景下的应用实操—移动信贷
传统金融信贷面签有六大难点:
面临信息孤岛,面签数据独立于风控体系,未充分发挥其动态数据价值;全人工驱动模式,质量高度依赖人员经验,参差不齐;业务效率低,无智能化或弱智能化辅助,基层压力大、效率低;展业渠道单一,现场式面核面签模式,覆盖难且成本高;业务量瓶颈,业务波峰波谷,动态扩展匹配性差;人工抽检风险大,人工离线抽样审核,潜在风险大,反馈及时性不足,人员工作压力大。
邓江在介绍了面签难点后,又从政策层面解读了四项由银保监会发布的行业《通知》。邓江表示,音视频留痕已成为银行业、信托业、保险业、证券行业的硬性规定。
在邓江老师的演讲中,分享了移动信贷的四个场景:远程视频面签、自助视频面签、客户经理上门面签、网点柜台现场面签,同时介绍了全流程视频风控流程以及中关村科金在生物防伪方向的实践成果,即多模态生物防伪与安全平台。
多模态生物防伪与安全平台,支持动作、读数等多种活体检测方式,利用服务端强大的AI算法,提供更加精准地识别和反欺诈能力,其平台分为四层,由接入层、核心层、功能层、场景层组成。
接入层,由微信小程序、APP、移动H5、Web、摄像机端口以及第三方系统组成。
核心层有三部分功能模块,包括活体伪冒、欺诈检测以及生物对比。在活体伪冒功能部分又由基础、增强防伪检测以及行为风险检测组成,基础防伪检测包含人脸呈现式攻击、声纹呈现式攻击、链路劫持检测;增强防伪检测包含,音色迁移合成检测、深度仿造检测;行为风险监测包含人脸姿态检测、唇语识别、音画同步检测、遮挡语义分割。欺诈检测包含身份证伪造检测、签章伪造检测、人像背景相似度、声纹团伙发现。生物对比包含对抗样本增强学习、声纹对比检索、人脸对比检索。
功能层由核验能力评估、行为风险评估、策略管理、第三方数据接入、联邦学习、主动攻击拦截、加密存储、无感注册、无感录制、无感刷新、生命周期管理、安全审计等12个模块进行功能实现。
场景层包含的业务场景有,多维实名认证、授信用信、员工合规监管、中介代理检测、电审团伙发现、CC投诉追查、办公桌面安全、大客户进线。
在对多模态生物防伪平台进行了深度解析后,讲解了AI智能音视频质检+人工抽查复查的平台功能,借助AI视觉及语音质检技术,在视频服务中,实时质检,实时纠偏(文本纠偏、语音纠偏),实时提醒用户和业务经理,大幅提升一次通过率,避免用户二次补录成本高体验差问题,其中主要涉及的技术包含智能图像识别、智能生物特征识别、智能语音识别、智能动作识别、音画同步检测等。
在智能催收及智能回访部分的介绍中,智能催收可以实现全自动化催收作业,拟人化沟通;针对不同逾期阶段和客户类型可灵活定制话术;标准话术流程,避免人工催收话术不规范引起的合规风险和投诉问题。而智能回访可以实现拨打效率高;通过后台统计了解客户触达率;热情饱满,不影响客户体验;降本增效。
在对AI智能视频云的功能及涉及技术进行剖析后,进行了AI智能视频云的相关案例分享,案例详见官网视频回放。
结语
在AI音视频技术中,无论是人脸、声纹、唇语、语音合成这些技术,都在场景中有深度的场景化定制。作为科技公司来说,除了打磨技术能力以外,更多的是深入业务场景,以客户为中心,了解客户需求,做到解决客户业务中真实的痛点,能够把工具用好,这是未来对于科技公司的更高要求。最终通过技术在金融场景中的深度应用,来提升整个金融业务的水平,拓宽整个金融业务的规模化发展边界。
大会演讲回放及PPT已上线,进入官网查看精彩内容--> AISummit全球人工智能技术大会官网
理论要掌握,实操不能落!以上关于《中关村科金副总裁邓江 :AI音视频技术在金融场景下的应用实操》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

- 上一篇
- 整个元素周期表通用,AI 即时预测材料结构与特性

- 下一篇
- 前8种修复方法无法在Windows 11上创建新文件夹
-
- 科技周边 · 人工智能 | 15分钟前 |
- LongPortMCP—长桥集团首推券商新品
- 121浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 通用汽车CEO2024年薪酬近3000万,涨幅达6%
- 438浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | 控制面板 ccleaner 卸载程序 AI豆包 RevoUninstaller
- 电脑AI豆包删除攻略及详细步骤
- 118浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 2025Q1中国车市占33%,国际品牌大跌
- 255浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 问界M8大定破6万:35.98万起,华为ADS3.0加持
- 194浏览 收藏
-
- 科技周边 · 人工智能 | 13小时前 | LGDisplay 蓝色磷光OLED 功耗降低 混合双栈串联OLED
- LG蓝色磷光OLED面板首发,手机功耗降15%
- 367浏览 收藏
-
- 科技周边 · 人工智能 | 15小时前 |
- Linuxautofs自动挂载详解与实现攻略
- 159浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 7次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 26次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 21次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 26次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 26次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览