2024智源大会议程公开丨生成模型
编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《2024智源大会议程公开丨生成模型》,文章讲解的知识点主要包括,如果你对科技周边方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。
2024年6月14日-15日,第6届北京智源大会将以线下与线上结合的形式召开,线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野,汇聚年度杰出工作研究者,交流新思想,探讨新思路,引领新前沿。目前已正式开放报名渠道。
北京智源大会倒计时:11 天
生成模型 论坛丨6月15日下午
生成功能建模是人工智能的基础范式之一,是迈向通用人工智能的重要一环。随着生成式建模方法的快速发展和模型规模的急速增长,以自回归模型、扩散概率模型为代表的生成式人工智能(如GPT系列、Sora、Stable Diffusion等)在文本、图像、视频、跨模态等重要领域取得了一系列突破性进展。本讨论坛聚焦生成式概率建模的未来发展,邀请4位生成式人工智能一线专家学者,分享生成式建模的前沿进展,共同探讨如何构建多模态统一的生成式建模方法等重要未来方向。
论坛议程
论坛主席
李崇轩,中国人民大学高瓴人工智能学院副教授
李崇轩,中国人民大学高瓴人工智能学院副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作部署于文到图大模型DALL·E 2、Stable Diffusion和文到视频大模型ViDu等。曾获国际会议ICLR佳出论文奖、吴文俊优秀青年奖、吴文俊人工智能一等奖、中国计算机学会优秀博士论文等。入选博新计划、北京市科技新星,主持参与多项国家自然科学基金、科技部课题。担任ICLR、NeurIPS等国际会议领域主席。
陈键飞,清华大学副教授
陈键飞于2014年和2019年分别在清华大学获得了计算机科学的学士和博士学位,并在TSAIL组与朱军教授合作。他的研究兴趣包括高效机器学习,特别是量化神经网络、随机优化算法和概率推理算法。在过去,他还开发了几个可扩展的主题模型训练系统。2019年,陈键飞 因杰出的工作获得了CCF优秀博士学位论文奖。他还曾在2009年获得中国信息学奥林匹克竞赛金牌。2018年,陈键飞 共同创立了RealAI,这是他职业生涯中的一个显著成就。
演讲主题及嘉宾介绍(按照发言先后顺序)
1、视频生成前沿进展
报告简介:不同于图像生成,视频生成在内容一致性、长视频生成、计算资源消耗等方面均面临巨大的挑战。但是,视频生成仍然在2023年取得了飞速的发展,涌现出Stable Video Diffusion、Runway Gen-2、Video Diffusion Transformer、Sora等优秀模型。本报告首先介绍当前视频生成面临的挑战,然后详细介绍最新的视频生成优秀模型,最后还对视频生成的技术发展进行展望。
卢志武,中国人民大学教授
卢志武博士,中国人民大学高瓴人工智能学院教授,博士生导师。2005年毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011年毕业于香港城市大学计算机系,获PhD学位。研究方向为机器学习与计算机视觉。设计首个中文通用多模态预训练模型文澜BriVL。发表多模态领域首篇Nature子刊论文。早于OpenAI发布类Sora的视频生成底座VDT。
2、Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction
报告简介:讲者将会介绍最新的视觉生成框架Visual AutoRegressive Modeling,基于Visual tokenizer结合transformer实现了Next Scale Prediction,首次使得GPT风格的自回归视觉生成,在效果、速度、Scaling能力多方面超越 Diffusion,并迎来了视觉生成领域的 Scaling Laws,本次分享将会带大家介绍经典的扩散模型以及近期受到大家关注Auto Regressive模型的前沿进展。
江毅,字节跳动 GenAI 研究员
江毅,字节跳动 GenAI 研究员,毕业于浙江大学,他的代表性工作有Sparse R-CNN,ByteTrack,UNINEXT等。当前的研究兴趣主要是计算机视觉和视觉生成基础模型的研发,在CVPR,ICCV,NeurIPS,ICLR,ICML,ECCV等会议和期刊上发表论文30余篇,其中多篇文章被录用为Oral,Spotlight,他的工作在github开源并累计获得20K star。
3、视觉生成中的若干问题
报告简介:近年来,视觉生成模型在人工智能领域实现了突破性进展,吸引了业内广泛的关注。然而,随着技术的发展,该领域亟待解决的关键问题亦日益凸显,呼唤研究者们投入更多精力进行深入探讨。本报告旨在梳理并总结该领域面临的若干重要问题,同时分享作者针对以下课题的初步思考与见解:一、探讨生成模型的最终追求;二、视觉信号拆分问题;三、Tokenizer存在的困境;四、扩散模型的内在冲突问题;五、扩散模型是否是最大似然估计。报告期望这些讨论能够引起学界的重视,并为推动该领域的持续创新与发展贡献力量。
古纾旸,微软亚洲研究院视觉计算组研究员
古纾旸,在中国科学技术大学自动化系于2017年和2022年分别获得学士和博士学位,现为微软亚洲研究院视觉计算组研究员,主要研究方向为计算机视觉中的生成模型。研究兴趣主要包括生成对抗网络和扩散模型的理论及应用,探索新一代生成模型,以及生成模型质量评估。目前已在CVPR、ICCV、ECCV等会议上发表多篇论文并担任多个会议与期刊的审稿人。
个人主页:https://cientgu.github.io/
4、大模型的高效并行推理方法
报告简介:AIGC大模型已取得广泛应用成果,然而其低效的顺序推理过程常导致较差的用户体验和高昂的部署成本。本次报告将介绍如何从推理算法的角度改善大模型的推理效率,并探讨在模型架构、序列压缩、缓存优化等其他方面的加速手段。
邓志杰,上海交通大学清源研究院助理教授
邓志杰,上海交通大学电院清源研究院助理教授,博士生导师。主要研究方向为生成模型、机器学习。以第一/通讯作者在ICML、NeurIPS、ICLR、CVPR等会议和期刊上发表论文20余篇。获英伟达先锋研究奖。研究工作得到国家自然科学基金、上海市科技创新行动计划、CCF-百川-英博大模型基金等项目支持。
5、圆桌讨论
圆桌讨论嘉宾:
陈键飞丨清华大学副教授(主持人)
卢志武丨中国人民大学教授
江 毅丨字节跳动 GenAI 负责人
古纾旸丨微软亚洲研究院视觉计算组研究员
邓志杰丨上海交通大学清源研究院助理教授
李崇轩丨中国人民大学副教授
即刻扫码注册,参与大会报名
本届大会采用线下与线上模式融合,报名通道已开启,欢迎扫码免费注册。由于线下席位有限,请尽早完成注册,组委会将根据注册次序审核,并在会前发送审核结果通知。公开环节将向注册用户全程线上直播。
今天关于《2024智源大会议程公开丨生成模型》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于产业的内容请关注golang学习网公众号!

- 上一篇
- 总产能将突破100万辆,曝蔚来汽车获准在国内建设第三家工厂

- 下一篇
- golang框架在大型项目中的可扩展性和维护考虑
-
- 科技周边 · 人工智能 | 1小时前 |
- 水军黑小鹏“背刺王”,高管回应:点赞赚钱
- 448浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- macOS上DeepSeek大模型,Ollama与OpenWebUI的绝佳组合
- 420浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 21次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 18次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 17次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 20次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 22次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览