当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 2024智源大会议程公开丨生成模型

2024智源大会议程公开丨生成模型

来源:机器之心 2024-06-05 19:51:43 0浏览 收藏

编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《2024智源大会议程公开丨生成模型》,文章讲解的知识点主要包括,如果你对科技周边方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。

2024年6月14日-15日,第6届北京智源大会将以线下与线上结合的形式召开,线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野,汇聚年度杰出工作研究者,交流新思想,探讨新思路,引领新前沿。目前已正式开放报名渠道。

北京智源大会倒计时:11 

生成模型 论坛丨6月15日下午

生成功能建模是人工智能的基础范式之一,是迈向通用人工智能的重要一环。随着生成式建模方法的快速发展和模型规模的急速增长,以自回归模型、扩散概率模型为代表的生成式人工智能(如GPT系列、Sora、Stable Diffusion等)在文本、图像、视频、跨模态等重要领域取得了一系列突破性进展。本讨论坛聚焦生成式概率建模的未来发展,邀请4位生成式人工智能一线专家学者,分享生成式建模的前沿进展,共同探讨如何构建多模态统一的生成式建模方法等重要未来方向。

论坛议程

2024智源大会议程公开丨生成模型

论坛主席

2024智源大会议程公开丨生成模型

李崇轩,中国人民大学高瓴人工智能学院副教授

李崇轩,中国人民大学高瓴人工智能学院副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作部署于文到图大模型DALL·E 2、Stable Diffusion和文到视频大模型ViDu等。曾获国际会议ICLR佳出论文奖、吴文俊优秀青年奖、吴文俊人工智能一等奖、中国计算机学会优秀博士论文等。入选博新计划、北京市科技新星,主持参与多项国家自然科学基金、科技部课题。担任ICLR、NeurIPS等国际会议领域主席。

2024智源大会议程公开丨生成模型

陈键飞,清华大学副教授

陈键飞于2014年和2019年分别在清华大学获得了计算机科学的学士和博士学位,并在TSAIL组与朱军教授合作。他的研究兴趣包括高效机器学习,特别是量化神经网络、随机优化算法和概率推理算法。在过去,他还开发了几个可扩展的主题模型训练系统。2019年,陈键飞 因杰出的工作获得了CCF优秀博士学位论文奖。他还曾在2009年获得中国信息学奥林匹克竞赛金牌。2018年,陈键飞 共同创立了RealAI,这是他职业生涯中的一个显著成就。

演讲主题及嘉宾介绍(按照发言先后顺序)

1、视频生成前沿进展

报告简介:不同于图像生成,视频生成在内容一致性、长视频生成、计算资源消耗等方面均面临巨大的挑战。但是,视频生成仍然在2023年取得了飞速的发展,涌现出Stable Video Diffusion、Runway Gen-2、Video Diffusion Transformer、Sora等优秀模型。本报告首先介绍当前视频生成面临的挑战,然后详细介绍最新的视频生成优秀模型,最后还对视频生成的技术发展进行展望。

2024智源大会议程公开丨生成模型

卢志武,中国人民大学教授

卢志武博士,中国人民大学高瓴人工智能学院教授,博士生导师。2005年毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011年毕业于香港城市大学计算机系,获PhD学位。研究方向为机器学习与计算机视觉。设计首个中文通用多模态预训练模型文澜BriVL。发表多模态领域首篇Nature子刊论文。早于OpenAI发布类Sora的视频生成底座VDT。

2、Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

报告简介:讲者将会介绍最新的视觉生成框架Visual AutoRegressive Modeling,基于Visual tokenizer结合transformer实现了Next Scale Prediction,首次使得GPT风格的自回归视觉生成,在效果、速度、Scaling能力多方面超越 Diffusion,并迎来了视觉生成领域的 Scaling Laws,本次分享将会带大家介绍经典的扩散模型以及近期受到大家关注Auto Regressive模型的前沿进展。

2024智源大会议程公开丨生成模型江毅,字节跳动 GenAI 研究员

江毅,字节跳动 GenAI 研究员,毕业于浙江大学,他的代表性工作有Sparse R-CNN,ByteTrack,UNINEXT等。当前的研究兴趣主要是计算机视觉和视觉生成基础模型的研发,在CVPR,ICCV,NeurIPS,ICLR,ICML,ECCV等会议和期刊上发表论文30余篇,其中多篇文章被录用为Oral,Spotlight,他的工作在github开源并累计获得20K star。

3、视觉生成中的若干问题

报告简介:近年来,视觉生成模型在人工智能领域实现了突破性进展,吸引了业内广泛的关注。然而,随着技术的发展,该领域亟待解决的关键问题亦日益凸显,呼唤研究者们投入更多精力进行深入探讨。本报告旨在梳理并总结该领域面临的若干重要问题,同时分享作者针对以下课题的初步思考与见解:一、探讨生成模型的最终追求;二、视觉信号拆分问题;三、Tokenizer存在的困境;四、扩散模型的内在冲突问题;五、扩散模型是否是最大似然估计。报告期望这些讨论能够引起学界的重视,并为推动该领域的持续创新与发展贡献力量。

2024智源大会议程公开丨生成模型

古纾旸,微软亚洲研究院视觉计算组研究员

古纾旸,在中国科学技术大学自动化系于2017年和2022年分别获得学士和博士学位,现为微软亚洲研究院视觉计算组研究员,主要研究方向为计算机视觉中的生成模型。研究兴趣主要包括生成对抗网络和扩散模型的理论及应用,探索新一代生成模型,以及生成模型质量评估。目前已在CVPR、ICCV、ECCV等会议上发表多篇论文并担任多个会议与期刊的审稿人。

个人主页:https://cientgu.github.io/

4、大模型的高效并行推理方法

报告简介:AIGC大模型已取得广泛应用成果,然而其低效的顺序推理过程常导致较差的用户体验和高昂的部署成本。本次报告将介绍如何从推理算法的角度改善大模型的推理效率,并探讨在模型架构、序列压缩、缓存优化等其他方面的加速手段。

2024智源大会议程公开丨生成模型

邓志杰,上海交通大学清源研究院助理教授

邓志杰,上海交通大学电院清源研究院助理教授,博士生导师。主要研究方向为生成模型、机器学习。以第一/通讯作者在ICML、NeurIPS、ICLR、CVPR等会议和期刊上发表论文20余篇。获英伟达先锋研究奖。研究工作得到国家自然科学基金、上海市科技创新行动计划、CCF-百川-英博大模型基金等项目支持。

5、圆桌讨论

圆桌讨论嘉宾:

陈键飞丨清华大学副教授(主持人)

卢志武丨中国人民大学教授

江   毅丨字节跳动 GenAI 负责人

古纾旸丨微软亚洲研究院视觉计算组研究员

邓志杰丨上海交通大学清源研究院助理教授

李崇轩丨中国人民大学副教授

即刻扫码注册,参与大会报名

本届大会采用线下与线上模式融合,报名通道已开启,欢迎扫码免费注册。由于线下席位有限,请尽早完成注册,组委会将根据注册次序审核,并在会前发送审核结果通知。公开环节将向注册用户全程线上直播。

2024智源大会议程公开丨生成模型

今天关于《2024智源大会议程公开丨生成模型》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于产业的内容请关注golang学习网公众号!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
总产能将突破100万辆,曝蔚来汽车获准在国内建设第三家工厂总产能将突破100万辆,曝蔚来汽车获准在国内建设第三家工厂
上一篇
总产能将突破100万辆,曝蔚来汽车获准在国内建设第三家工厂
golang框架在大型项目中的可扩展性和维护考虑
下一篇
golang框架在大型项目中的可扩展性和维护考虑
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    152次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    146次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    159次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    155次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    162次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码