当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 清华大学发布首个课程学习开源库CurML

清华大学发布首个课程学习开源库CurML

来源:51CTO.COM 2023-04-30 22:45:15 0浏览 收藏

欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《清华大学发布首个课程学习开源库CurML》,这篇文章主要讲到等等知识,如果你对科技周边相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!

在机器学习的发展过程中,人类的学习方式常常会对各种算法的设计产生启发。而作为人类学习的一个重要范式,通过课程进行学习,已经被借鉴到机器学习中形成了名为课程学习(Curriculum Learning)的研究方向。

普遍而言,人类的教育是通过高度组织化的课程来完成的。每一门课或是每一个学科,都会从简单的内容开始,逐步向学生呈现更复杂的概念。例如,在大学接受微积分的概念之前,一名学生应当先在小学学习算术,在初中学习函数,在高中学习导数。然而与人类教育不同的是,传统机器学习模型的训练都是将数据样本随机输入模型,忽略了数据样本之间不同的复杂性以及模型当前的学习状态。因此,课程学习在机器学习领域的提出,正是为了模仿人类由易到难的学习方式,为模型提供更好的训练策略,从而提升模型的表现。

清华大学发布首个课程学习开源库CurML

课程学习概念图

目前课程学习已经广泛应用在机器学习的各个任务中,包括图片分类、目标检测、语义分割、机器翻译、音频识别、音频增强、视频问答等等,同时也在有监督、无监督和半监督学习以及强化学习等场景下受到大量关注和研究。

随着课程学习的应用和场景日益丰富,特别需要对这一领域进行细致的梳理和归纳,从而推动研究者的深入探索、提升使用者的应用体验。

因此,清华大学朱文武教授所带领的媒体与网络大数据实验室在发表了多篇课程学习学术论文的积累和基础上,实验室成员王鑫在 IEEE TPAMI 发表了关于课程学习的综述论文,实验室进一步发布了全球首个课程学习开源库 CurML (Curriculum Machine Leanring)。

朱文武教授与王鑫助理研究员的课程学习研究工作包括应用于城市兴趣地点推荐的课程元学习方法、基于带噪多反馈信息的课程解耦商品推荐、基于课程学习的共享参数神经架构搜索、以及基于课程难度自适应的组合优化问题求解等等。研究成果发表于 SIGKDD、NeurIPS、ACM MM 等高水平国际机器学习会议上。

清华大学发布首个课程学习开源库CurML

部分研究成果框架图

课程学习综述论文则全面回顾了课程学习的产生、定义、理论和应用等各个方面,设计了统一的课程学习框架,并根据框架内的核心组成将课程学习算法分为两个大类和多个小类,区分了课程学习与其他机器学习概念之间的不同和关联,指出了这一领域所面临的挑战和未来可能的研究方向。

清华大学发布首个课程学习开源库CurML

课程学习方法分类

课程学习开源库 CurML 是课程学习算法的支持平台,已经集成十多种课程学习算法,同时支持带噪和非带噪两种应用场景,便于研究者和使用者复现、评估、比较以及选择课程学习算法。

CurML 的主体模块是 CL Trainer,它由两个子模块 Model Trainer 和 CL Algorithm 组成,两者间通过五个接口函数进行交互,从而实现课程学习指导的机器学习过程。

清华大学发布首个课程学习开源库CurML

CurML 框架图

主体模块:CL Trainer

这一模块是整个开源库的主体部分。通过调用这一模块,使用者仅需几行代码即可实现课程学习算法。在给定数据集、模型和超参数后,模块将进行一定时间的训练,并输出训练后的模型参数和任务的测试结果。这一模块的设计主要是为了满足易用性的要求,因此进行了高度的封装,提供给想要使用课程学习算法但并不在意具体实现细节的使用者。

子模块 1:Model Trainer

这一模块用于完成一般的机器学习过程,例如训练一个图片分类器或是一个语言模型。同时,它预留了五个接口函数的位置,用于和第二个子模块 CL Algorithm 进行交互,也支持自定义的输入函数。

子模块 2:CL Algorithm

这一模块封装了 CurML 所支持的全部课程学习算法,如下表所示:

清华大学发布首个课程学习开源库CurML

模块的实现是通过五个接口函数,分别用于从机器学习过程中获取数据和模型信息,以及指导模型的学习策略,如下图所示。

清华大学发布首个课程学习开源库CurML

CurML 流程图

接口函数:data_prepare

这一函数用于从 Model Trainer 模块向 CL Algorithm 模块提供数据集信息。很多课程学习算法需要对数据集有一个整体的了解,才能更好地判断数据样本难度,因此这一接口函数是很有必要的。

接口函数:model_prepare

这一函数与 data_prepare 很类似,区别在于传递的不是数据集信息而是模型训练的相关信息,例如模型架构、参数优化器、学习率调整器等等,很多课程学习算法通过调节这些要素指导机器学习。

接口函数:data_curriculum

这一函数用于计算数据样本难度,并根据数据难度和当前模型状态为模型提供合适的数据,大部分的课程学习都具有类似的思想。

接口函数:model_curriculum

这一函数用于更新模型,调节模型从数据样本中获取的信息量,间接指导模型的学习,目前这类算法的数量还较少,但 CurML 也同样支持这类算法的实现。

接口函数:loss_curriculum

这一函数用于对损失函数值进行重加权,间接调整不同数据对于模型的影响,这类算法在课程学习中较为常见,因为损失值的加权在本质上是一种对数据的软采样。

通过对于十多种近年来课程学习方法的总结,采用上述的模块和接口参数可以统一化实现不同类型的课程学习算法,从而能在公平的场景和任务下对课程学习算法进行评估、比较和选择。

未来展望

CurML 的研发团队表示,在未来他们将不断更新这一开源库,为课程学习的发展和应用提供进一步的支持。

相关链接:

  • CurML 开源代码库链接:https://github.com/THUMNLab/CurML
  • CurML 开源软件论文链接:  https://dl.acm.org/doi/pdf/10.1145/3503161.3548549
  • 课程学习综述论文链接:https://ieeexplore.ieee.org/abstract/document/9392296/
  • 课程元学习论文链接:https://dl.acm.org/doi/abs/10.1145/3447548.3467132
  • 课程解耦学习论文链接:https://proceedings.neurips.cc/paper/2021/file/e242660df1b69b74dcc7fde711f924ff-Paper.pdf
  • 课程神经架构搜索论文链接:https://dl.acm.org/doi/abs/10.1145/3503161.3548271
  • 课程难度自适应论文链接:https://ojs.aaai.org/index.php/AAAI/article/download/20899/version/19196/20658

今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
教训惨痛!谷歌如何从AI老大哥一步步跌落神坛?教训惨痛!谷歌如何从AI老大哥一步步跌落神坛?
上一篇
教训惨痛!谷歌如何从AI老大哥一步步跌落神坛?
企业正在充分利用机器学习运营来获取商业利益
下一篇
企业正在充分利用机器学习运营来获取商业利益
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    12次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    11次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    10次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    16次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    16次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码