泊松矩阵分解:无需数据解决推荐系统冷启动问题的矩阵分解算法
知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个科技周边开发实战,手把手教大家学习《泊松矩阵分解:无需数据解决推荐系统冷启动问题的矩阵分解算法》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!
作者 | 汪昊
审校 | 孙淑娟
推荐系统是目前互联网行业最火爆的技术之一。在过去的十年中,互联网行业诞生了数以百万计的推荐系统模型迭代版本。尽管针对不同场景进行优化的推荐系统模型非常之多,但是经典的模型非常少。矩阵分解是推荐系统领域勃兴早期,在 Netflix 大赛中展露头角的推荐系统算法,也是过去十年中最为成功的推荐系统算法。尽管到 2023 年的今天,推荐系统领域早已是深度学习的天下,矩阵分解仍然广泛应用于各大公司研发过程中,并且仍然有许多科研人员在从事相关算法的研究工作。
矩阵分解算法最为经典的论文是 2007 年的 Probabilistic Matrix Factorization 。在此基础上,后人进行了大量的扩展工作,比如 2021 年的 RankMat(论文下载地址:https://arxiv.org/abs/2204.13016)、ZeroMat (论文下载地址:https://arxiv.org/abs/2112.03084) 和 2022 年的 DotMat (论文下载地址:https://arxiv.org/abs/2206.00151)、KL-Mat (论文下载地址 :https://arxiv.org/abs/2204.13583/ 代码下载地址:https://github.com/haow85/KL-Mat)等。推荐系统因为其简单易用性,以及速度快等原因,深受互联网行业广大工程师的喜爱。
推荐系统冷启动问题是今年来备受关注的另一个研究热点。许多从业者解决推荐系统的思路都是迁移学习和元学习。然而这个思路有个致命的缺点,就是需要其他知识领域的数据。而许多公司是不具备这一条件的。真正不需要任何数据的冷启动算法,是在 2021 年 ZeroMat 提出以后出现的。代表算法包括上一节提到的 ZeroMat 和 DotMat。本文将要介绍的泊松矩阵分解算法(PoissonMat)是 2022 年国际学术会议MLISE 2022发表的论文。论文的名称是PoissonMat:Remodeling Matrix Factorization using Poisson Distribution and Solving the Cold Start Problem without Input Data(论文下载地址:https://arxiv.org/abs/2212.10460)。
我们首先回顾一下Probabilistic Matrix Factorization的MAP定义:
我们随后定义用户给物品打分这一行为为泊松分布。根据泊松分布的定义,我们得到以下公式:
根据泊松公式中参数的定义,我们有:
根据齐夫分布,我们可以得到如下公式:
综合以上公式,我们得到泊松矩阵分解(PoissonMat)的解析形式:
采用随机梯度下降算法求解以上公式,我们得到如下算法流程:
作者随后在 MovieLens 1 Million Dataset 和 LDOS-CoMoDa Dataset 上进行了算法准确率和公平性的实验对比:
图 1 泊松矩阵分解在 MovieLens 1 Million Dataset 上的对比实验
图 2 泊松矩阵分解在 LDOS-CoMoDa Dataset 上的对比实验
根据实验对比效果,我们可以得出如下结论:泊松矩阵分解(PoissonMat)在准确率和公平性指标方面都优于其他算法。并且难能可贵的是,泊松矩阵分解算法没有用到任何输入数据,是一个彻头彻尾的零样本学习算法,很好的解决了冷启动问题。
最后,作者是在 16G RAM 和 Intel Core i5 的联想家用笔记本上做的实验,算法运行速度飞快,并且实现也非常简单。
以解决推荐系统冷启动问题为目标的零样本学习算法,目前是研究热点。而不需要任何数据解决零样本学习问题的真正的零样本学习算法,始自 2021 年的 ZeroMat 算法。本文介绍的泊松矩阵分解算法(PoissonMat)性能优于 ZeroMat 及其后续算法 DotMat,是目前这一领域最优秀的算法之一。由于相关研究还处于起步阶段,希望能够引起广大科技从业者的关注和重视。
作者介绍
汪昊,前 Funplus 人工智能实验室负责人,前恒昌利通大数据部负责人。本科 (2008 年)和硕士(2010年)毕业于美国犹他大学(University of Utah)。对外经贸大学在职 MBA (2016年)。在推荐系统(公平性/基于场景的推荐/冷启动/可解释性/排序学习)、计算机图形学(几何建模/可视化)、自然语言处理(工业界的落地应用)、风控反欺诈(金融/医疗)等方向有多年的经验和独到的见解。在互联网(豆瓣、百度、新浪、网易等)、金融科技(恒昌利通)和游戏公司(Funplus等)有 12 年的技术研发和管理经验。在国际学术会议和期刊发表论文 30 篇,获得国际会议最佳论文奖 / 最佳论文报告奖 3 次 (IEEE SMI 2008 Best Paper Award / ICBDT 2020 Best Oral Presentation Award / ICISCAE 2021 Best Oral Presentation Award)。2006 年 ACM/ICPC 北美落基山区域赛金牌。2004 年全国大学生英语能力竞赛口语决赛铜牌。2003 年济南市高考理工科英语状元。
好了,本文到此结束,带大家了解了《泊松矩阵分解:无需数据解决推荐系统冷启动问题的矩阵分解算法》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

- 上一篇
- 修复:未检测到 Adobe Photoshop 图形处理器问题

- 下一篇
- 事件 ID 4672:如何修复此特殊登录错误
-
- 科技周边 · 人工智能 | 1小时前 |
- 即梦ai社交媒体导出教程及平台格式适配
- 282浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 领克09EM-P四驱Max五座版5月16日强势登场
- 340浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 耶鲁与字节Seed推出D-DiT多模态扩散模型
- 500浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 免费AI证件照网站测评:哪个最好用?
- 307浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 即梦ai社交媒体导出教程及平台适配格式
- 405浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 小米补偿SU7Ultra车主:赠送洗车机及5000积分
- 386浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- 理想MEGA、L9、L7获评客户满意度优秀
- 310浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 13次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 14次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 43次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 40次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 38次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览