当前位置：首页 > 文章列表 > 文章 > python教程 > 如何用Python实现简单的推荐系统？协同过滤基础实现

如何用Python实现简单的推荐系统？协同过滤基础实现

2025-07-01 23:26:35 0浏览收藏

本篇文章给大家分享《如何用Python实现简单的推荐系统？协同过滤基础实现》，覆盖了文章的常见基础知识，其实一个语言的全部知识点一篇文章是不可能说完的，但希望通过这些问题，让读者对自己的掌握程度有一定的认识(B 数)，从而弥补自己的不足，更好的掌握它。

推荐系统是根据用户过去喜好预测其未来可能喜欢的内容，Python实现推荐系统的协同过滤方法分为基于用户的协同过滤（User-Based CF）和基于物品的协同过滤（Item-Based CF）。1. 基于用户的协同过滤通过计算用户相似度（如余弦相似度），根据相似用户的评分预测目标用户对未评分物品的评分，并生成推荐；2. 基于物品的协同过滤则通过计算物品相似度，根据目标用户对相似物品的评分进行预测并生成推荐。此外，冷启动问题可通过基于内容的推荐或引导活跃用户反馈解决，评估指标包括准确率、召回率、F1值、NDCG和RMSE，优化方法包含正则化、复杂相似度度量、多算法结合及矩阵分解等。

推荐系统，简单来说，就是根据用户过去的喜好，预测他未来可能喜欢的东西。Python实现推荐系统，协同过滤是入门，也是个不错的起点。

解决方案

协同过滤的核心思想是：如果用户A和用户B对某些物品的喜好相似，那么他们对其他物品的喜好也可能相似。或者说，如果物品A和物品B被很多用户同时喜欢，那么它们可能也很相似。协同过滤主要分为两种：基于用户的协同过滤（User-Based CF）和基于物品的协同过滤（Item-Based CF）。

1. 基于用户的协同过滤（User-Based CF）：

这种方法找到与目标用户兴趣相似的用户群体，然后将这些用户喜欢的东西推荐给目标用户。

数据准备： 首先，你需要用户-物品评分矩阵。这个矩阵的行代表用户，列代表物品，矩阵中的值代表用户对物品的评分。如果用户没有对某个物品评分，则该值为空或0。

import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

# 示例数据：用户-物品评分矩阵
ratings = np.array([
    [5, 3, 0, 1],
    [4, 0, 0, 1],
    [1, 1, 0, 5],
    [1, 0, 0, 4],
    [0, 1, 5, 4],
])

# 用户ID
user_ids = ['User1', 'User2', 'User3', 'User4', 'User5']
# 物品ID
item_ids = ['Item1', 'Item2', 'Item3', 'Item4']

计算用户相似度： 常用的相似度计算方法有余弦相似度、皮尔逊相关系数等。这里使用余弦相似度。

# 计算用户之间的余弦相似度
user_similarity = cosine_similarity(ratings)
print("用户相似度矩阵：")
print(user_similarity)

预测评分： 根据相似用户的评分，预测目标用户对未评分物品的评分。

def predict_user_based(user_id, item_id, ratings, user_similarity):
    user_index = user_ids.index(user_id)
    item_index = item_ids.index(item_id)

    # 找到与目标用户相似的其他用户
    similar_users = user_similarity[user_index]

    # 排除目标用户自身
    similar_users[user_index] = 0

    # 获取相似用户的评分
    user_ratings = ratings[:, item_index]

    # 计算加权平均评分
    numerator = np.sum(similar_users * user_ratings)
    denominator = np.sum(np.abs(similar_users))

    if denominator == 0:
        return 0  # 避免除以零

    predicted_rating = numerator / denominator
    return predicted_rating

# 预测User1对Item3的评分
predicted_rating = predict_user_based('User1', 'Item3', ratings, user_similarity)
print(f"预测User1对Item3的评分: {predicted_rating}")

生成推荐： 选择预测评分最高的几个物品推荐给目标用户。

2. 基于物品的协同过滤（Item-Based CF）：

这种方法找到与目标用户已喜欢的物品相似的物品，然后推荐给目标用户。

数据准备： 同样需要用户-物品评分矩阵。

计算物品相似度： 计算物品之间的相似度，可以使用余弦相似度或其他相似度度量。

# 计算物品之间的余弦相似度
item_similarity = cosine_similarity(ratings.T)
print("物品相似度矩阵：")
print(item_similarity)

预测评分： 根据目标用户对相似物品的评分，预测目标用户对未评分物品的评分。

def predict_item_based(user_id, item_id, ratings, item_similarity):
    user_index = user_ids.index(user_id)
    item_index = item_ids.index(item_id)

    # 获取用户对所有物品的评分
    user_ratings = ratings[user_index, :]

    # 找到与目标物品相似的其他物品
    similar_items = item_similarity[item_index]

    # 排除目标物品自身
    similar_items[item_index] = 0

    # 计算加权平均评分
    numerator = np.sum(similar_items * user_ratings)
    denominator = np.sum(np.abs(similar_items))

    if denominator == 0:
        return 0  # 避免除以零

    predicted_rating = numerator / denominator
    return predicted_rating

# 预测User1对Item3的评分
predicted_rating = predict_item_based('User1', 'Item3', ratings, item_similarity)
print(f"预测User1对Item3的评分: {predicted_rating}")