从三个数据集创建稀疏矩阵

分享于2022年07月17日 machine-learning pandas sparse-matrix 问答
【问题标题】:从三个数据集创建稀疏矩阵(Create sparse matrix from three datasets)
【发布时间】:2022-06-12 00:04:07
【问题描述】:

我有三个数据集:

users_df = pd.read_csv('users.csv')
books_df = pd.read_csv('books.csv')
ratings_train_df = pd.read_csv('ratings_train.csv')

第一个描述系统中的所有用户。第二个描述所有书籍,第三个包含 UserID 和 BookID,并告诉用户对特定书籍的评分。

我现在想训练 LifgtFM 模型来预测特定用户会给新书的新评分,但 LightFM 使用稀疏矩阵:

model=LightFM(loss="warp")
model.fit(..., epochs=30, num_threads=2)

如何将我的数据集转换为模型的 fit 函数的适当输入?


【解决方案1】:

LightFM 是婴儿潮一代的图书馆。你应该使用