-
大小: 749KB文件类型: .rar金币: 2下载: 1 次发布日期: 2021-06-06
- 语言: Python
- 标签:
资源简介
基于MovieLens数据集,采用随机梯度下降算法优化最小化能量函数的概率矩阵分解Python源代码,自己做实验的源代码Probabilistic Matrix Factorization
代码片段和文件信息
from numpy import *
import random
def load_rating_data(file_path=‘ml-100k/u.data‘):
“““
load movie lens 100k ratings from original rating file.
need to download and put rating data in /data folder first.
Source: http://www.grouplens.org/
“““
prefer = []
for line in open(file_path ‘r‘): # 打开指定文件
(userid movieid rating ts) = line.split(‘\t‘) # 数据集中每行有4项
uid = int(userid)
mid = int(movieid)
rat = float(rating)
prefer.append([uid mid rat])
data = array(prefer)
return data
def spilt_rating_dat(data size=0.2):
train_data = []
test_data = []
for line in data:
rand = random.random()
if rand < size:
test_data.append(line)
else:
train_data.append(line)
train_data = array(train_data)
test_data = array(test_data)
return train_data test_data
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 10089 2017-01-09 23:48 ProbabilisticMatrixFactorization.py
文件 8746 2017-01-12 12:41 Probabilistic-Matrix-Factorization.py
文件 1979173 2000-07-19 16:09 data\ml-100k\u.data
文件 958 2017-01-12 12:36 LoadData.py
目录 0 2017-01-09 23:19 data\ml-100k
目录 0 2017-01-10 20:49 data
----------- --------- ---------- ----- ----
1998966 6
评论
共有 条评论