• 大小: 749KB
    文件类型: .rar
    金币: 2
    下载: 1 次
    发布日期: 2021-06-06
  • 语言: Python
  • 标签:

资源简介

基于MovieLens数据集,采用随机梯度下降算法优化最小化能量函数的概率矩阵分解Python源代码,自己做实验的源代码Probabilistic Matrix Factorization

资源截图

代码片段和文件信息

from numpy import *
import random
def load_rating_data(file_path=‘ml-100k/u.data‘):
    “““
    load movie lens 100k ratings from original rating file.
    need to download and put rating data in /data folder first.
    Source: http://www.grouplens.org/
    “““
    prefer = []
    for line in open(file_path ‘r‘):  # 打开指定文件
        (userid movieid rating ts) = line.split(‘\t‘)  # 数据集中每行有4项
        uid = int(userid)
        mid = int(movieid)
        rat = float(rating)
        prefer.append([uid mid rat])
    data = array(prefer)
    return data


def spilt_rating_dat(data size=0.2):
    train_data = []
    test_data = []
    for line in data:
        rand = random.random()
        if rand < size:
            test_data.append(line)
        else:
            train_data.append(line)
    train_data = array(train_data)
    test_data = array(test_data)
    return train_data test_data

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      10089  2017-01-09 23:48  ProbabilisticMatrixFactorization.py

     文件       8746  2017-01-12 12:41  Probabilistic-Matrix-Factorization.py

     文件    1979173  2000-07-19 16:09  data\ml-100k\u.data

     文件        958  2017-01-12 12:36  LoadData.py

     目录          0  2017-01-09 23:19  data\ml-100k

     目录          0  2017-01-10 20:49  data

----------- ---------  ---------- -----  ----

              1998966                    6


评论

共有 条评论

相关资源