资源简介
Python 数据挖掘入门与实践--代码与文档
书本内所呈现的完整代码与样例数据集
代码片段和文件信息
import os
import re
from mrjob.job import MRJob
from mrjob.step import MRStep
word_search_re = re.compile(r“[\w‘]+“)
class ExtractPosts(MRJob):
post_start = False
post = []
def mapper(self key line):
filename = os.environ[“map_input_file“]
gender = filename.split(“.“)[1]
try:
docnum = int(filename[0])
except:
docnum = 8
if filename.startswith(“51“):
# remove leading and trailing whitespace
line = line.strip()
if line == ““:
self.post_start = True
elif line == “ “:
self.post_start = False
yield gender repr(“\n“.join(self.post))
self.post = []
elif self.post_start:
self.post.append(line)
if __name__ == ‘__main__‘:
ExtractPosts.run()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 1\
文件 1000 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 1\affinity_dataset.txt
文件 16777 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 1\ch1_affinity.ipynb
文件 3670 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 1\ch1_affinity_create.ipynb
文件 13847 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 1\ch1_oner_application.ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 10\
文件 78925 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 10\Chapter 10 Clusterer.ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 11\
文件 59206 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 11\Chapter 11 (CIFAR).ipynb
文件 62409 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 11\Chapter 11 (Theano and Lasagne).ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\
文件 38759 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\CH12 MapReduce Basics.ipynb
文件 10578 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\Chapter 12 (NB Predict).ipynb
文件 1730 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\Chapter 12 (Test load).ipynb
文件 882 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\extract_posts.py
文件 1986 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\nb_predict.py
文件 2021 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 12\nb_train.py
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 2\
文件 143291 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 2\Ionosphere Nearest Neighbour.ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 3\
文件 45385 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 3\Basketball Results.ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 4\
文件 46259 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 4\ch4 Affinity Analysis.ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 5\
文件 1034 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 5\adult_tests.py
文件 13293 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 5\ch5_adult.ipynb
文件 29985 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 5\ch5_advertisements.ipynb
目录 0 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 6\
文件 4977 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 6\ch6_classify_twitter.ipynb
文件 13853 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 6\ch6_get_twitter.ipynb
文件 6717 2018-03-20 01:15 python数据挖掘入门与实践\Chapter 6\ch6_label_twitter.ipynb
............此处省略12个文件信息
相关资源
- 微信跳一跳资源包
- 电力窃漏电用户自动识别 源码
- Python3.x+PyQtChart实现数据可视化界面
- python3根据模板图片批量自动制作个性
- 蚁狮算法(Ant Lion AlgorithmPython实现和
- 跳一跳辅助—用Python来玩微信跳一跳
- 基于Django的酒店管理系统设计与实现
- selenium中python包&对应版本的firefox
- 3D打印机控制软件Cura源码
- 《机器学习实战》源代码Python3
- pygame之《飞机大战》
- python暴力破解蓝奏网盘密码.zip
- python外星人入侵.rar
- 用tkinter写的python GUI注册界面
- PythonTank
- SVD实现代码
- python爬取维基百科程序语言消息盒(
- easygui-0.96
- python坦克大战分步骤源码及素材
- django+mysql家具购物网站,包含部署教
- python新浪微博爬虫
- Python3.5.2的IDLE汉化版计算机等级考试
- 12306爬虫实现
- Python求解数独并输出求解过程
- python程序设计基础课件
- 西电python网络处理上机题答案
- VMD变分模态分解算法
- Python网络编程 3版 高清扫描版 完整中
- 使用python编写的打飞机游戏源码
- 计算24点python
评论
共有 条评论