资源简介
Python数据挖掘入门与实践.zip (code)
代码片段和文件信息
import os
import re
from mrjob.job import MRJob
from mrjob.step import MRStep
word_search_re = re.compile(r“[\w‘]+“)
class ExtractPosts(MRJob):
post_start = False
post = []
def mapper(self key line):
filename = os.environ[“map_input_file“]
gender = filename.split(“.“)[1]
try:
docnum = int(filename[0])
except:
docnum = 8
if filename.startswith(“51“):
# remove leading and trailing whitespace
line = line.strip()
if line == ““:
self.post_start = True
elif line == “ “:
self.post_start = False
yield gender repr(“\n“.join(self.post))
self.post = []
elif self.post_start:
self.post.append(line)
if __name__ == ‘__main__‘:
ExtractPosts.run()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-03-06 19:04 #Python数据挖掘入门与实践\
目录 0 2018-03-09 17:16 #Python数据挖掘入门与实践\Code_REWRITE\
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\.ipynb_checkpoints\
文件 434745 2015-06-28 15:31 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10 (Cluster Types)-checkpoint.ipynb
文件 64766 2015-06-28 15:36 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10 Clusterer-checkpoint.ipynb
文件 1100672 2015-06-28 15:34 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10 Image creation 10_02.png-checkpoint.ipynb
文件 72 2015-06-28 15:29 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10-checkpoint.ipynb
文件 78925 2015-06-28 15:40 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 10\Chapter 10 Clusterer.ipynb
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 11\
文件 58837 2015-06-28 15:17 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 11\Chapter 11 (CIFAR).ipynb
文件 62409 2015-06-28 15:02 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 11\Chapter 11 (Theano and Lasagne).ipynb
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\
文件 38759 2015-06-28 15:22 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\CH12 MapReduce Basics.ipynb
文件 10578 2015-05-08 19:56 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\Chapter 12 (NB Predict).ipynb
文件 1730 2015-05-08 06:35 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\Chapter 12 (Test load).ipynb
文件 882 2015-05-08 16:49 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\extract_posts.py
文件 1986 2015-05-08 09:37 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\nb_predict.py
文件 2021 2015-05-08 08:44 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 12\nb_train.py
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\.ipynb_checkpoints\
文件 14242 2015-05-28 09:33 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\.ipynb_checkpoints\ch1_affinity-checkpoint.ipynb
文件 13797 2015-05-28 09:33 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\.ipynb_checkpoints\ch1_oner_application-checkpoint.ipynb
文件 1000 2014-10-10 03:13 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\affinity_dataset.txt
文件 14242 2015-05-28 09:33 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\ch1_affinity.ipynb
文件 3544 2014-10-10 03:13 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\ch1_affinity_create.ipynb
文件 14210 2017-10-11 06:29 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 1\ch1_oner_application.ipynb
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 2\
目录 0 2017-10-11 14:15 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 2\.ipynb_checkpoints\
文件 128669 2015-05-28 10:08 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 2\.ipynb_checkpoints\Ionosphere Nearest Neighbour-checkpoint.ipynb
文件 129473 2017-10-11 13:23 #Python数据挖掘入门与实践\Code_REWRITE\Chapter 2\Ionosphere Nearest Neighbour.ipynb
............此处省略40个文件信息
相关资源
- 虫师经典著作:python web接口开发与测
- PyQt5-5.4-gpl-Py3.4-Qt5.4.0-x64
- python数据可视化编程实战源码
- python2.7.5 64位
- Python 计算机视觉编程中文版PDF
- Python机器学习(预测分析核心算法)
- Python核心编程(第三版)-PDF高清晰完
- RNN python
- 可用于毕业设计、课程设计的车牌识
- 数据结构(python语言描述)Kenneth 著配
- python2.6(64位)
- python学习手册(第5版)(英文版)
- 基于python的行人与车辆检测和跟踪实
- 利用Python实现的BP神经网络进行人脸识
- 文字版pdf书和源代码:深度学习入门
- Python游戏编程快速上手+(高清完整版
- python3 + wxpython 实现RSA加密聊天室
- 21天学通python源码和PPT
- 深度学习入门:基于Python的理论与实
- Python地理空间分析指南第2版.pdf
- 超级玛丽python源码
- scipy_0.14.0 for python2.7 64位
- python-3.7.2-amd64.exe
- python2.7 安装包
- python写的tcp局域网聊天程序源码+exe
- Python3.5.5
- opencv3机器视觉python语言实现.zip
- Python金融大数据分析.zip
- Python数据挖掘入门与实践(高清PDF+随
- Python-CCKS2017中文电子病例命名实体识
评论
共有 条评论