资源简介
python数据挖掘入门与实践.zip
代码片段和文件信息
import os
import re
from mrjob.job import MRJob
from mrjob.step import MRStep
word_search_re = re.compile(r“[\w‘]+“)
class ExtractPosts(MRJob):
post_start = False
post = []
def mapper(self key line):
filename = os.environ[“map_input_file“]
gender = filename.split(“.“)[1]
try:
docnum = int(filename[0])
except:
docnum = 8
if filename.startswith(“51“):
# remove leading and trailing whitespace
line = line.strip()
if line == ““:
self.post_start = True
elif line == “ “:
self.post_start = False
yield gender repr(“\n“.join(self.post))
self.post = []
elif self.post_start:
self.post.append(line)
if __name__ == ‘__main__‘:
ExtractPosts.run()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 0 2018-03-21 10:02 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?
目录 0 2016-11-04 17:27 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\
文件 18562 2016-11-04 17:26 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\涓夋湀鏁版嵁.csv
目录 0 2018-03-21 10:04 __MACOSX\
文件 0 2018-03-21 10:04 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?
目录 0 2018-03-21 10:04 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\
文件 218 2016-11-04 17:26 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._涓夋湀鏁版嵁.csv
文件 17847 2016-11-04 17:24 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\鍗佷竴鏈堟暟鎹?csv
文件 218 2016-11-04 17:24 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._鍗佷竴鏈堟暟鎹?csv
文件 13890 2016-11-04 17:26 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\浜屾湀鏁版嵁.csv
文件 218 2016-11-04 17:26 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._浜屾湀鏁版嵁.csv
文件 3607 2016-11-04 17:27 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\浜旀湀鏁版嵁.csv
文件 218 2016-11-04 17:27 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._浜旀湀鏁版嵁.csv
文件 12690 2016-11-04 17:27 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\鍥涙湀鏁版嵁.csv
文件 218 2016-11-04 17:27 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._鍥涙湀鏁版嵁.csv
文件 17226 2016-11-04 17:25 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\鍗佷簩鏈堟暟鎹?csv
文件 218 2016-11-04 17:25 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._鍗佷簩鏈堟暟鎹?csv
文件 1545 2016-11-04 17:23 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\鍗佹湀鏁版嵁.csv
文件 218 2016-11-04 17:23 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._鍗佹湀鏁版嵁.csv
文件 17948 2016-11-04 17:25 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\涓€鏈堟暟鎹?csv
文件 218 2016-11-04 17:25 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._涓€鏈堟暟鎹?csv
文件 422 2016-11-04 17:27 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\鍏湀鏁版嵁.csv
文件 218 2016-11-04 17:27 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?NBA鏁版嵁\._鍏湀鏁版嵁.csv
文件 218 2016-11-04 17:27 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?._NBA鏁版嵁
文件 6148 2018-03-21 10:01 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?.DS_Store
文件 120 2018-03-21 10:01 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?._.DS_Store
文件 2332955 2018-03-21 10:01 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?a255188c-6a02-49e6-97f7-ee2e1163f634.pdf
文件 554 2018-03-21 10:01 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?._a255188c-6a02-49e6-97f7-ee2e1163f634.pdf
目录 0 2018-03-21 10:01 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?Code_REWRITE\
文件 6148 2018-03-21 10:01 python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?Code_REWRITE\.DS_Store
目录 0 2018-03-21 10:04 __MACOSX\python鏁版嵁鎸栨帢鍏ラ棬涓庡疄璺?Code_REWRITE\
............此处省略149个文件信息
相关资源
- CpuMemSets在Linux操作系统中的实现
- Python学习全系列教程永久可用
- 蓝奏云批量上传工具.zip
- python书籍 PDF
- 老男孩python项目实战
- Python.rar99111
- decision_tree_v2.py
- Python绝技运用Python成为顶级黑客.pdf
- python小波包文档及论文.zip
- Python黑帽子(黑客与渗透测试编程之
- FlaskWeb开发:基于Python的Web应用开发实
- Python基础教程第3版中英文源码.rar
- python数据结构与算法中文版.zip
- Python-冲顶大会芝士超人西瓜视频头脑
- time_series_forecasting_with_python.zip
- Python基础教程第三版PDF高清可复制.
- python编程从入门到实践.zip237878
- FlaskWeb开发:Python基于Web应用开发实战
- pythonBCRMDSJ.mobi
- 量化交易之路用Python做股票量化分析
- PYTHON自然语言处理中文版.pdf
- Python基础教程(第3版).rar
- GRAYHATPYTHON高清.英文.书签版.pdf
- Python简明教程第四版.rar
- Python编程:从入门到实践带书签完整
- Python基础教程(第3版).pdf109608
- vamei-从Python开始学编程.pdf
- 利用Python进行数据分析.pdf
- 小甲鱼零基础学python课后习题和答案
- Python编程:从入门到实践-PythonCrashC
评论
共有 条评论