资源简介

《Python数据挖掘入门与实践 》 作者:Robert Layton (高清pdf版附代码及部分数据集,彩图)

资源截图

代码片段和文件信息

import os
import re
from mrjob.job import MRJob
from mrjob.step import MRStep

word_search_re = re.compile(r“[\w‘]+“)


class ExtractPosts(MRJob):

    post_start = False
    post = []

    def mapper(self key line):
        filename = os.environ[“map_input_file“]
        gender = filename.split(“.“)[1]
        try:
            docnum = int(filename[0])
        except:
            docnum = 8
        if filename.startswith(“51“):
            # remove leading and trailing whitespace
            line = line.strip()
            if line == ““:
                self.post_start = True
            elif line == “
“:
                self.post_start = False
                yield gender repr(“\n“.join(self.post))
                self.post = []
            elif self.post_start:
                self.post.append(line)



if __name__ == ‘__main__‘:
    ExtractPosts.run()

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       8196  2018-02-09 17:05  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\.DS_Store

     文件      14242  2015-05-28 09:33  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\.ipynb_checkpoints\ch1_affinity-checkpoint.ipynb

     文件       3367  2018-03-08 20:44  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\.ipynb_checkpoints\ch1_affinity_create-checkpoint.ipynb

     文件      13797  2015-05-28 09:33  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\.ipynb_checkpoints\ch1_oner_application-checkpoint.ipynb

     文件        606  2018-03-06 18:25  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\.ipynb_checkpoints\Untitled-checkpoint.ipynb

     文件       1000  2014-10-10 03:13  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\affinity_dataset.txt

     文件      13665  2018-03-08 20:45  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\ch1_affinity.ipynb

     文件       3367  2018-03-08 20:44  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\ch1_affinity_create.ipynb

     文件      14649  2018-03-06 20:46  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\ch1_oner_application.ipynb

     文件       1040  2018-03-06 18:38  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 1\Untitled.ipynb

     文件     434745  2015-06-28 15:31  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10 (Cluster Types)-checkpoint.ipynb

     文件      64766  2015-06-28 15:36  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10 Clusterer-checkpoint.ipynb

     文件    1100672  2015-06-28 15:34  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10 Image creation 10_02.png-checkpoint.ipynb

     文件         72  2015-06-28 15:29  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 10\.ipynb_checkpoints\Chapter 10-checkpoint.ipynb

     文件      78925  2015-06-28 15:40  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 10\Chapter 10 Clusterer.ipynb

     文件      58837  2015-06-28 15:17  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 11\Chapter 11 (CIFAR).ipynb

     文件      62409  2015-06-28 15:02  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 11\Chapter 11 (Theano and Lasagne).ipynb

     文件      38759  2015-06-28 15:22  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 12\CH12 MapReduce Basics.ipynb

     文件      10578  2015-05-08 19:56  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 12\Chapter 12 (NB Predict).ipynb

     文件       1730  2015-05-08 06:35  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 12\Chapter 12 (Test load).ipynb

     文件        882  2015-05-08 16:49  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 12\extract_posts.py

     文件       1986  2015-05-08 09:37  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 12\nb_predict.py

     文件       2021  2015-05-08 08:44  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 12\nb_train.py

     文件     128669  2015-05-28 10:08  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 2\.ipynb_checkpoints\Ionosphere Nearest Neighbour-checkpoint.ipynb

     文件     128256  2018-03-09 10:09  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 2\Ionosphere Nearest Neighbour.ipynb

     文件       3116  2018-03-08 22:07  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 2\ionosphere.names

     文件      76467  2018-03-08 22:06  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 2\ionosphere.txt

     文件      42423  2015-05-28 10:17  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 3\.ipynb_checkpoints\Basketball Results #2-checkpoint.ipynb

     文件      78859  2015-07-07 04:05  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 3\.ipynb_checkpoints\Basketball Results-checkpoint.ipynb

     文件      76963  2018-03-10 08:44  Python数据挖掘入门与实践(高清pdf版附彩图代码及部分数据集)\Code_REWRITE\Chapter 3\Basketball Results.ipynb

............此处省略64个文件信息

评论

共有 条评论