python爬取豆瓣电影源码+报告.zip

大小: 488KB

文件类型: .zip

金币: 2

下载: 0 次

发布日期: 2021-05-28
语言: Python
标签: python

高速下载

资源简介

网络爬取豆瓣电影前250，将结果写入excel表。通过写入文档，生成云文字展示。

资源截图

小图大图

代码片段和文件信息

# -*- coding: utf-8 -*-
#使用matplotlib与wordcloud，jieba，collections库
import matplotlib.pyplot as plt
#from scipy.misc import imread
from wordcloud import WordCloud#一个文本对应的词云
#import jieba#分词
#from collections import Counter

text = open（‘movie250.txt‘ ‘r‘ encoding=‘utf-8‘）.read（）
#text_jieba = list（jieba.cut（text））
#c = Counter（text_jieba）  # 计数
#word = c.most_common（800）  # 出现次数最多，取前500

wc = WordCloud（
    font_path=‘C:\Windows\Fonts\SIMYOU.TTF‘  # 指定中文字体
    background_color=‘black‘  # 设置背景颜色
    max_words=2000  # 设置最大显示的字数
    max_font_size=100  # 设置字体最大值
    #min_font_size=40
    height=500
    width=1000
    random_state=20  # 设置多少种随机状态，即多少种配色
）
#wc.generate_from_frequencies（dict（word））  # 生成词云
wc.generate_from_text（text）#按照空格生成云词
#splittext = jieba.cut（text cut_all = True）
#wc2 = （“ “.splittext）
wc.to_file（‘result.jpg‘）

# show
plt.imshow（wc）#将一个image显示在二维坐标轴
plt.axis（“off“）#坐标轴
plt.figure（）#自定义画布大小
plt.show（）

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        3752  2019-01-11 21:01  movie250.txt
     文件      346227  2019-07-07 11:59  python课程设计报告.docx
     文件      129062  2019-01-09 10:15  result.jpg
     文件        1181  2019-01-09 10:14  云文字.py
     文件        3500  2019-01-09 00:24  网页爬取.py
     文件       88064  2019-01-11 21:01  豆瓣高分电影250.xls

上一篇：利用python爬虫爬取王者荣耀数据.py
下一篇：Python调用CAD生成多边形骨料

共有条评论

python爬取豆瓣电影源码+报告.zip

资源简介

资源截图

代码片段和文件信息

评论

相关资源