• 大小: 488KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-05-28
  • 语言: Python
  • 标签: python  

资源简介

网络爬取豆瓣电影前250,将结果写入excel表。通过写入文档,生成云文字展示。

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-
#使用matplotlib与wordcloud,jieba,collections库
import matplotlib.pyplot as plt
#from scipy.misc import imread
from wordcloud import WordCloud#一个文本对应的词云
#import jieba#分词
#from collections import Counter

text = open(‘movie250.txt‘ ‘r‘ encoding=‘utf-8‘).read()
#text_jieba = list(jieba.cut(text))
#c = Counter(text_jieba)  # 计数
#word = c.most_common(800)  # 出现次数最多,取前500

wc = WordCloud(
    font_path=‘C:\Windows\Fonts\SIMYOU.TTF‘  # 指定中文字体
    background_color=‘black‘  # 设置背景颜色
    max_words=2000  # 设置最大显示的字数
    max_font_size=100  # 设置字体最大值
    #min_font_size=40
    height=500
    width=1000
    random_state=20  # 设置多少种随机状态,即多少种配色

#wc.generate_from_frequencies(dict(word))  # 生成词云
wc.generate_from_text(text)#按照空格生成云词
#splittext = jieba.cut(text cut_all = True)
#wc2 = (“ “.splittext)
wc.to_file(‘result.jpg‘)

# show
plt.imshow(wc)#将一个image显示在二维坐标轴
plt.axis(“off“)#坐标轴
plt.figure()#自定义画布大小
plt.show()

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        3752  2019-01-11 21:01  movie250.txt
     文件      346227  2019-07-07 11:59  python课程设计报告.docx
     文件      129062  2019-01-09 10:15  result.jpg
     文件        1181  2019-01-09 10:14  云文字.py
     文件        3500  2019-01-09 00:24  网页爬取.py
     文件       88064  2019-01-11 21:01  豆瓣高分电影250.xls

评论

共有 条评论