资源简介
网络爬取豆瓣电影前250,将结果写入excel表。通过写入文档,生成云文字展示。

代码片段和文件信息
# -*- coding: utf-8 -*-
#使用matplotlib与wordcloud,jieba,collections库
import matplotlib.pyplot as plt
#from scipy.misc import imread
from wordcloud import WordCloud#一个文本对应的词云
#import jieba#分词
#from collections import Counter
text = open(‘movie250.txt‘ ‘r‘ encoding=‘utf-8‘).read()
#text_jieba = list(jieba.cut(text))
#c = Counter(text_jieba) # 计数
#word = c.most_common(800) # 出现次数最多,取前500
wc = WordCloud(
font_path=‘C:\Windows\Fonts\SIMYOU.TTF‘ # 指定中文字体
background_color=‘black‘ # 设置背景颜色
max_words=2000 # 设置最大显示的字数
max_font_size=100 # 设置字体最大值
#min_font_size=40
height=500
width=1000
random_state=20 # 设置多少种随机状态,即多少种配色
)
#wc.generate_from_frequencies(dict(word)) # 生成词云
wc.generate_from_text(text)#按照空格生成云词
#splittext = jieba.cut(text cut_all = True)
#wc2 = (“ “.splittext)
wc.to_file(‘result.jpg‘)
# show
plt.imshow(wc)#将一个image显示在二维坐标轴
plt.axis(“off“)#坐标轴
plt.figure()#自定义画布大小
plt.show()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 3752 2019-01-11 21:01 movie250.txt
文件 346227 2019-07-07 11:59 python课程设计报告.docx
文件 129062 2019-01-09 10:15 result.jpg
文件 1181 2019-01-09 10:14 云文字.py
文件 3500 2019-01-09 00:24 网页爬取.py
文件 88064 2019-01-11 21:01 豆瓣高分电影250.xls
相关资源
- 二级考试python试题12套(包括选择题和
- pywin32_python3.6_64位
- python+ selenium教程
- PycURL(Windows7/Win32)Python2.7安装包 P
- 英文原版-Scientific Computing with Python
- 7.图像风格迁移 基于深度学习 pyt
- 基于Python的学生管理系统
- A Byte of Python(简明Python教程)(第
- Python实例174946
- Python 人脸识别
- Python 人事管理系统
- 基于python-flask的个人博客系统
- 计算机视觉应用开发流程
- python 调用sftp断点续传文件
- python socket游戏
- 基于Python爬虫爬取天气预报信息
- python函数编程和讲解
- Python开发的个人博客
- 基于python的三层神经网络模型搭建
- python实现自动操作windows应用
- python人脸识别(opencv)
- python 绘图(方形、线条、圆形)
- python疫情卡UN管控
- python 连连看小游戏源码
- 基于PyQt5的视频播放器设计
- 一个简单的python爬虫
- csv文件行列转换python实现代码
- Python操作Mysql教程手册
- Python Machine Learning Case Studies
- python获取硬件信息
评论
共有 条评论