资源简介
网络爬取豆瓣电影前250,将结果写入excel表。通过写入文档,生成云文字展示。
代码片段和文件信息
# -*- coding: utf-8 -*-
#使用matplotlib与wordcloud,jieba,collections库
import matplotlib.pyplot as plt
#from scipy.misc import imread
from wordcloud import WordCloud#一个文本对应的词云
#import jieba#分词
#from collections import Counter
text = open(‘movie250.txt‘ ‘r‘ encoding=‘utf-8‘).read()
#text_jieba = list(jieba.cut(text))
#c = Counter(text_jieba) # 计数
#word = c.most_common(800) # 出现次数最多,取前500
wc = WordCloud(
font_path=‘C:\Windows\Fonts\SIMYOU.TTF‘ # 指定中文字体
background_color=‘black‘ # 设置背景颜色
max_words=2000 # 设置最大显示的字数
max_font_size=100 # 设置字体最大值
#min_font_size=40
height=500
width=1000
random_state=20 # 设置多少种随机状态,即多少种配色
)
#wc.generate_from_frequencies(dict(word)) # 生成词云
wc.generate_from_text(text)#按照空格生成云词
#splittext = jieba.cut(text cut_all = True)
#wc2 = (“ “.splittext)
wc.to_file(‘result.jpg‘)
# show
plt.imshow(wc)#将一个image显示在二维坐标轴
plt.axis(“off“)#坐标轴
plt.figure()#自定义画布大小
plt.show()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 3752 2019-01-11 21:01 movie250.txt
文件 346227 2019-07-07 11:59 python课程设计报告.docx
文件 129062 2019-01-09 10:15 result.jpg
文件 1181 2019-01-09 10:14 云文字.py
文件 3500 2019-01-09 00:24 网页爬取.py
文件 88064 2019-01-11 21:01 豆瓣高分电影250.xls
相关资源
- Python调用CAD生成多边形骨料
- 利用python爬虫爬取王者荣耀数据.py
- Fiona-1.8.6-cp37-cp37m-win_amd64.whl
- FP_Growth算法python实现.rar.rar
- PyQt4-4.11.4 win32 python3.4直接安装版(
- 基于python+mysql的图书管理系统,有g
- 多目标优化算法(一)NSGA2python版
- 小甲鱼教程Python全部源码软件包课件
- 西电数据挖掘作业——关联规则apri
- Python 八数码问题,可以直接运行
- python学生管理系统
- GA-BP算法的python实现
- 朴素贝叶斯过滤垃圾邮件源码及数据
- Python爬虫爬取豆瓣电影
- python调用cplex解决tsp问题
- 朴素贝叶斯算法python底层代码
- 一个简单Python 代码 爬取天气信息
- HMM预测天气,python实现
- [难度中级]Python前后端分离开发Vue+D
- python实现图像灰度共生矩阵
- python3零基础学习视频共20周带源码
- python采集阿里云监控sdk数据
- 进程管理实验
- 线性回归做房价预测 python源码
- python操作tsc打印机打印标签
- python处理word文件:win32com用法详解
- 基于python的小型搜索引擎
- HOG_SVM的python实现
- python编写的类似QQ的聊天工具
- scrapy 封装的爬取社保信息
评论
共有 条评论