资源简介
python使用jieba 分词
代码片段和文件信息
#打开“三国演义.txt”文件,读取文件内容
import jieba #导入jieba分词
f = open(“三国演义.txt“ “r“ encoding=‘utf-8‘) #打开文件
txt = f.read() #读取文件内容
#分词
words = jieba.lcut(txt) #将句子拆分为词语保存到列表中
#统计
counts = {} #建立空字典,用于存储词和出现次数
for word in words:
if len(word) == 1: #单字的词语忽略不计
continue
else:
counts[word] = counts.get(word0) + 1 #出现次数+1
#排序
items = list(counts.items()) #字典转化为列表后才可以排序
items.sort(key = lambda x:x[1] reverse = True) #对列表items按“次数”降序排序
#输出前20个元素的值
for i in range(20):
print (items[i][0] items[i][1])
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 81 2020-04-22 07:50 三国演义.txt
文件 956 2020-04-22 07:43 sanguo.py
相关资源
- python实现贪吃蛇小游戏(面向对象)
- Python实现EXCEL图标自动生成
- 批量替换文件夹下*.py文件里面的pri
- python一个打砖块的小游戏
- python实验指导书 图文高清版
- python主动安装第三方库
- python爬取豆瓣top250电影信息
- python绘制 大蟒蛇
- python小程序(数组排序)
- Python去水印(基于cv2)
- Python 数据结构入门 - 二叉搜索树(
- python空心电感计算器
- python除法.docx
- 抽奖背后的秘密(python抽奖逻辑)
- 绘制统计学直方图茎叶图(matplotlib)
- python求解标准差
- svm-simple.py(matplotlib)
- python数据分析与处理
- 利用Python将照片在Excel中利用点阵图显
- pygame贪吃蛇
- python turtle 跳房子
- python 人群计数
- 自动化测试(基于pytest)
- 基于树莓派的动态图像对比(py3_ob<
- Python调用第三方API换脸
- “去哪儿吃”帮你选餐厅(python代码
- python 控制台登陆密码验证
- KNN算法的Python实现(datingrecd.ipynb)
- python核心编程第二版-习题答案
- python爬取笔趣阁小说
评论
共有 条评论