资源简介
内含7kb的停用词词典、源码、测试数据;词典共收录了1208个常见停用词,源码基于python3,下载解压后即可运行测试数据,且效率非常高。欢迎下载使用,如在使用过程中有任何问题,欢迎留言交流。
![](http://www.nz998.com/pic/61438.jpg)
代码片段和文件信息
from time import sleep
f1 = open(‘./data.txt‘‘r‘) #需要去除停用词的数据
f2 = open(‘./stop_words.txt‘‘r‘) #导入停用词词典
f3 = open(‘./result.txt‘‘w‘encoding=‘utf-8‘) #存储结果
s = f2.read().split(‘\n‘)
for line in f1:
line = line.strip(‘\n‘).strip(‘ ‘)
line = line.split(‘ ‘)
sw = ‘‘
for ch in line:
flag = 0
for sh in s:
if sh==ch:
flag = 1
break
if flag==0:
sw = sw + ch + ‘ ‘
f3.write(sw + ‘\n‘)
f1.close()
f2.close()
f3.close()
print(‘\n[--finished--]‘)
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 533 2019-01-29 16:23 DropStopWords\DropStopWords.py
文件 73 2019-01-29 16:23 DropStopWords\data.txt
文件 28 2019-01-29 16:23 DropStopWords\result.txt
文件 7041 2018-11-23 23:04 DropStopWords\stop_words.txt
目录 0 2019-01-29 16:23 DropStopWords\
- 上一篇:高效爬取微博数据python3实现
- 下一篇:PCV---python工具包.zip
相关资源
- pywin32_python3.6_64位
- A Byte of Python(简明Python教程)(第
- Python高級編程源代码
- 《PYTHON QT GUI快速编程 PYQT编程指南》
- python编程:入门到实践 源代码
- 餐厅管理器源代码
- python3环境搭建教程.ppt
- Python源代码:以web方式管理自己的常
- 《Python从小白到大牛》源代码
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- python3.5.2.chm官方文档
- python3.5.4_windows下32与64位安装包
- python数据分析源代码Ivan Idris
- Python项目案例开发从入门到实战源代
- GitHack-python3.zip
- Python3.x+PyQtChart实现数据可视化界面
- python3根据模板图片批量自动制作个性
- 《机器学习实战》源代码Python3
- Python3.5.2的IDLE汉化版计算机等级考试
- 《Python语言程序设计基础第二版PDF+课
- python3.5 百度ai人脸识别
- python编程从入门到实践的案例和动手
- python3实现的国密SM2+SM3
- Mofan莫烦python全部教程代码
- Python语言程序设计基础 第二版 pdf书籍
- python,pygame开发的太空大战源代码
- python100道面试题及解答全部答案 pyc
- #python3.3关于Tk中的Treeview使用方法
- Python3.x+Pyqt5实现界面编程浏览网页
评论
共有 条评论