资源简介
Python文章抓取,可以自动抓取并保存文章到txt文件,适合的网站有CSDN,简书,各大新闻网站的文章。
代码片段和文件信息
import wx
from newspaper import Article
from threading import *
from wx.lib.pubsub import pub
import webbrowser
url = ““
class WorkerThread(Thread):
“““Worker Thread Class.“““
def __init__(self notify_window):
“““Init Worker Thread Class.“““
Thread.__init__(self)
self._notify_window = notify_window
self._want_abort = 0
self.start()
def run(self):
global path
global url
a = Article(url language=‘zh‘) # Chinese
a.download()
a.parse()
# print(a.text)
try:
f = open(path + “\\Article.txt“ “a+“) # 以追加的方式
f.write(“url: “ + a.source_url)
f.write(“\n“ + a.title + “\n“)
f.write(str(a.text)) # 写完通过\n进行换行
except:
pass
wx.CallAfter(pub.sendMessage “title“ msg=str(a.title))
wx.CallAfter(pub.sendMessage “text“ msg=str(a.text))
class InfoPanel(wx.frame):
def
- 上一篇:飞思卡尔舵机程序
- 下一篇:MASTERCAM-西门子后处理
相关资源
- ios12.3驱动.zip
- 百万邮件系统多机版.rar
- learnopengl-cn-2018年5月更新.pdf
- zw_学习OpenCV(中文版).zip
- 1-300.pdf
- pyqt5windows生成二维工具源码
- KNN疾病预测算法Demo
- ABAQUS单元失效浅析(单元删除
- Jtopo+json格式数据代码
- 解多目标规划的单纯形代码
- TerraVolVoxelTerrainEngine2.1c.7z
- VA_X_Setup2118.rar
- CHS_Ha_PasswarekitEnterprise10.0.exe
- 无线通信AndreaGoldsmith杨鸿文等译.rar
- 迅捷PDF转换器破解版.rar
- 迅捷PDF编辑器破解版.rar
- 金字塔原理1清晰扫描版.pdf
- TeamViewer_11已激活+破解版+随意换ID.z
- FieldtheoryofGuidedwavesCollin__2nd.pdf
- 先进电气驱动的分析建模与控制[比
- IPC-J-STD033潮湿、回流焊敏感表面贴装
- 网络是怎样连接的_户根勤.pdf
- tesseract最新最全资料.rar
- 大话数据结构.epub
- iBATIS实战.pdf
- zw_new_smile-7110337-ImageAnimationTest.zip
- zw_jhn199388-9911706-基于51单片机都_自动
- zw_fan7983377-9600053-RecyclerViewDemo.zip
- zw_CHINA__.zip
- 我的第一本算法书+算法图解.zip
评论
共有 条评论