资源简介
实现功能:1、抓取知乎上关注人数超过2000人数的话题、相应连接、父子话题,并存入数据库。 2、抓取某一话题的回答,可以设置赞的最低数才会被抓取,并存入数据库。 3、将感兴趣的内容获取出来发送qq邮件。
代码片段和文件信息
# -*- coding: utf-8 -*-
import datetimetime
import codecs
import smtplib
from email.mime.text import MIMEText
from email.mime.image import MIMEImage
from email.mime.multipart import MIMEMultipart
from email.mime.application import MIMEApplication
import MySQLdb
from zhihu.spiders.zhihu_spider import *
def zan_cmp(a b):
return -cmp(a[1] b[1])
class GetInteresting:
def __init__(self):
self.conn = MySQLdb.connect(
host=‘localhost‘
user = ‘root‘
passwd = ‘‘
port = 3306)
self.cur = self.conn.cursor()
self.conn.select_db(‘zhihu‘)
self.receiver = ZhihuSpider.my_parse.receiver
def read_answer(self lst):
order = 1
l = len(lst)
file_name = ‘%s.txt‘ % ZhihuSpider.my_parse.topic
f = codecs.open(file_name ‘w‘)
msg = MIMEMultipart(“related“)
body = ‘‘
for answer in lst:
f.write(‘%s个赞\n‘ % answer[1])
f.write(‘时间%s\n‘ % time.strftime(‘%Y-%m-%d %H:%M:%S‘ time.gmtime(answer[2])))
f.write(‘%s%s‘ % (
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2015-07-07 21:21 zhihu\
文件 252 2015-06-22 19:02 zhihu\scrapy.cfg
目录 0 2015-07-07 21:21 zhihu\zhihu\
文件 123 2015-07-07 21:21 zhihu\zhihu\config.ini
文件 3630 2015-07-07 21:18 zhihu\zhihu\getInteresting.py
文件 4476 2015-07-07 21:03 zhihu\zhihu\getInteresting.pyc
文件 486 2015-06-23 22:14 zhihu\zhihu\items.py
文件 502 2015-06-23 22:39 zhihu\zhihu\items.pyc
文件 2711 2015-07-07 21:02 zhihu\zhihu\pipelines.py
文件 2655 2015-07-07 21:03 zhihu\zhihu\pipelines.pyc
文件 817 2015-06-22 20:50 zhihu\zhihu\settings.py
文件 598 2015-06-22 20:50 zhihu\zhihu\settings.pyc
目录 0 2015-07-07 21:21 zhihu\zhihu\spiders\
文件 3307 2015-06-23 21:07 zhihu\zhihu\spiders\rotate_useragent.py
文件 3255 2015-06-23 21:08 zhihu\zhihu\spiders\rotate_useragent.pyc
文件 1756 2015-07-07 21:03 zhihu\zhihu\spiders\zhihu_spider.py
文件 2114 2015-07-07 21:03 zhihu\zhihu\spiders\zhihu_spider.pyc
文件 161 2015-06-17 16:03 zhihu\zhihu\spiders\__init__.py
文件 143 2015-06-22 19:13 zhihu\zhihu\spiders\__init__.pyc
文件 1598 2015-07-04 15:34 zhihu\zhihu\util.py
文件 1856 2015-07-04 15:34 zhihu\zhihu\util.pyc
文件 0 2015-06-17 16:03 zhihu\zhihu\__init__.py
文件 135 2015-06-22 19:13 zhihu\zhihu\__init__.pyc
文件 200 2015-07-07 21:10 zhihu\zhihu\互联网行业招聘.txt
目录 0 2015-07-07 21:22 zhihu_topic\
文件 1076 2015-07-07 21:22 zhihu_topic\getInteresting.py
文件 264 2015-06-30 20:26 zhihu_topic\scrapy.cfg
文件 530337 2015-07-04 15:27 zhihu_topic\topic.txt
目录 0 2015-07-07 21:21 zhihu_topic\zhihu_topic\
文件 432 2015-06-30 20:46 zhihu_topic\zhihu_topic\items.py
文件 544 2015-06-30 20:52 zhihu_topic\zhihu_topic\items.pyc
............此处省略13个文件信息
- 上一篇:解魔方算法
- 下一篇:Ansoft Maxwell 40W 无刷直流电机
相关资源
- 模式分析的核方法中文版和英文版合
- zw_qq_41143492-10381309-学生考试系统.zip
- zw_feifan50-9720417-MissionPlanner1.3.32PlayUA
- zw_weixin_42810059-10567648-数学分析考研笔
- 刺客.rar
- zw_DXF转G代码.zip
- 彩票开发源码.zip
- 斯坦福-IntroductiontoRobotics.zip
- zw_gephi-0.8.2-beta.setup.zip
- zw_嵌入式网络那些事(完整中文版)
- zw_WINDOWSAPI程序设计参考大全.zip
- zw_ssm-crm-new.zip
- zw_SolidWorks2014中文版基础教程.zip
- zw_Altera官方元件封装库.zip
- zw_AutofacIOC.zip
- zw_ionicDemo.zip
- Location虚拟定位ios12.1破解版.zip
- 流体模拟插件NextLimitRealFlowC4D2.6.5.00
- 老虎淘宝客v6.0.15.zip
- iSkysoft Video Converter Ultimate 5.1简体中文
- 20180704全彩种彩票网站源码.rar
- 暗影2MAC12系统安装clover.zip
- fdt_4_09_03.exe
- pkg-win.zip
- PRML最全资料集合.zip
- 数据可视化驾驶舱.zip
- 李晓峰通信原理.zip
- 图解西门子S71200PLC入门到实践(清晰
- AI拓客商家联盟V2.1.3前端+后端.rar
- echarts大数据领导仓demo.rar
评论
共有 条评论