网络爬虫的设计与实现+毕业论文

大小: 652KB

文件类型: .doc

金币: 1

下载: 0 次

发布日期: 2021-06-12
语言: Java
标签:

高速下载

资源简介

网络爬虫是一种自动搜集互联网信息的程序。通过网络爬虫不仅能够为搜索引擎采集网络信息，而且可以作为定向信息采集器，定向采集某些网站下的特定信息，如招聘信息，租房信息等。本文通过JAVA实现了一个基于广度优先算法的多线程爬虫程序。本论文阐述了网络爬虫实现中一些主要问题：为何使用广度优先的爬行策略，以及如何实现广度优先爬行；为何要使用多线程，以及如何实现多线程；系统实现过程中的数据存储；网页信息解析等。通过实现这一爬虫程序，可以搜集某一站点的URLs，并将搜集到的URLs存入数据库。

资源截图

小图大图

代码片段和文件信息

上一篇：appcompat-v7-26.1.0.jar
下一篇：Photon org.eclipse.jface.text_3.13.0.v20180527-1819.jar修改版

共有条评论

网络爬虫的设计与实现+毕业论文

资源简介

资源截图

代码片段和文件信息

评论

相关资源