资源简介

这是一个Java的爬虫项目,自己是用来爬去网站上的小说内容的。

资源截图

代码片段和文件信息

package com.etoak.crawl.link;

public interface linkFilter {
    public boolean accept(String url);
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2018-12-25 10:12  crawl\
     目录           0  2018-12-25 10:12  crawl\.idea\
     文件         622  2017-11-18 16:45  crawl\.idea\compiler.xml
     文件         138  2018-12-24 17:14  crawl\.idea\encodings.xml
     目录           0  2018-12-25 10:12  crawl\.idea\inspectionProfiles\
     目录           0  2018-12-25 10:12  crawl\.idea\libraries\
     文件         678  2017-11-18 16:55  crawl\.idea\libraries\Maven__com_googlecode_juniversalchardet_juniversalchardet_1_0_3.xml
     文件         560  2017-11-18 17:01  crawl\.idea\libraries\Maven__commons_codec_commons_codec_1_2.xml
     文件         615  2017-11-18 16:45  crawl\.idea\libraries\Maven__commons_httpclient_commons_httpclient_3_1.xml
     文件         596  2017-11-18 17:01  crawl\.idea\libraries\Maven__commons_logging_commons_logging_1_0_4.xml
     文件         479  2017-11-18 16:45  crawl\.idea\libraries\Maven__junit_junit_4_11.xml
     文件         556  2017-11-18 16:45  crawl\.idea\libraries\Maven__org_hamcrest_hamcrest_core_1_3.xml
     文件         509  2017-11-18 16:45  crawl\.idea\libraries\Maven__org_jsoup_jsoup_1_10_3.xml
     文件         439  2017-11-18 16:45  crawl\.idea\misc.xml
     文件         250  2017-11-18 16:45  crawl\.idea\modules.xml
     文件       20305  2018-12-24 19:19  crawl\.idea\workspace.xml
     文件        1518  2017-11-18 17:01  crawl\crawl.iml
     文件        1051  2018-12-24 17:15  crawl\pom.xml
     目录           0  2018-12-25 10:12  crawl\src\
     目录           0  2018-12-25 10:12  crawl\src\main\
     目录           0  2018-12-25 10:12  crawl\src\main\java\
     目录           0  2018-12-25 10:12  crawl\src\main\java\com\
     目录           0  2018-12-25 10:12  crawl\src\main\java\com\etoak\
     目录           0  2018-12-25 10:12  crawl\src\main\java\com\etoak\crawl\
     目录           0  2018-12-25 10:12  crawl\src\main\java\com\etoak\crawl\link\
     文件         107  2017-11-18 17:00  crawl\src\main\java\com\etoak\crawl\link\linkFilter.java
     文件        1780  2017-11-18 17:00  crawl\src\main\java\com\etoak\crawl\link\links.java
     目录           0  2018-12-25 10:12  crawl\src\main\java\com\etoak\crawl\main\
     文件        3311  2018-12-24 17:32  crawl\src\main\java\com\etoak\crawl\main\MyCrawler.java
     目录           0  2018-12-25 10:12  crawl\src\main\java\com\etoak\crawl\page\
     文件        1922  2018-12-24 17:32  crawl\src\main\java\com\etoak\crawl\page\Page.java
............此处省略38个文件信息

评论

共有 条评论