• 大小: 1.07MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-08-29
  • 语言: Java
  • 标签: java爬虫  

资源简介

基于java实现的java爬虫,是我学习java来练练手的,java基础入门的学生可以考虑参考一下

资源截图

代码片段和文件信息

package 网络爬虫;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


public class GetData {
public static void main(String[] args)
{
test1();
}
public static void test1()
{
try 
{
URL url = new URL(“http://www.qiushibaike.com/text/page/2/“);
URLConnection con = url.openConnection();
//补充:HttpClient封装了很多类 
Document document = Jsoup.connect(“http://www.qiushibaike.com/text/page/2/“).get();

Elements contents = document.select(“div.content-text“);

for(Element content : contents)
{
System.out.println(content.text());
}
} catch (MalformedURLException e) 
{
e.printStackTrace();
} catch (IOException e)
{
e.printStackTrace();
}
}


}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\
     文件         397  2017-08-12 10:12  暑假任务—爬虫系统\.classpath
     文件         403  2017-07-12 16:14  暑假任务—爬虫系统\.project
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\.settings\
     文件         598  2017-07-12 16:14  暑假任务—爬虫系统\.settings\org.eclipse.jdt.core.prefs
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\bin\
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\bin\网络爬虫\
     文件        1882  2017-09-10 00:09  暑假任务—爬虫系统\bin\网络爬虫\GetData.class
     文件        3609  2017-09-10 00:09  暑假任务—爬虫系统\bin\网络爬虫\MyNewTopic.class
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\bin\获取工作资源\
     文件        4676  2017-09-10 00:09  暑假任务—爬虫系统\bin\获取工作资源\DataDownUtil.class
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\bin\获取百度logo\
     文件        2934  2017-09-10 00:09  暑假任务—爬虫系统\bin\获取百度logo\GetLogo.class
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\bin\获取链接资源\
     文件        2701  2017-09-10 00:09  暑假任务—爬虫系统\bin\获取链接资源\WebSpider.class
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\lib\
     文件      300844  2017-07-11 15:38  暑假任务—爬虫系统\lib\jsoup-1.8.1.jar
     文件        4302  2017-07-15 11:24  暑假任务—爬虫系统\lib\新建文本文档.txt
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\src\
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\src\网络爬虫\
     文件         946  2017-07-15 15:38  暑假任务—爬虫系统\src\网络爬虫\GetData.java
     文件        2387  2017-07-13 17:31  暑假任务—爬虫系统\src\网络爬虫\MyNewTopic.java
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\src\获取工作资源\
     文件        3061  2017-07-19 01:07  暑假任务—爬虫系统\src\获取工作资源\DataDownUtil.java
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\src\获取百度logo\
     文件        1671  2017-07-19 01:07  暑假任务—爬虫系统\src\获取百度logo\GetLogo.java
     目录           0  2018-06-02 10:08  暑假任务—爬虫系统\src\获取链接资源\
     文件        1695  2017-07-18 15:15  暑假任务—爬虫系统\src\获取链接资源\WebSpider.java
     文件       73306  2017-07-13 21:39  暑假任务—爬虫系统\url.txt
     目录           0  2018-06-02 10:08  爬虫\
     目录           0  2018-06-02 10:08  爬虫2\
............此处省略90个文件信息

评论

共有 条评论