资源简介
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。本实例通过Java爬取豆瓣电影数据,并通过文件流存入本地
代码片段和文件信息
package com.sun.test;
import java.io.File;
import java.io.FileWriter;
import java.io.Writer;
import java.util.List;
import org.apache.http.impl.client.HttpClientBuilder;
import org.apache.http.client.HttpClient;
import come.sun.bean.Films;
import come.sun.get.GetData;
public class Test {
public static void main(String[] args)throws Exception{
String url=“https://movie.douban.com/top250“;
HttpClientBuilder builder=HttpClientBuilder.create();
HttpClient client=builder.build();
List films=GetData.getData(client url);
File file=new File(“123.txt“);
Writer writer=new FileWriter(filetrue);
for(Films films2 : films){
writer.write(films2.toString()+“\n“);
}
writer.close();
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2019-08-30 19:18 JAVA爬豆瓣电影数据(文件流)\
文件 842 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.classpath
文件 940 2019-08-31 15:27 JAVA爬豆瓣电影数据(文件流)\.project
目录 0 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.settings\
文件 567 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.settings\.jsdtscope
文件 364 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.settings\org.eclipse.jdt.core.prefs
文件 572 2019-08-31 15:27 JAVA爬豆瓣电影数据(文件流)\.settings\org.eclipse.wst.common.component
文件 345 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.settings\org.eclipse.wst.common.project.facet.core.xm
文件 49 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.settings\org.eclipse.wst.jsdt.ui.superType.container
文件 6 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\.settings\org.eclipse.wst.jsdt.ui.superType.name
文件 11787 2019-08-30 19:19 JAVA爬豆瓣电影数据(文件流)\123.txt
目录 0 2019-08-29 20:54 JAVA爬豆瓣电影数据(文件流)\build\
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\com\
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\come\
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\come\sun\
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\come\sun\bean\
文件 1374 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\come\sun\bean\Films.class
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\come\sun\get\
文件 4207 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\come\sun\get\GetData.class
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\com\sun\
目录 0 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\com\sun\test\
文件 2026 2019-08-31 15:58 JAVA爬豆瓣电影数据(文件流)\build\classes\com\sun\test\Test.class
目录 0 2019-08-29 20:58 JAVA爬豆瓣电影数据(文件流)\src\
目录 0 2019-08-29 20:58 JAVA爬豆瓣电影数据(文件流)\src\com\
目录 0 2019-08-29 20:58 JAVA爬豆瓣电影数据(文件流)\src\come\
目录 0 2019-08-29 20:58 JAVA爬豆瓣电影数据(文件流)\src\come\sun\
目录 0 2019-08-29 20:58 JAVA爬豆瓣电影数据(文件流)\src\come\sun\bean\
文件 618 2019-08-29 21:33 JAVA爬豆瓣电影数据(文件流)\src\come\sun\bean\Films.java
目录 0 2019-08-29 20:58 JAVA爬豆瓣电影数据(文件流)\src\come\sun\get\
文件 2199 2019-08-30 19:17 JAVA爬豆瓣电影数据(文件流)\src\come\sun\get\GetData.java
............此处省略49个文件信息
相关资源
- java爬虫爬取当当网图书信息
- Java实现网路爬虫爬取新闻信息
- java爬虫需要的jar包
- 爬虫搜索简单的搜索引擎java爬虫搜索
- WebMagicJava爬虫实现,实现数据爬取,
- Java爬虫。。。。。
- java爬虫项目实战教学视频
- java爬虫完整代码
- Java爬虫获取网页表格数据保存到MyS
- Java爬虫完整.zip
- 很简易的java爬虫 可以爬取携程的航班
- 百度贴吧java爬虫
- JAVA爬虫批量网页文件
- JAVA爬虫项目源代码
- 基于java爬取网络图片并且保存到本地
- Java爬虫项目
- JAVA爬虫 javaReptile
- 豆瓣电影数据集(截至2019.3)
- Java 采集 豆瓣电影数据
- Java爬虫完整
- java爬虫Demo
- 爬取豆瓣电影Top250.zip
- jsoup爬虫demo
- Java爬虫案例
评论
共有 条评论