资源简介
基于jsoup解析网页获取图片链接并下载的例子,关于下载部分有详细注释,其余地方也有方法注释,若是想用Java做爬虫初学的话,可以看看,忘有用。(附源码,pom文件,和jsoup的jar包)免去你再找了

代码片段和文件信息
package com.img.p;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
public class Download {
public void downloadList(String pathList list) {
try {
for (ImgPojo imgPojo : list) downloadLocal(pathimgPojo.getId() imgPojo.getSrc());
} catch (Exception e) {
e.printStackTrace();
}
}
public void downloadLocal(String pathString name String imgUrl) throws Exception {
// new一个URL对象
URL url = new URL(imgUrl);
// 打开链接
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
// 设置请求方式为“GET“
conn.setRequestMethod(“GET“);
// 超时响应时间为5秒
conn.setConnectTimeout(5 * 1000);
// 通过输入流获取图片数据
InputStream inStream = conn.getInputStream();
// 得到图片的二进制数据,以二进制封装得到数据,具有通用性
byte[] data = readInputStream(inStream);
// new一个文件对象用来保存图片,默认保存当前工程根目录
File imageFile = new File(path+“\\id=“+name+“.jpg“);
// 创建输出流
FileOutputStream outStream = new FileOutputStream(imageFile);
// 写入数据
outStream.write(data);
// 关闭输出流
outStream.close();
System.out.println(name+“下载ok“);
}
public byte[] readInputStream(InputStream inStream) throws Exception {
ByteArrayOutputStream outStream = new ByteArrayOutputStream();
// 创建一个Buffer字符串
byte[] buffer = new byte[1024];
// 每次读取的字符串长度,如果为-1,代表全部读取完毕
int len = 0;
// 使用一个输入流从buffer里把数据读取出来
while ((len = inStream.read(buffer)) != -1) {
// 用输出流往buffer里写入数据,中间参数代表从哪个位置开始读,len代表读取的长度
outStream.write(buffer 0 len);
}
// 关闭输入流
inStream.close();
// 把outStream里的数据写入内存
return outStream.toByteArray();
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2211 2018-11-03 18:30 爬虫(p站图片)\Download.java
文件 5081 2018-11-04 13:58 爬虫(p站图片)\FromP.java
文件 671 2018-11-04 13:58 爬虫(p站图片)\ImgPojo.java
文件 395748 2018-11-04 17:00 爬虫(p站图片)\jsoup-1.11.3.jar
文件 254 2018-11-04 17:01 爬虫(p站图片)\jsoup_pom.txt
文件 3006 2018-11-04 14:43 爬虫(p站图片)\Myfr
文件 202 2018-11-04 17:06 爬虫(p站图片)\需知.txt
目录 0 2018-11-04 17:01 爬虫(p站图片)
----------- --------- ---------- ----- ----
407173 8
相关资源
- java串口通信全套完整代码-导入eclip
- jsonarray所必需的6个jar包.rar
- 三角网构TIN生成算法,Java语言实现
- java代码编写将excel数据导入到mysql数据
- Java写的cmm词法分析器源代码及javacc学
- JAVA JSP公司财务管理系统 源代码 论文
- JSP+MYSQL旅行社管理信息系统
- 推荐算法的JAVA实现
- 基于Java的酒店管理系统源码(毕业设
- java-图片识别 图片比较
- android毕业设计
- java23种设计模式+23个实例demo
- java Socket发送/接受报文
- JAVA828436
- java界面美化 提供多套皮肤直接使用
- 在线聊天系统(java代码)
- 基于Java的图书管理系统807185
- java中实现将页面数据导入Excel中
- java 企业销售管理系统
- java做的聊天系统(包括正规课程设计
- Java编写的qq聊天室
- 商店商品管理系统 JAVA写的 有界面
- JAVA开发聊天室程序
- 在linux系统下用java执行系统命令实例
- java期末考试试题两套(答案) 选择(
- JAVA3D编程示例(建模、交互)
- Java 文件加密传输
- java做的房产管理系统
- 基于jsp的bbs论坛 非常详细
- [免费]java实现有障碍物的贪吃蛇游戏
评论
共有 条评论