资源简介
java课程设计,java jsoup 爬取1688网站信息,详细例子,需要的依赖也有
代码片段和文件信息
package com.test;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
* java jsoup 爬取1688网站信息,详细例子
* @author 原创 http://www.javakcsj.com/
* @date2018-8-19
*/
public class DoGet {
public static void main(String[] args) throws IOException {
DoGet t = new DoGet();
t.beginOne();
// t.beginTwo();
}
public void beginOne() throws IOException{
String[] list = new String[]{
“https://weiqufood.1688.com/page/offerlist.htm?spm=a2615.2177701.0.0.3ce1bb3dwMLc39“
};
for (int j = 0; j < list.length; j++) {
Document doc = Jsoup.connect(list[j]).data(“query“ “Java“)
.userAgent(“Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0; BIDUBrowser 2.x)“) // 设置 User-Agent
.timeout(30000).get();
Elements es = doc.select(“div.image“);
Element e = null;
for (int i = 0; i < es.size(); i++) {
e = es.get(i);
String a =e.select(“a“).attr(“title“);
String b = e.select(“a“).attr(“href“);
System.out.println(a);
System.out.println(b);
}
}
}
public void beginTwo() throws IOException{
Document doc = Jsoup.connect(“https://detail.1688.com/offer/535597877009.html?spm=a2615.7691456.0.0.QyqIYA“).data(“query“ “Java“)
.userAgent(“Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0; BIDUBrowser 2.x)“) // 设置 User-Agent
.timeout(30000).get();
// Map cookies = null;
// Response res = Jsoup.connect(“http://www.chengmi.com/shanghai“).data(“query“ “Java“)
// .userAgent(“Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0; BIDUBrowser 2.x)“) // 设置 User-Agent
// .timeout(30000).execute();
// cookies = res.cookies();
// System.out.println(cookies);
// System.out.println(doc.toString());
// if(1==1){
// return;
// }
Elements es = doc.select(“tr.price“).select(“span.value“);
Element e = null;
//获取到的价格 三个
String jiage=““;
String shuliangfw=““;
for (int i = 0; i < es.size(); i++) {
e = es.get(i);
String price = e.html();
System.out.println(price);
jiage+=“@“+price;
}
//价格对应的数量
es = doc.select(“tr.amount“).select(“span.value“);
for (int i = 0; i < es.size(); i++) {
e = es.get(i);
String amount = e.html();
System.out.println(amount);
shuliangfw+=“@“+amount;
}
System.out.println(“--“+jiage);
System.out.println(“--“+shuliangfw);
//商品种类和可售数量
String guige=““;
String shuliang=““;
es = doc.select(“div.d-content“);
for (int i = 0; i < es.size(); i++) {
e = es.get(i);
String abc=““;
Elements ess = e.select(“td.name“).select(“span“);//包装规格,用来批示多少包起售
for (int j = 0; j < ess.size(); j++) {
Element e3 = ess.get(j);
if(j==0){
guige+=““+e3.html();
abc+=““+e3.html();
}else{
guige+=“@“+e3.html();
abc+=“@“+e3.html();
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 122931 2018-08-19 10:58 java jsoup 爬取1688网站信息,详细例子\2018-08-19_105826.jpg
文件 6065 2018-08-19 10:56 java jsoup 爬取1688网站信息,详细例子\DoGet.java
文件 113 2018-07-30 16:21 java jsoup 爬取1688网站信息,详细例子\java课程设计网提供免费案例报告论文下载.html.url
文件 315321 2018-08-15 10:33 java jsoup 爬取1688网站信息,详细例子\jsoup-1.8.3.jar
目录 0 2018-08-19 10:59 java jsoup 爬取1688网站信息,详细例子
----------- --------- ---------- ----- ----
444430 5
相关资源
- 阿里巴巴Java开发手册V1.0.2
- 2018年最新java大数据基于storm开发实时
- 基于java的倒排索引
- JAVA实现万年历小程序
- 北大青鸟S2JAVA门禁系统
- java面试题题库全
- Java通过JNA调用TSCLIB.dll控制热敏打印机
- Java Web 三层架构详解
- JAVA拿火柴小游戏
- java 生成word 的第三方控件
-
xm
l-apis.jar包 - 多线程web服务器 附实验报告 java
- 网络五子棋游戏java socket swing 小项目
- java实现js、css、图片合并到html文件
- Java-WebSocket-jar
- 基于JAVA的论坛源码(J2EE 毕业设计)
- pos机java调用程序demo(基于dll调用)
- Python AES和Java AES/ECB/PKCS5Padding互转
- csv文件读下用的jar包
- java解压缩文件文件夹
- java药品管理系统
- stm32cubeMX_v4.27及f4HAL库包及所需要的
- java网页视频播放
- JAVA串口助手
- 华为Java编程规范试题2(含答案)
- JAVA的JAR或Class生成Delphi的Native Bridge
- 解析wkt数据
- java Rest接口服务端简单式Java后台各类
- Java Service Wrapper部署说明
- java类外文翻译
评论
共有 条评论