资源简介
使用了Java原生的regex进行爬虫的的编写,没有使用jsoup等工具,在字段匹配方面使用的是正则表达式;同样也做了使用jsoup与不用正则表达式的代码,整理后会发上来。
代码片段和文件信息
import java.io.IOException;
import java.util.ArrayList;
public class chong {
public static void main(String args[]) throws IOException {
//定义即将访问的链接
String url = “https://www.zhihu.com/explore/recommendations“;
// 访问链接并获取页面内容
String content = spider.getinfo(url);
// 获取编辑推荐
ArrayList myZhihu = spider.getzhihu(content);
// 打印结果
System.out.println(myZhihu);
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 529 2018-07-25 19:09 pachong\src\main\java\chong.java
目录 0 2018-07-25 19:07 pachong\
目录 0 2018-07-25 19:07 pachong\.gradle\
目录 0 2018-07-25 19:07 pachong\.gradle\4.0\
目录 0 2018-07-25 19:07 pachong\.gradle\4.0\fileChanges\
文件 1 2018-05-07 13:15 pachong\.gradle\4.0\fileChanges\last-build.bin
目录 0 2018-07-25 19:07 pachong\.gradle\4.0\fileContent\
文件 17 2018-05-07 13:15 pachong\.gradle\4.0\fileContent\fileContent.lock
目录 0 2018-07-25 19:07 pachong\.gradle\4.0\fileHashes\
文件 19197 2018-05-07 13:14 pachong\.gradle\4.0\fileHashes\fileHashes.bin
文件 17 2018-05-07 13:15 pachong\.gradle\4.0\fileHashes\fileHashes.lock
目录 0 2018-07-25 19:07 pachong\.gradle\4.0\taskHistory\
文件 19442 2018-05-07 13:14 pachong\.gradle\4.0\taskHistory\fileSnapshots.bin
文件 21131 2018-05-07 13:14 pachong\.gradle\4.0\taskHistory\taskHistory.bin
文件 17 2018-05-07 13:15 pachong\.gradle\4.0\taskHistory\taskHistory.lock
目录 0 2018-07-25 19:07 pachong\.gradle\buildOutputCleanup\
文件 0 2018-05-06 09:12 pachong\.gradle\buildOutputCleanup\built.bin
文件 51 2018-05-06 09:12 pachong\.gradle\buildOutputCleanup\cache.properties
文件 2 2018-05-07 13:15 pachong\.gradle\buildOutputCleanup\cache.properties.lock
目录 0 2018-07-25 19:07 pachong\.idea\
文件 282 2018-05-06 09:16 pachong\.idea\compiler.xm
文件 564 2018-05-06 09:16 pachong\.idea\gradle.xm
目录 0 2018-07-25 19:07 pachong\.idea\inspectionProfiles\
目录 0 2018-07-25 19:07 pachong\.idea\libraries\
文件 491 2018-05-06 09:16 pachong\.idea\libraries\Gradle__junit_junit_4_12.xm
文件 547 2018-05-06 09:16 pachong\.idea\libraries\Gradle__org_hamcrest_hamcrest_core_1_3.xm
文件 258 2018-05-06 09:11 pachong\.idea\misc.xm
目录 0 2018-07-25 19:07 pachong\.idea\modules\
文件 789 2018-05-06 09:16 pachong\.idea\modules\pachong.iml
文件 906 2018-05-06 09:16 pachong\.idea\modules\pachong_main.iml
文件 1224 2018-05-06 09:16 pachong\.idea\modules\pachong_test.iml
............此处省略39个文件信息
- 上一篇:JAVA中GUI简单登陆和注册实现
- 下一篇:Android 文件上传Demo
相关资源
- java快捷键工具箱(快速打开本地应用
- java 飞机大战(面向对象源码)
- java 跑马程序
- 飞机大战小游戏源码(java Swing)
- java入门137:清理指定目录下的.tmp文件
- java删除文件夹中所有文件
- java重命名RAR压缩包中文件
- java显示指定类型的文件(按文件后缀
- java控制台(命令行)输入交互
- java 自定义表头(列头增加icon图标)
- Java入门-控件的排布(2).zip
- Java入门-显示多种字体(8).zip
- Java入门-使用表格显示查询结果(77)
- Java入门-取得目录文件信息(50).zi
- Java入门-zip压缩包查看程序(56).zi
- Java入门-阴影文字(26).zip
- Java入门-彩色列表框(4).zip
- Java入门-程序启动界面(20).zip
- Java入门-常用图形的绘制与填充(47)
- Java入门-从压缩包中提取文件(55)
- Java入门-滑杆演示(19).zip
- Java入门-图片倒影(34).zip
- Java入门-3D文字(27).zip
- Java入门-移动的遮照效果(45).zip
- Java入门-自定义光标(23).zip
- Java入门-图片火焰效果(32).zip
- Java入门-简单的文本编辑器(12).zi
- Java入门-产生自己的控件(1).zip
- Java入门-圆形的按钮(5).zip
- Java入门-不规则图形的绘制(48).zi
评论
共有 条评论