资源简介
58同城-赶集-智联招聘-51job企业数据采集程序源码,采集后的数据可筛选,可生成execl,可把图片形式的电话号码采集下来
代码片段和文件信息
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Calendar;
import java.util.Date;
import java.util.linkedHashSet;
import java.util.List;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.http.NameValuePair;
import org.apache.http.message.BasicNameValuePair;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.TypeReference;
import com.jfinal.util.PathUtil;
import collect.core.CoreConstant;
import collect.httpclient.CoachCollect;
import collect.httpclient.HttpClientCode;
import collect.model.CollectData;
import collect.plugin.GanjiPlugin;
import collect.plugin.Job51Plugin;
import collect.plugin.ZhaopinPlugin;
public class Test {
// private String fetchImageViaHttp(URL imgUrl) throws IOException {
// String sURL = imgUrl.toString();
// String imgFile = imgUrl.getPath();
// HttpURLConnection cnx = (HttpURLConnection)imgUrl.openConnection();
// String uri = null;
// try{
// cnx.setAllowUserInteraction(false);
// cnx.setDoOutput(true);
// cnx.addRequestProperty(“Cache-Control“ “no-cache“);
//
// if(request.getHeader(“user-agent“)!= null){
// cnx.addRequestProperty(“User-Agent“ request.getHeader(“user-agent“));
// }else{
// cnx.addRequestProperty(“User-Agent“ user_agent);
// }
// cnx.addRequestProperty(“Referer“ sURL.substring(0 sURL.indexOf(‘/‘ sURL.indexOf(‘.‘))+1));
// cnx.connect();
// if(cnx.getResponseCode() != HttpURLConnection.HTTP_OK)
// return null;
// InputStream imgData = cnx.getInputStream();
//
// String ext = FilenameUtils.getExtension(imgFile).toLowerCase();
// if(!“jpg“.equalsIgnoreCase(ext)
// &&!“png“.equalsIgnoreCase(ext)
// &&!“gif“.equalsIgnoreCase(ext)
// &&!“bmp“.equalsIgnoreCase(ext))
// ext = “jpg“;
// uri = img_path+Tools.rand()+‘.‘+ ext;
// File fileDest = new File(application.getRealPath(uri));
// if(!fileDest.getParentFile().exists())
// fileDest.getParentFile().mkdirs();
// FileOutputStream fos = new FileOutputStream(fileDest);
// try{
// IOUtils.copy(imgData fos);
// }finally{
// IOUtils.closeQuietly(imgData);
// IOUtils.closeQuietly(fos);
// }
// }finally{
// cnx.disconnect();
// }
// return uri;
// }
public static String dtime(long s){
try {
SimpleDateFormat fTime = new SimpleDateFormat(“yyyy-MM-dd HH:mm:ss“);
return fTime.format(s);
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
return null;
}
}
private static String detectWebRootPath() {
try {
String p
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 727 2012-11-22 11:50 reptile\.classpath
文件 1040 2012-10-15 10:30 reptile\.project
文件 500 2012-10-15 10:30 reptile\.settings\.jsdtscope
文件 364 2012-10-15 10:30 reptile\.settings\org.eclipse.jdt.core.prefs
文件 472 2012-10-15 10:30 reptile\.settings\org.eclipse.wst.common.component
文件 305 2012-11-22 10:54 reptile\.settings\org.eclipse.wst.common.project.facet.core.xm
文件 49 2012-10-15 10:30 reptile\.settings\org.eclipse.wst.jsdt.ui.superType.container
文件 6 2012-10-15 10:30 reptile\.settings\org.eclipse.wst.jsdt.ui.superType.name
文件 4647 2013-07-16 21:22 reptile\build\classes\collect\config\AppConfig.class
文件 315 2013-07-16 21:22 reptile\build\classes\collect\controller\ba
文件 1204 2013-07-16 21:22 reptile\build\classes\collect\controller\DefaultController.class
文件 8398 2013-07-16 21:22 reptile\build\classes\collect\controller\MainController.class
文件 581 2013-07-16 21:22 reptile\build\classes\collect\core\CoreConstant.class
文件 3699 2013-07-16 21:22 reptile\build\classes\collect\core\FreemarkGenerate.class
文件 161 2013-07-16 21:22 reptile\build\classes\collect\core\IReptilePlugin.class
文件 9112 2013-07-16 21:22 reptile\build\classes\collect\httpclient\CoachCollect.class
文件 7988 2013-07-16 21:22 reptile\build\classes\collect\httpclient\HttpClientCode.class
文件 1533 2013-07-16 21:22 reptile\build\classes\collect\httpclient\HttpSingleton.class
文件 1257 2013-07-16 21:22 reptile\build\classes\collect\httpclient\Verification.class
文件 1319 2013-07-16 21:22 reptile\build\classes\collect\model\Coach.class
文件 1350 2013-07-16 21:22 reptile\build\classes\collect\model\CoachConfig.class
文件 481 2013-07-16 21:22 reptile\build\classes\collect\model\CoachImg.class
文件 485 2013-07-16 21:22 reptile\build\classes\collect\model\CoachNorm.class
文件 493 2013-07-16 21:22 reptile\build\classes\collect\model\CollectData.class
文件 1337 2013-07-16 21:22 reptile\build\classes\collect\model\Sql.class
文件 5521 2013-07-16 21:22 reptile\build\classes\collect\plugin\GanjiPlugin.class
文件 5071 2013-07-16 21:22 reptile\build\classes\collect\plugin\HaozePlugin.class
文件 5453 2013-07-16 21:22 reptile\build\classes\collect\plugin\Job51Plugin.class
文件 1294 2013-07-16 21:22 reptile\build\classes\collect\timer\CollectTimer$1.class
文件 1298 2013-07-16 21:22 reptile\build\classes\collect\timer\CollectTimer$2.class
............此处省略541个文件信息
相关资源
- 手机采集摄像头视频socket实时传播 由
- LabVIEW数据采集编程指南(上中下三篇
- 基于FPGA的线阵CCDTSL1401光强自动采集程
- FPGA综合系统设计二基于FPGA的温度采集
- esp8266和24l01基于stm32f103c8t6单片机做的
- 基于高速USB3300接口的FPGA数据采集器设
- 关于视频采集卡二次开发全攻略
- zigbee基于cc2530指导
- pcm-g711a-采集器-播放器 源代码
- 毫米波的数据采集系统与测试的设计
- STM32采集雨量
- LabVIEW远程数据采集毕业设计
- 被动毫米波雷达中基于PCI总线的数据
- 串口温度数据采集系统并实时显示曲
- 音频采集编码pcm到aac
- 基于arm的视频采集系统设计与实现
- 脑电波信号采集及传输电路
- 一个基于FPGA的PCI数据采集程序包括
- 嵌入式linux下QT开发 Camera摄像头采集视
- 肌电信号前端采集电路及波形图和注
- datataker 说明书
- 基于CC2530的温湿度数据采集系统
- STM32 四通道4-20mA模拟量采集板485接口
- 声音信号采集,滤波,放大
- 关关采集器10.5无限制版本 非常好用的
- 多通道数据采集labVIEW源程序
- NI_数据采集卡使用说明书.pdf
- MDC-Max机床监控与数据采集系统
- 基于STM32F103的数据采集系统设计
- stm32+MPU6050+GPS+SD卡读写+ad采集+串口输
评论
共有 条评论