资源简介
58同城-赶集-智联招聘-51job企业数据采集程序源码,采集后的数据可筛选,可生成execl,可把图片形式的电话号码采集下来

代码片段和文件信息
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Calendar;
import java.util.Date;
import java.util.linkedHashSet;
import java.util.List;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.http.NameValuePair;
import org.apache.http.message.BasicNameValuePair;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.TypeReference;
import com.jfinal.util.PathUtil;
import collect.core.CoreConstant;
import collect.httpclient.CoachCollect;
import collect.httpclient.HttpClientCode;
import collect.model.CollectData;
import collect.plugin.GanjiPlugin;
import collect.plugin.Job51Plugin;
import collect.plugin.ZhaopinPlugin;
public class Test {
// private String fetchImageViaHttp(URL imgUrl) throws IOException {
// String sURL = imgUrl.toString();
// String imgFile = imgUrl.getPath();
// HttpURLConnection cnx = (HttpURLConnection)imgUrl.openConnection();
// String uri = null;
// try{
// cnx.setAllowUserInteraction(false);
// cnx.setDoOutput(true);
// cnx.addRequestProperty(“Cache-Control“ “no-cache“);
//
// if(request.getHeader(“user-agent“)!= null){
// cnx.addRequestProperty(“User-Agent“ request.getHeader(“user-agent“));
// }else{
// cnx.addRequestProperty(“User-Agent“ user_agent);
// }
// cnx.addRequestProperty(“Referer“ sURL.substring(0 sURL.indexOf(‘/‘ sURL.indexOf(‘.‘))+1));
// cnx.connect();
// if(cnx.getResponseCode() != HttpURLConnection.HTTP_OK)
// return null;
// InputStream imgData = cnx.getInputStream();
//
// String ext = FilenameUtils.getExtension(imgFile).toLowerCase();
// if(!“jpg“.equalsIgnoreCase(ext)
// &&!“png“.equalsIgnoreCase(ext)
// &&!“gif“.equalsIgnoreCase(ext)
// &&!“bmp“.equalsIgnoreCase(ext))
// ext = “jpg“;
// uri = img_path+Tools.rand()+‘.‘+ ext;
// File fileDest = new File(application.getRealPath(uri));
// if(!fileDest.getParentFile().exists())
// fileDest.getParentFile().mkdirs();
// FileOutputStream fos = new FileOutputStream(fileDest);
// try{
// IOUtils.copy(imgData fos);
// }finally{
// IOUtils.closeQuietly(imgData);
// IOUtils.closeQuietly(fos);
// }
// }finally{
// cnx.disconnect();
// }
// return uri;
// }
public static String dtime(long s){
try {
SimpleDateFormat fTime = new SimpleDateFormat(“yyyy-MM-dd HH:mm:ss“);
return fTime.format(s);
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
return null;
}
}
private static String detectWebRootPath() {
try {
String p
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 727 2012-11-22 11:50 reptile\.classpath
文件 1040 2012-10-15 10:30 reptile\.project
文件 500 2012-10-15 10:30 reptile\.settings\.jsdtscope
文件 364 2012-10-15 10:30 reptile\.settings\org.eclipse.jdt.core.prefs
文件 472 2012-10-15 10:30 reptile\.settings\org.eclipse.wst.common.component
文件 305 2012-11-22 10:54 reptile\.settings\org.eclipse.wst.common.project.facet.core.xm
文件 49 2012-10-15 10:30 reptile\.settings\org.eclipse.wst.jsdt.ui.superType.container
文件 6 2012-10-15 10:30 reptile\.settings\org.eclipse.wst.jsdt.ui.superType.name
文件 4647 2013-07-16 21:22 reptile\build\classes\collect\config\AppConfig.class
文件 315 2013-07-16 21:22 reptile\build\classes\collect\controller\ba
文件 1204 2013-07-16 21:22 reptile\build\classes\collect\controller\DefaultController.class
文件 8398 2013-07-16 21:22 reptile\build\classes\collect\controller\MainController.class
文件 581 2013-07-16 21:22 reptile\build\classes\collect\core\CoreConstant.class
文件 3699 2013-07-16 21:22 reptile\build\classes\collect\core\FreemarkGenerate.class
文件 161 2013-07-16 21:22 reptile\build\classes\collect\core\IReptilePlugin.class
文件 9112 2013-07-16 21:22 reptile\build\classes\collect\httpclient\CoachCollect.class
文件 7988 2013-07-16 21:22 reptile\build\classes\collect\httpclient\HttpClientCode.class
文件 1533 2013-07-16 21:22 reptile\build\classes\collect\httpclient\HttpSingleton.class
文件 1257 2013-07-16 21:22 reptile\build\classes\collect\httpclient\Verification.class
文件 1319 2013-07-16 21:22 reptile\build\classes\collect\model\Coach.class
文件 1350 2013-07-16 21:22 reptile\build\classes\collect\model\CoachConfig.class
文件 481 2013-07-16 21:22 reptile\build\classes\collect\model\CoachImg.class
文件 485 2013-07-16 21:22 reptile\build\classes\collect\model\CoachNorm.class
文件 493 2013-07-16 21:22 reptile\build\classes\collect\model\CollectData.class
文件 1337 2013-07-16 21:22 reptile\build\classes\collect\model\Sql.class
文件 5521 2013-07-16 21:22 reptile\build\classes\collect\plugin\GanjiPlugin.class
文件 5071 2013-07-16 21:22 reptile\build\classes\collect\plugin\HaozePlugin.class
文件 5453 2013-07-16 21:22 reptile\build\classes\collect\plugin\Job51Plugin.class
文件 1294 2013-07-16 21:22 reptile\build\classes\collect\timer\CollectTimer$1.class
文件 1298 2013-07-16 21:22 reptile\build\classes\collect\timer\CollectTimer$2.class
............此处省略541个文件信息
相关资源
- labview中的DAQ助手采集多个通道电压
- 数据采集系统——ADC0808的应用,单片
- AD7606采集程序
- CY7C68013A固件程序(用于摄像机采集)
- 基于AT89C51的数据采集系统设计新方法
- 基于delphi的声卡采集程序.rar
- stm32通过DMA方式采集ADC数据
- 创龙C66x平台GigE工业相机图像采集案例
- 全自动采集getshell工具
- LabVIEW 数据采集 模拟量+编码器(Daq
- LabVIEW 声音信号的采集与存储.vi
- 多通道数据采集.vi(labview)
- 基于LabVIEW的声卡声音采集与播放
- 基于labVIEW的虚拟数据采集与输出仿真
- VS1053B编解码器的VDR分布式声音采集卡
- 杰奇小说连载系统采集器V1.1
- 基于STM32的嵌入式双目图像采集系统设
- 用ARM7和UC/OS-II设计的信号采集系统
- 一种用ARM7+UC/OS-II设计的信号采集系统
- LSI 3ware 6Gb提高视频采集和编辑的吞吐
- EasyCAP SM-USB 007采集卡驱动 官方版
- NI 6221用户手册
- 基于LabVIEW的并行数据采集系统设计
- 基于V4L2的视频采集,能够采集YUVJPE
- TD-SCDMA网络测试仪中E1数据采集卡的驱
- 基于FPGA的彩色线阵CCD图像采集系统设
- 三款4-20ma模拟量采集电路图
- 三款4-20ma模拟量采集电路图详解
- 基于MC68HC908JB8的USB指纹采集仪
- 基于51单片机的多通道数据采集范围控
评论
共有 条评论