• 大小: 75KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-06-05
  • 语言: Java
  • 标签: 网页正文  swing界面  

资源简介

linklist.java是入口函数,有界面,我自己用JSOUP实现的网页正文提取。

资源截图

代码片段和文件信息

package org.jsoup;

import org.jsoup.nodes.Document;

import java.net.URL;
import java.util.Map;
import java.util.Collection;
import java.io.IOException;

/**
 * A Connection provides a convenient interface to fetch content from the web and parse them into Documents.
 * 


 * To get a new Connection use {@link org.jsoup.Jsoup#connect(String)}. Connections contain {@link Connection.Request}
 * and {@link Connection.Response} objects. The request objects are reusable as prototype requests.
 * 


 * Request configuration can be made using either the shortcut methods in Connection (e.g. {@link #userAgent(String)})
 * or by methods in the Connection.Request object directly. All request configuration must be made before the request
 * is executed.
 * 


 * The Connection interface is currently in beta and subject to change. Comments suggestions and bug reports are welcome.
 */
public interface Connection {

    /**
     * GET and POST http methods.
     */
    public enum Method {
        GET POST
    }

    /**
     * Set the request URL to fetch. The protocol must be HTTP or HTTPS.
     * @param url URL to connect to
     * @return this Connection for chaining
     */
    public Connection url(URL url);

    /**
     * Set the request URL to fetch. The protocol must be HTTP or HTTPS.
     * @param url URL to connect to
     * @return this Connection for chaining
     */
    public Connection url(String url);

    /**
     * Set the request user-agent header.
     * @param userAgent user-agent to use
     * @return this Connection for chaining
     */
    public Connection userAgent(String userAgent);

    /**
     * Set the request timeouts (connect and read). If a timeout occurs an IOException will be thrown. The default
     * timeout is 3 seconds (3000 millis). A timeout of zero is treated as an infinite timeout.
     * @param millis number of milliseconds (thousandths of a second) before timing out connects or reads.
     * @return this Connection for chaining
     */
    public Connection timeout(int millis);

    /**
     * Set the request referrer (aka “referer“) header.
     * @param referrer referrer to use
     * @return this Connection for chaining
     */
    public Connection referrer(String referrer);

    /**
     * Set the request method to use GET or POST. Default is GET.
     * @param method HTTP request method
     * @return this Connection for chaining
     */
    public Connection method(Method method);

    /**
     * Add a request data parameter. Request parameters are sent in the request query string for GETs and in the request
     * body for POSTs. A request may have multiple values of the same name.
     * @param key data key
     * @param value data value
     * @return this Connection for chaining
     */
    public Connection data(String key String value);

    /**
     * Adds all of the supplied data to the request data parameters
     * @param data map of data parameters
     * @return this C


 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      11262  2010-09-19 01:01  jsoup\Connection.java

     文件       6844  2010-09-19 01:01  jsoup\Jsoup.java

     文件        145  2010-09-19 01:01  jsoup\package-info.java

     文件       1376  2010-09-19 01:01  jsoup\select\Collector.java

     文件      14195  2010-09-19 01:01  jsoup\select\Elements.java

     文件        931  2010-09-19 01:01  jsoup\select\NodeTraversor.java

     文件        212  2010-09-19 01:01  jsoup\select\NodeVisitor.java

     文件         86  2010-09-19 01:01  jsoup\select\package-info.java

     文件      18366  2010-09-19 01:01  jsoup\select\Selector.java

     文件       5267  2010-09-19 01:01  jsoup\safety\Cleaner.java

     文件         95  2010-09-19 01:01  jsoup\safety\package-info.java

     文件      15199  2010-09-19 01:01  jsoup\safety\Whitelist.java

     文件        101  2010-09-19 01:01  jsoup\parser\package-info.java

     文件      11301  2010-09-19 01:01  jsoup\parser\Parser.java

     文件      18574  2010-09-19 01:01  jsoup\parser\Tag.java

     文件      11782  2010-09-19 01:01  jsoup\parser\TokenQueue.java

     文件       3413  2010-09-19 01:01  jsoup\nodes\Attribute.java

     文件       6292  2010-09-19 01:01  jsoup\nodes\Attributes.java

     文件       1097  2010-09-19 01:01  jsoup\nodes\Comment.java

     文件       1482  2010-09-19 01:01  jsoup\nodes\DataNode.java

     文件       9290  2010-09-19 01:01  jsoup\nodes\Document.java

     文件      36602  2010-09-19 01:01  jsoup\nodes\Element.java

     文件      76531  2010-09-19 01:01  jsoup\nodes\Entities.java

     文件       7111  2010-09-19 01:01  jsoup\nodes\Evaluator.java

     文件      12910  2010-09-19 01:01  jsoup\nodes\Node.java

     文件         64  2010-09-19 01:01  jsoup\nodes\package-info.java

     文件       4545  2010-09-19 01:01  jsoup\nodes\TextNode.java

     文件       1388  2010-09-19 01:01  jsoup\nodes\xmlDeclaration.java

     文件       4013  2010-09-19 01:01  jsoup\helper\DataUtil.java

     文件      18975  2010-11-25 16:29  jsoup\helper\HttpConnection.java

............此处省略15个文件信息

评论

共有 条评论