百度百科爬虫并利用Neo4j做知识图谱展示

大小: 9KB

文件类型: .rar

金币: 1

下载: 0 次

发布日期: 2021-01-10
语言: Python
标签: 爬虫

高速下载

资源简介

使用python，mysql爬去百度百科的代码，并利用neo4j展示

资源截图

小图大图

代码片段和文件信息

# -*- coding: utf-8 -*-
# author：wxm

import pandas as pd
import pymysql
from py2neo import GraphNodeRelationship
import csv

## 加上字符集参数，防止中文乱码
def get_items_from_database（）:
    #链接数据库
    dbconn = pymysql.connect（
    host=“192.168.1.24“
    database=“baike_science“
    user=“root“
    password=“root“
    port=3306
    charset=‘utf8‘
    use_unicode=True
    ）

    # # sql语句
    # sqlcmd = “SELECT idtitleurl FROM webpage WHERE time_stamp < ‘2017-12-21 00:00:00‘ “
    #
    # # 利用pandas 模块导入mysql数据
    # data= pd.read_sql（sqlcmd dbconn） #python pandas.core.frame.Dataframe类型

    #链接neo4j
    test_graph = Graph（
        “http://localhost:7474“
        username=“neo4j“
        password=“780961“
    ）
    #清空数据库
    test_graph.delete_all（）

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       1950  2017-12-21 20:41  BaiDuBaiKei\baike_science.sql

     文件       7485  2017-12-26 10:49  BaiDuBaiKei\DatatoNeo4j.py

     文件       3006  2017-12-20 21:19  BaiDuBaiKei\data_storager.py

     文件      16974  2017-12-21 20:37  BaiDuBaiKei\Spider.py

     文件       2315  2017-12-20 20:46  BaiDuBaiKei\wipe_off_html_tag.py

     文件          0  2017-12-21 20:37  BaiDuBaiKei\__init__.py

     目录          0  2017-12-26 10:48  BaiDuBaiKei

----------- ---------  ---------- -----  ----

                31730                    7

上一篇：sasl-0.1.3-cp27-none-win_amd64.whl
下一篇：python 趋势跟踪量化代码

共有条评论

百度百科爬虫并利用Neo4j做知识图谱展示

资源简介

资源截图

代码片段和文件信息

评论

相关资源