资源简介
使用Python语言对DBLP数据集通过sax方式进行简单处理并存放到csv文件中。处理过程非常简单,请根据需要进行下载。
代码片段和文件信息
# -*- coding:utf-8 -*-
‘‘‘
@author:Zhong Peng
@createDate:2015-11-05
@version:1.0.0
‘‘‘
import sys
from xml.sax import handler make_parser
import pickle
import os
DBLP_xml_PATH = r‘C:\Users\zhongpeng\Desktop\dblp.xml‘
#此处需要完整添加所有“块”结构的标签,或者需要处理的类型的标签
paperTag = (‘inproceedings‘‘proceedings‘
‘incollection‘‘phdthesis‘‘mastersthesis‘‘www‘)
class CoauthorHandler(handler.ContentHandler):
def __init__(self):
self.title = ‘‘
self.year = ‘‘
self.author = ‘‘
self.count = 0
self.isPaperTag = 0
self.istitleTag = 0
self.isYearTag = 0
self.isAuthorTag = 0
self.authors = []#存储每个“块”中的所有author
self.storage = {}#用来存储生成的数据,结构为{‘title‘:[year [author1 author2 ...]]}
- 上一篇:python36_d.lib
- 下一篇:excel增删改查功能的封装
相关资源
- python一个打砖块的小游戏
- python实验指导书 图文高清版
- python主动安装第三方库
- python爬取豆瓣top250电影信息
- python绘制 大蟒蛇
- python小程序(数组排序)
- Python去水印(基于cv2)
- Python 数据结构入门 - 二叉搜索树(
- python空心电感计算器
- python除法.docx
- 抽奖背后的秘密(python抽奖逻辑)
- 绘制统计学直方图茎叶图(matplotlib)
- python求解标准差
- python数据分析与处理
- 利用Python将照片在Excel中利用点阵图显
- python turtle 跳房子
- python 人群计数
- Python调用第三方API换脸
- “去哪儿吃”帮你选餐厅(python代码
- python 控制台登陆密码验证
- KNN算法的Python实现(datingrecd.ipynb)
- python核心编程第二版-习题答案
- python爬取笔趣阁小说
- Python程序设计基础试题以及答案(3
- python聊天-服务端与客户端
- python递归求最大公约数
- 用python画皮卡丘(基于turtle)
- 伟哥的python私房菜(中国程序员).
- pip一键升级(python脚本)
- 我的世界python编程——天空行走py格式
评论
共有 条评论