资源简介
资源包主要内容:
(1)各个步骤需要的实验源码
(2)各个步骤生成的text、xml以及csv文件
(3)实验过程的大致说明,帮助更好的理解实验
包含整个实验过程的所有资源,代码完整,附带实验说明,易于理解。
原reviews.xml有点不合适,用资源包里的替换掉就好。
最后,祝大家能早日做完实验,早回家。
代码片段和文件信息
#-*-coding:utf-8 -*-
from lxml import etree
import pandas as pd
import sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)
id =0
a=[]
b=[]
parser = etree.xmlParser(recover=True)
while id <100:
tree = etree.parse(“F:/Pythonwork/NLP/review_parser/review_parsed“+‘%05d‘%id+“.xml“ parser)
root = tree.getroot()
for element in root.iter():
depps = element.findall(“dep“)
for depp in depps:
if depp.get(‘type‘) == “amod“:
print depp.find(“governor“).text
print depp.find(“dependent“).text
a.append(depp.find(“governor“).text)
b.append(depp.find(“dependent“).text)
id+=1
dataframe = pd.Dataframe({‘名词‘: a ‘修饰词‘: b})
dataframe.to_csv(“test.csv“ index=False sep=‘‘)
#print root[0].tag
#print root[0].attrib
#找标签名为dependencies的属性
print root[0].find(“dependencies“).attrib.keys()[0]
#for element in root.iter():
# if element.find(‘review_text‘) is None: pass
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 21088 2016-09-27 20:57 实验三-NLP\hw2.ipynb
目录 0 2018-01-24 17:44 实验三-NLP\
目录 0 2018-01-24 17:44 实验三-NLP\.idea\
文件 459 2018-01-23 23:38 实验三-NLP\.idea\NLP.iml
文件 222 2018-01-23 23:38 实验三-NLP\.idea\misc.xm
文件 258 2018-01-23 23:38 实验三-NLP\.idea\modules.xm
文件 15441 2018-01-24 17:27 实验三-NLP\.idea\workspace.xm
文件 1030 2018-01-24 16:37 实验三-NLP\Matched.py
文件 667 2018-01-24 00:13 实验三-NLP\RewiewText.py
目录 0 2018-01-24 17:44 实验三-NLP\review_parser\
文件 21909 2018-01-24 00:38 实验三-NLP\review_parser\review_parsed00000.xm
文件 21909 2018-01-24 00:38 实验三-NLP\review_parser\review_parsed00001.xm
文件 4287 2018-01-24 00:38 实验三-NLP\review_parser\review_parsed00002.xm
文件 6782 2018-01-24 00:38 实验三-NLP\review_parser\review_parsed00003.xm
文件 3431 2018-01-24 00:38 实验三-NLP\review_parser\review_parsed00004.xm
文件 28960 2018-01-24 00:39 实验三-NLP\review_parser\review_parsed00005.xm
文件 5201 2018-01-24 00:39 实验三-NLP\review_parser\review_parsed00006.xm
文件 40059 2018-01-24 00:39 实验三-NLP\review_parser\review_parsed00007.xm
文件 12403 2018-01-24 00:39 实验三-NLP\review_parser\review_parsed00008.xm
文件 40059 2018-01-24 00:39 实验三-NLP\review_parser\review_parsed00009.xm
文件 92543 2018-01-24 00:40 实验三-NLP\review_parser\review_parsed00010.xm
文件 3124 2018-01-24 00:40 实验三-NLP\review_parser\review_parsed00011.xm
文件 5657 2018-01-24 00:40 实验三-NLP\review_parser\review_parsed00012.xm
文件 9935 2018-01-24 00:40 实验三-NLP\review_parser\review_parsed00013.xm
文件 61297 2018-01-24 00:40 实验三-NLP\review_parser\review_parsed00014.xm
文件 24131 2018-01-24 00:41 实验三-NLP\review_parser\review_parsed00015.xm
文件 11241 2018-01-24 00:41 实验三-NLP\review_parser\review_parsed00016.xm
文件 27667 2018-01-24 00:41 实验三-NLP\review_parser\review_parsed00017.xm
文件 8566 2018-01-24 00:41 实验三-NLP\review_parser\review_parsed00018.xm
文件 2117 2018-01-24 00:41 实验三-NLP\review_parser\review_parsed00019.xm
文件 5186 2018-01-24 00:41 实验三-NLP\review_parser\review_parsed00020.xm
............此处省略234个文件信息
- 上一篇:FERET_ 人脸数据库
- 下一篇:深入Linux内核架构中文版--原版pdf
相关资源
- 山东大学计算机组成原理复习资料
- 山东大学操作系统复习资料
- 山东大学计算机图形学实验课程资源
- 山东大学计算机学院机器学习课程2
- 图灵书籍(面向数据科学家的实用统
- 山东大学汇编实验
- 山东大学数字图像处理实验1-4
- 山东大学2018计算机体系结构复习资料
- R语言数据科学(r for data science 中文版
- 山东大学操作系统复习资料期末备考
- 山东大学计算机网络实验报告及复习
- 山东大学[计组]计算机体系结构计算机
- 山东大学图形学实验二多边形的世界
- 数据科学:R语言实现(中文高清扫描
- 山东大学人工智能复习资料
- 山东大学物理题库
- 微机原理课件山东大学 宁飞
- 山东大学操作系统课程设计nachos实验
- 山东大学软件学院区块链技复习.rar
- R数据科学(中文完整版
- Spark全栈数据分析_敏捷数据科学2.0_原
- 山东大学中间件课程ppt和往年试题考
- 山东大学计算机图形学实验二3D迷宫漫
- 2018最新版-山东大学计算机网络往年期
- 山东大学数据科学导论复习资料
- 山东大学机器学习期末复习资料.zip
- 山东大学面向对象期末复习资料
- 山东大学WEB复习资料
- 山东大学机器学习实验
- 山东大学计算机组成原理实验要求及
评论
共有 条评论