资源简介
使用python,计算两类文档的chi、ig、mi值。其中文档类型比例为1:1,可以自己调整。
代码片段和文件信息
import numpy as np
import jieba
import csv
import os
import sys
import re
#用于获得年报的内容和分类。其中wordlist为[[年报一分词][年报二分词]...],classlist为[[年报一类别][年报二类别]...]
def get_content_annual_1_1():
wordList=[]
classList=[]
with open(“ST信息预处理.csv“encoding=‘utf-8-sig‘) as csvfile:
readCSV = csv.reader(csvfile)
for row in readCSV:
stName=row[0][:-3]+‘-‘+row[1]
nomalName_1 = ‘‘
ifExist = True
i=2
while ifExist:
if os.path.exists(‘F:/作业/srp/chenyiyun/词语分析/年报/‘
+row[i][:-3]+‘-‘+row[1]+‘.txt‘):
nomalName_1=row[i][:-3]+‘-‘+row[1]
ifExist = False
else:
print(row[0])
相关资源
- 国外实习题:Programming Assignment 3
- python 解析pdf文件中的文字成字符串(
- python手写数字识别包含minist数据集
- django博客网站源码(集成了xadmin)
- 计算 语义分割结果 MIOU,miou.py操作简
- PyQt5学生成绩信息系统一:登录窗口
- python语言画出SigmoidTanhRuLe函数图像
- Python-训练和可视化分层注意网络Hie
- 中科大高级计算机网络实验2代码实验
- 因此推理DoWhyPython实现
- minist-CNN-kreas-tsne.py
- 机器学习经典分类算法
- MicroPython for Esp8266 驱动MPU6050例程
- python3 + macaca,selenium UI 自动化测试框
评论
共有 条评论