资源简介
本代码主要是用机器学习的方法判断红楼梦后四十回是不是曹雪芹写的
代码片段和文件信息
# sample_build.py
#
# Author: Xubin Lin
import jieba
import numpy as np
def sample_build(FeaturesPath ChapterLib SavePath):
Sample = {}
Features = {}
with open(FeaturesPath) as fr:
featuresline = fr.readlines()
for line in featuresline:
line = line.strip()
Features[line] = 0
for (numval_chp) in ChapterLib.items():
FeaturesVector = []
Features_Tmp = Features.copy()
seg_list = jieba.cut(val_chp cut_all = False)
for words in seg_list:
index = Features_Tmp.get(words-1)
if index != -1:
Features_Tmp[words] = Features_Tmp.get(words-1) + 1
for (keyval) in Features_Tmp.items():
FeaturesVector.append(val)
Sample[num] = FeaturesVector
with open(SavePath ‘w‘) as fr:
for (keyval) in Sample.items():
fr.write(str(val) + ‘\n‘)
return Sample
#Application Demo
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-04-12 20:51 SVM_Stone\
文件 892 2018-04-12 20:50 SVM_Stone\sample_build.py
文件 2335 2018-04-12 19:17 SVM_Stone\svm_prediction.py
目录 0 2018-04-12 20:49 SVM_Stone\text_analysis\
文件 1672 2018-04-10 13:10 SVM_Stone\text_analysis\keywords0.txt
文件 1697 2018-04-10 13:10 SVM_Stone\text_analysis\keywords1.txt
文件 1693 2018-04-10 13:10 SVM_Stone\text_analysis\keywords2.txt
文件 1400 2018-04-10 15:56 SVM_Stone\text_analysis\KeyWord_final.txt
文件 44079 2018-04-12 19:17 SVM_Stone\text_analysis\sample.txt
文件 1594 2018-04-12 20:51 SVM_Stone\word_split.py
文件 2523106 2018-04-10 20:04 SVM_Stone\红楼梦.txt
相关资源
- Python数据分析与机器学习-贝叶斯实现
- 机器学习实战 Python实现
- Python for ProbabilityStatisticsand Machine Le
- 机器学习实战python实现
- 图像处理的详细python程序
- 《Learning data mining with python》中文版
- 人工智能-python机器学习实战高清完整
- Python-STGAN用于图像合成的空间变换生
- Python-利用GAN进行图片填充
- 笨办法学python3
- 《Python机器学习》实验报告.doc
- 机器学习机器学习机器学习python的P
- Python-基于50W携程出行攻略的顺承事件
- 机器学习对应的相关python代码SVM、C
- 《Python机器学习实践指南》原书代码
- Python-在TensorFlow中实现实现图像卷积网
- 机器学习实验报告,验证码识别,代
- Machine Learning with Python Cookbook.pdf
- Python-60DaysRLChallenge中文版强化学习6
- SVM解兵王问题_python.zip
- Learning scikit-learn Machine Learning in Pyth
- python 机器学习 scikit-learn 手册 高清完
- Python-一个非常简单的BiLSTMCRF模型用于
- Python-Tensorflow仿AlphaGo框架实现的AI围棋
- python实现hmm
- Python-我是小诗姬全唐诗作为训练数据
- 吴恩达机器学习课后作业python代码
- 机器学习字母分类-python
- 吴恩达机器学习编程作业python3版本
- Python机器学习算法-mobi文字版-附带m
评论
共有 条评论