资源简介
计划赶不上变化快的fasttext来啦~ 包括代码和分好词的训练集、测试集、停词表,测试集F1值0.941,虽然没比TextCNN高但是快啊!fasttext模块安装麻烦一点,具体看博客内容吧。
代码片段和文件信息
# -*- coding: utf-8 -*-
“““
Created on Mon Jul 27 21:12:20 2020
@author: 29811
“““
import logging
import fasttext
import time
from datetime import timedelta
basedir = ‘D:/S/Learn/CNew/Cnews_Fasttext/‘
logging.basicConfig(format=‘%(asctime)s : %(levelname)s : %(message)s‘ level=logging.INFO)
start_time = time.time()
# 训练
model = fasttext.train_supervised(basedir + ‘cnews.seg.train‘ label_prefix = ‘__label__‘ word_ngrams=3 bucket=2000000)
end_time = time.time()
time_dif = end_time - start_time
print(‘time of train:‘ timedelta(seconds=int(round(time_dif))))
# 保存
model.save_model(basedir + ‘cnews.fasttext‘)
# 加载
model = fasttext.load_model(basedir + ‘cnews.fasttext‘)
#测试
num precision recall = model.test(basedir + ‘cnews.seg.test‘)
print(precision * recall * 2 / (recall + precision))
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2867 2020-07-28 22:03 data_process.py
文件 112538995 2020-07-28 22:00 cnews.seg.train
文件 23865365 2020-07-28 22:03 cnews.seg.test
文件 869 2020-07-29 12:00 CNEW_Fasttext.py
文件 19782 2020-03-01 19:48 cnews.vocab.txt
----------- --------- ---------- ----- ----
136427878 5
相关资源
- 微博用户评论情感分析python代码数据
- Deep Learning for Natural Language Processing
- Python-神经网络模型能够从音频演讲中
-
me
tadata.txt - 唐诗生成器自动生成
- Python-NLP之旅包含NLP文章代码集锦
- keras实现中文文本分类
- 文本分类代码集合含数据_TextCNN_Text
- python实现CNN中文文本分类
- Python-20182019校招春招秋招算法NLP深度
- python snownlp-0.12.3.tar.gz
- 最大熵的文本分类
- python 自然语言处理实战代码部分
- 网易新闻数据,用于中文文本分类,
- 朴素贝叶斯算法实现的文本分类_Pyt
- DNN判断句子的通顺程度.py
- 朴素贝叶斯文本分类python实现(含数
- nlp肯定句与否定句判断
- Python项目案例开发从入门到实战源代
- NLPIR.user
- nltk语料库
- 基于朴素贝叶斯实现的文本分类
- 基于lstm的语义相似度计算模型代码
- 文本分类算法LDA
- Python实现朴素贝叶斯算法文本分类器
- lstm_attention文本分类代码
- textrank自动文摘抽取python代码
- RasaCore官方文档中文版
- 利用python实现基于SVM的文本分类
- SVM实现文本分类代码
评论
共有 条评论