• 大小: 14KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-01-01
  • 语言: Python
  • 标签: Python  

资源简介

朴素贝叶斯文本分类的Python实现代码

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-
from numpy import *
from os import listdirmkdirpath
import re
from nltk.corpus import stopwords
import nltk
import operator
##############################################################
## 1. 创建新文件夹,存放预处理后的文本数据
##############################################################
def createFiles():
    srcFilesList = listdir(‘originSample‘)
    for i in range(len(srcFilesList)):
        if i==0: continue
        dataFilesDir = ‘originSample/‘ + srcFilesList[i] # 20个文件夹每个的路径
        dataFilesList = listdir(dataFilesDir)
        targetDir = ‘processedSample_includeNotSpecial/‘ + srcFilesList[i] # 20个新文件夹每个的路径
        if path.exists(targetDir)==False:
            mkdir(targetDir)
        else:
            print ‘%s exists‘ % targetDir
        for j in 

评论

共有 条评论