资源简介
本代码是利用朴素贝叶斯算法实现的垃圾邮件分类,本代码包括代码部分和垃圾邮件及正常邮件数据集
代码片段和文件信息
‘‘‘
Created on Oct 19 2010
@author: Peter
‘‘‘
from numpy import *
def loadDataSet():
postingList=[[‘my‘ ‘dog‘ ‘has‘ ‘flea‘ ‘problems‘ ‘help‘ ‘please‘]
[‘maybe‘ ‘not‘ ‘take‘ ‘him‘ ‘to‘ ‘dog‘ ‘park‘ ‘stupid‘]
[‘my‘ ‘dalmation‘ ‘is‘ ‘so‘ ‘cute‘ ‘I‘ ‘love‘ ‘him‘]
[‘stop‘ ‘posting‘ ‘stupid‘ ‘worthless‘ ‘garbage‘]
[‘mr‘ ‘licks‘ ‘ate‘ ‘my‘ ‘steak‘ ‘how‘ ‘to‘ ‘stop‘ ‘him‘]
[‘quit‘ ‘buying‘ ‘worthless‘ ‘dog‘ ‘food‘ ‘stupid‘]]
classVec = [010101] #1 is abusive 0 not
return postingListclassVec
def createVocabList(dataSet):
vocabSet = set([]) #create empty set
for document in dataSet:
vocabSet = vo
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 7247 2010-10-24 10:34 朴素贝叶斯\代码\bayes.py
文件 148 2010-10-23 17:11 朴素贝叶斯\代码\email\ham\1.txt
文件 86 2010-10-23 17:13 朴素贝叶斯\代码\email\ham\10.txt
文件 130 2010-10-23 17:13 朴素贝叶斯\代码\email\ham\11.txt
文件 182 2010-10-23 09:16 朴素贝叶斯\代码\email\ham\12.txt
文件 174 2010-10-23 17:13 朴素贝叶斯\代码\email\ham\13.txt
文件 172 2010-10-23 17:13 朴素贝叶斯\代码\email\ham\14.txt
文件 531 2010-10-23 09:21 朴素贝叶斯\代码\email\ham\15.txt
文件 90 2010-10-23 09:21 朴素贝叶斯\代码\email\ham\16.txt
文件 464 2010-10-23 09:22 朴素贝叶斯\代码\email\ham\17.txt
文件 175 2010-10-23 09:23 朴素贝叶斯\代码\email\ham\18.txt
文件 161 2010-10-23 17:14 朴素贝叶斯\代码\email\ham\19.txt
文件 234 2010-10-23 08:48 朴素贝叶斯\代码\email\ham\2.txt
文件 208 2010-10-23 09:26 朴素贝叶斯\代码\email\ham\20.txt
文件 234 2010-10-23 09:27 朴素贝叶斯\代码\email\ham\21.txt
文件 330 2010-10-23 09:28 朴素贝叶斯\代码\email\ham\22.txt
文件 608 2010-10-23 17:15 朴素贝叶斯\代码\email\ham\23.txt
文件 42 2010-10-23 09:33 朴素贝叶斯\代码\email\ham\24.txt
文件 89 2010-10-23 09:34 朴素贝叶斯\代码\email\ham\25.txt
文件 371 2010-10-23 08:49 朴素贝叶斯\代码\email\ham\3.txt
文件 207 2010-10-23 08:50 朴素贝叶斯\代码\email\ham\4.txt
文件 114 2010-10-23 17:11 朴素贝叶斯\代码\email\ham\5.txt
文件 1464 2010-10-23 17:12 朴素贝叶斯\代码\email\ham\6.txt
文件 109 2010-10-23 17:12 朴素贝叶斯\代码\email\ham\7.txt
文件 638 2010-10-23 08:58 朴素贝叶斯\代码\email\ham\8.txt
文件 146 2010-10-23 09:01 朴素贝叶斯\代码\email\ham\9.txt
文件 238 2010-10-23 08:28 朴素贝叶斯\代码\email\spam\1.txt
文件 217 2010-10-23 08:36 朴素贝叶斯\代码\email\spam\10.txt
文件 414 2010-10-23 08:37 朴素贝叶斯\代码\email\spam\11.txt
文件 188 2010-10-23 08:37 朴素贝叶斯\代码\email\spam\12.txt
............此处省略29个文件信息
- 上一篇:CAMERA 测试标准
- 下一篇:abaqus焊接模拟inp
评论
共有 条评论