基于朴素贝叶斯过滤垃圾邮件
- 收集数据:提供文本文件
- 准备数据:将文本文件解析成词条向量
- 分析数据:检查词条确保解析的正确性
- 训练算法:使用trainNB1()函数
- 测试算法:使用classifyNB() 并且构建一个新的测试函数来计算文档集的错误率
- 使用算法:构建完整程序 对一组文档进行分类,并将错分的文档输出到屏幕
准备数据:切分文本
mySent = 'this book is the best book on Python pr M.L I have ever laid eyes upon.'
mySent.split()
['this',
'book',
'is',
'the',
'best',
'book',
'on',
'Python',
'pr',
'M.L',
'I',
'have',
'ever',
'laid',
'eyes',
'upon.']
Artificial Intelligence Machine Learning Algorithm Machine Learning Algorithm 朴素贝叶斯
本博客所有文章除特别声明外,均采用 CC BY-SA 3.0协议 。转载请注明出处!