基于朴素贝叶斯过滤垃圾邮件

  • 收集数据:提供文本文件
  • 准备数据:将文本文件解析成词条向量
  • 分析数据:检查词条确保解析的正确性
  • 训练算法:使用trainNB1()函数
  • 测试算法:使用classifyNB() 并且构建一个新的测试函数来计算文档集的错误率
  • 使用算法:构建完整程序 对一组文档进行分类,并将错分的文档输出到屏幕

准备数据:切分文本

mySent = 'this book is the best book on Python pr M.L I have ever laid eyes upon.'
mySent.split()
['this',
 'book',
 'is',
 'the',
 'best',
 'book',
 'on',
 'Python',
 'pr',
 'M.L',
 'I',
 'have',
 'ever',
 'laid',
 'eyes',
 'upon.']



Artificial Intelligence   Machine Learning   Algorithm      Machine Learning Algorithm 朴素贝叶斯

本博客所有文章除特别声明外,均采用 CC BY-SA 3.0协议 。转载请注明出处!