机器学习实战-笔记1-基础

机器学习的主要任务

监督学习-必须知道预测什么,即目标变量的分类信息**

  • 分类,将实例数据划分到核实的分类中
  • 回归,用于预测数值型数据

监督学习的用途

  • k-近邻算法
  • 朴素贝叶斯算法
  • 支持向量机
  • 决策树
  • 线性回归
  • 局部加权线性回归
  • Ridge回归
  • Lasso最小回归系数估计

无监督学习-没有类别信息,也没有目标值

  • 聚类,将数据集合分成类似的对象组成多个类的过程
  • 密度估计,寻找描述数据统计值的过程

无监督学习的用途

  • K-均值
  • DBSCAN
  • 最大期望算法
  • Parzen窗设计

如何选择合适的算法

  • 使用机器学习算法的目的,想要算法完成什么任务
    • 如果预测目标变量的值,则可选择监督学习算法
      • 目标变量类型如果是 离散型,如是/否、1/2/3等,则可使用分类算法
      • 目标变量类型如果是 连续型的数值,如1.0~100.0等,则可以使用回归算法
    • 如果不是预测目标变量的值,则可选择无监督学习算法
      • 如果只需要将数据分为离散的组,则使用聚类算法
      • 如果需要估计数据与每个分组的相似程度,则使用密度估计算法
  • 需要分析或收集的数据是什么

开发机器学习应用程序的步骤

  1. 收集数据
  2. 准备输入数据
  3. 分析输入数据
  4. 训练算法
  5. 测试算法
  6. 使用算法


Artificial Intelligence   Machine Learning   Algorithm      Machine Learning Algorithm

本博客所有文章除特别声明外,均采用 CC BY-SA 3.0协议 。转载请注明出处!