弹药库 弹药库

好记性不如烂笔头

目录
机器学习
/    

机器学习

何为机器学习

机器学习即是把无序的数据转换成有用的信息,利用计算机来彰显数据背后的真是含义。

数据挖掘十大算法

故为机器学习十大算法:

  • C4.5决策树
  • K-均值(K-mean)
  • 支持向量机(SVM)
  • Apriori
  • 最大期望算法(EM)
  • PageRank算法
  • AdaBoost算法
  • k-近邻算法(kNN)
  • 朴素贝叶斯算法(NB)
  • 分类回归树算法(CART)

机器学习分类

  • 监督学习:给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。(有目标性的)
  • 无监督学习:无需用户知道搜索目标,只需从算法程序中得到这些数据的共同特征。

机器学习作用

能够从数据分析中领悟到有价值信息是非常重要的。(用数据说话)

监督学习中的目标变量

  • 分类算法中目标变量的类型通常是标称型
  • 回归算法中目标变量的类型通常是数值型

特征

将数据中每个类型称之为特征,又称属性;多个特征联系在一起共同组成一个训练样本。其目标称之为 目标变量

  • 数值型:使用十进制数字表示
  • 二值型:使用0 或 1
  • 枚举类型:基于自定义调色板

机器学习的主要任务

数据集合分成由类似的对象组成的多个类的过程称之为 聚类

寻找描述数据统计值的过程称之为 密度估计

  • 算法训练
  • 回归:用于预测数值型数据

选择合适的算法

  1. 想要算法完成何种任务
  2. 需要分析或收集的数据是什么

开发机器学习的步骤

graph TB
    subgraph 开发过程
    收集数据-->准备数据
    准备数据-->分析数据
    分析数据-->训练算法
    训练算法-->测试算法
    测试算法-->使用算法
    end
    subgraph 说明
    训练算法-->用于监督学习
    end

标题:机器学习
作者:zhhui