1.2. 机器学习是什么

1.2.1. 概要

预期收益

  • ★ 机器学习的基本过程: 模仿人的学习过程, Data + ML –> Improve Performance
  • ★ 机器学习较其它技术优势: 针对某些应用/问题, 机器学习较简单. 比如, 识别图片、声波等
  • ★ 机器学习应用场景: 无法显示描述规则、传统人工完成无法满足时间空间的性能要求
  • ★ 机器学习关键要素: 潜在规律、有优势、有数据

时间成本

  • 阅读 03 分钟
  • 思考 05 分钟

1.2.2. 什么是机器学习

1.2.2.1. 人类学习的基本过程

../../../_images/02_learning_process.jpg
  1. 传统授课学习: 老师讲授, 学生通过听讲, 练习(思考)从而掌握相应的知识
  2. 成长环境中学习: 宝宝开始学习说话, 通过听周围人的发声, 试图咿呀模仿, 在模仿的过程中不断改进

从观察出发, 通过思考内化, 掌握某些技能

1.2.2.2. 机器学习本质上模仿人类学习的步骤

../../../_images/02_ml_process.jpg

1.2.3. 机器学习 VS 其它技术

  1. 简单(某些问题下), 不需要显示的抽取实际问题规则
    • 识别图片中是否有一棵树(是上百条条规则还是上千条呢?)
    • 问题规则的抽取通常需要业务专家的协助, 准确的先验知识

1.2.4. 机器学习应用场景

  1. 无法(很难)显示的描述规则, 从而无法显示编码
    • 识别声波中的音符
  2. 受限于当前知识的局限性和未来问题的不确定性
    • 自动驾驶, 无法枚举现实场景中所有可能的交通状况, 因此无法制定出驾驶策略
  3. 时间或空间上的性能要求, 传统人工无法完成
    • 股票超短线操作, 根据历史数年股票数据, 在极端的时间内给出买卖决策
    • 根据用户历史行为习惯, 对上亿用户提供个性化服务

1.2.5. 应用机器学习解决问题的必要条件

  1. 有潜在规律(underlying pattern)、并且适用于新的数据
    • 宝宝开始哭的时间, 是发生在偶数秒还是奇数秒. (应该没有任何规律, 宝宝不开心就哭, 哪里还管什么时间呢)
    • 10年前的消费习惯和当前的消费习惯不一样. 美国人一日三餐吃的东西和中国人一定有很大差异(潜在规律发生变化, 即使用了机器学习, 效果也不会好)
  2. 较传统方法有显著优势
    • 判断奇偶数(简单的算术运算就可以判断, 用机器学习有何优势, 没有必要)
  3. 有足够多的数据
    • 随着核技术的使用, 预测哪天, 核可以毁灭地球(没有毁灭地球的历史数据怎么学习)