2. 机器学习是什么¶
2.1. 概要¶
预期收益
- ★ 机器学习的基本过程: 模仿人的学习过程, Data + ML –> Improve Performance
- ★ 机器学习较其它技术优势: 针对某些应用/问题, 机器学习较简单. 比如, 识别图片、声波等
- ★ 机器学习应用场景: 无法显示描述规则、传统人工完成无法满足时间和空间的性能要求
- ★ 机器学习关键要素: 潜在规律、有优势、有数据
时间成本
- 阅读 03 分钟
- 思考 05 分钟
2.2. 什么是机器学习¶
2.2.1. 人类学习的基本过程¶

- 传统授课学习: 老师讲授, 学生通过听讲, 练习(思考)从而掌握相应的知识
- 成长环境中学习: 宝宝开始学习说话, 通过听周围人的发声, 试图咿呀模仿, 在模仿的过程中不断改进
从观察出发, 通过思考内化, 掌握某些技能
2.2.2. 机器学习本质上模仿人类学习的步骤¶

2.3. 机器学习 VS 其它技术¶
- 简单(某些问题下), 不需要显示的抽取实际问题规则
- 识别图片中是否有一棵树(是上百条条规则还是上千条呢?)
- 问题规则的抽取通常需要业务专家的协助, 准确的先验知识
2.4. 机器学习应用场景¶
- 无法(很难)显示的描述规则, 从而无法显示编码
- 识别声波中的音符
- 受限于当前知识的局限性和未来问题的不确定性
- 自动驾驶, 无法枚举现实场景中所有可能的交通状况, 因此无法制定出驾驶策略
- 时间或空间上的性能要求, 传统人工无法完成
- 股票超短线操作, 根据历史数年股票数据, 在极端的时间内给出买卖决策
- 根据用户历史行为习惯, 对上亿用户提供个性化服务
2.5. 应用机器学习解决问题的必要条件¶
- 有潜在规律(underlying pattern)、并且适用于新的数据
- 宝宝开始哭的时间, 是发生在偶数秒还是奇数秒. (应该没有任何规律, 宝宝不开心就哭, 哪里还管什么时间呢)
- 10年前的消费习惯和当前的消费习惯不一样. 美国人一日三餐吃的东西和中国人一定有很大差异(潜在规律发生变化, 即使用了机器学习, 效果也不会好)
- 较传统方法有显著优势
- 判断奇偶数(简单的算术运算就可以判断, 用机器学习有何优势, 没有必要)
- 有足够多的数据
- 随着核技术的使用, 预测哪天, 核可以毁灭地球(没有毁灭地球的历史数据怎么学习)