3.1. 不同的输出空间¶

预期收益

时间成本

3.1.1. 机器学习基本流程回顾¶

问题

本节从问题的输出空间类型视角出发, 对机器学习进行问题进行分类, 以便我们快速确定候选的假设空间

这类问题, 其输出结果只有两种: 是/否, 我们称为2分类问题 Binary Classification.

感知机作为解决2分类问题的一种, 可以作为候选求解这类问题的机器学习方法

日常生活中, 输出结果不仅仅是两种类型, 可能是更多种, 比如

其输出不再是两种, 通常是两种以上, 称为多分类问题 Multiclass Classification.

回归问题和2分类/多分类问题有明显的区别, 比如

上述例子有以下特点

除了分类问题和回归问题, 现实生活中还有一种更为复杂的输出结构, 这类结果通常有以下特征

示例

自动词性标注, NLP基础问题 \(I_{Pronoun} {love}_{verb} {Machine-Learning}_{noun}\)
- 其输出空间\(Y={PVN, NVN, PVP, PV, \ldots}\)
- 句子长短不同, 其输出空间中元素的长度不同, 一般无法(很难)穷举, 不适合直接作为多分类问题处理
蛋白质的3维空间结构, 蛋白质和生物体之间作用