ML Basic Concepts
留出法(hold-out)
- 训练测试集互斥、分布一致
- 一般若干次随机划分、重复实验取平均值
- 训练/测试样本比通常为2:1~4:1
交叉验证(cross-validation)
- k个互斥子集,每次k-1个子集并集训练,余下的一个子集测试
- 这样重复k次,最终返回k个测试结果的均值
- 若D包含m个样本,k=m,则为留一法
混淆矩阵、精确率、召回率、P-R曲线、F1 Score

精确率P:真正例在所有预测的正例中占的比例
召回率R:真正例在所有的真正正例中占的比例,

F1 Score、Fb Score

Bayesian & Maximum likelihood estimation
Naive Bayes Classifier