1.过拟合与欠拟合 机器学习有时候变成了一个经验性的事情,使用同样的模型去学习数据集,初始效果恐怕不会好,经验丰富的工程师知道接下去该怎么做才能找到更好的模型而没经验的可能就束手无策。这是一些数学和统计出身的人对传统机器学习有不屑的一点,严谨的数学模型和方法不会因经验不同而得出不同结果。 从数据集角度,数据越多越可以选用复杂模型,这是因为数据集越大意味着数据越接近总体,而非样本,那么模型可以更注重拟合而非泛化,因为拟合了总体就得到了泛化。相反地,如果数据集小,只能选用简单模型。 如何评估模型当前有没有过于复杂或过于…