- AI BEST SEARCH
- AI 相关术语与关键词一览【AI BEST SEARCH】
- 过拟合(Overfitting)
过拟合(Overfitting)
过拟合(Overfitting)是指机器学习模型过度拟合训练数据,导致对未知数据(测试数据或实际应用数据)的泛化能力显著下降的现象。 模型将数据中的噪声和特例也“学习”了进去,表面上看精度很高,但实际预测精度反而变差。 典型例子是:图像识别模型将训练图像的背景和阴影特征也记了下来,导致对新图像无法正确分类。 这可以理解为“记住了,但没有真正理解”的状态,问题在于无法捕捉到本质的规律。 过拟合的主要原因: - 模型容量(参数量)过大 - 模型对训练数据而言过于复杂 - 训练轮数过多 - 训练数据过少或分布不均 - 正则化、Dropout等防过拟合措施不足 防止过拟合的常用方法: - 控制模型复杂度(避免过深的网络结构) - 使用早停(Early Stopping)在最佳时机停止训练 - 加入L1/L2正则化 - 使用Dropout等泛化技术 - 数据增强(Data Augmentation)和交叉验证 - 增加训练数据量或改善数据分布 过拟合与欠拟合(Underfitting)并列,是机器学习性能调优中必须避免的两大典型陷阱。 在实际工作中,需要在监控训练精度与测试精度差距的同时,构建具备适当泛化能力的模型。