过拟合（Overfitting）

过拟合（Overfitting）是指机器学习模型过度拟合训练数据，导致对未知数据（测试数据或实际应用数据）的泛化能力显著下降的现象。模型将数据中的噪声和特例也“学习”了进去，表面上看精度很高，但实际预测精度反而变差。典型例子是：图像识别模型将训练图像的背景和阴影特征也记了下来，导致对新图像无法正确分类。这可以理解为“记住了，但没有真正理解”的状态，问题在于无法捕捉到本质的规律。过拟合的主要原因： - 模型容量（参数量）过大 - 模型对训练数据而言过于复杂 - 训练轮数过多 - 训练数据过少或分布不均 - 正则化、Dropout等防过拟合措施不足防止过拟合的常用方法： - 控制模型复杂度（避免过深的网络结构） - 使用早停（Early Stopping）在最佳时机停止训练 - 加入L1/L2正则化 - 使用Dropout等泛化技术 - 数据增强（Data Augmentation）和交叉验证 - 增加训练数据量或改善数据分布过拟合与欠拟合（Underfitting）并列，是机器学习性能调优中必须避免的两大典型陷阱。在实际工作中，需要在监控训练精度与测试精度差距的同时，构建具备适当泛化能力的模型。

过拟合（Overfitting）

相关术语