Wetts's blog

Stay Hungry, Stay Foolish.

0%

Bias、Variance与数据集分布优化.md

  • 贝叶斯误差(一般用人类水平代替)与训练集错误率之差是 __bias(avoidble bias)__。
  • 训练集错误率与开发集错误率之差是 __variance__。

高 bias 可尝试以下方法:

  • 新的网络(含有更多隐藏层或者隐藏单元的网络)
  • 花费更多时间来训练网络

高 variance 可尝试以下方法:

  • 更多的数据
  • 正则化(L1、L2、dropout、数据扩增、early stopping)

误差分析

在你的开发集里或者测试集里,观察错误标记的样本,统计属于不同错误类型的错误数量。

通过统计不同错误标记类型占总数的百分比,可以帮你发现哪些问题需要优先解决,或者给你构思新优化方向的灵感。