优化算法

如何解决训练样本少的问题

目前大部分的深度学习模型仍然需要海量的数据支持。例如 ImageNet 数据就拥有1400多万的图片。而现实生产环境中,数据集通常较小,只有几万甚至几百个样本。这时候,如何在这种情况下应用深度学习呢?


L-BFGS

牛顿法

  设f(x)是二次可微实函数,又设\(x^{(k)}\)f(x)一个极小点的估计,我们把f(x)\(x^{(k)}\)处展开成Taylor级数, 并取二阶近似。