转载

深度学习：实际问题解决指南

当你想进行预测的时候，使用深度学习要比其他机器学习技术更快更有效。

深度学习是一门快速发展的学科，它将数据中高层次化的模式建模成复杂的多层网络。因为这是建模一个问题最一般的方法，深度学习拥有这解决大部分机器学习和人工智能领域问题的潜力。类似微软、谷歌这样的公司使用深度学习来解决诸如语音识别，图像识别，三维物体识别，和自然语言处理等领域的难题。

然而，深度学习需要进行大量的计算来构建一个有用的模型。到目前为止，计算成本和可用性限制了其实际应用。此外，研究人员缺乏理论基础和将深度学习运用到实际问题之中的经验知识。在有充足的时间和资源的情况下，其他的方法通常表现更好。

如今根据摩尔定律的发展，已经从根本上降低了计算成本。此外，创新算法提供了更快更有效训练模型的方式。随着经验和知识的积累，数据科学家从深度学习获得价值也有了更多的理论和实践指导。

然而媒体倾向于报道语音和图像识别这样的未来应用，但是数据科学家使用深度学习来解决企业各个方面非常实际的问题。例如：

支付系统提供商使用深度学习实时识别可疑交易。
具有大型数据中心和计算机网络的机构使用深度学习从日志中挖掘信息检测威胁。
汽车制造商和汽车运营商使用深度学习挖掘传感器数据预测部分车辆故障。
具有大型复杂供应链的公司使用深度学习预测延迟和生产瓶颈。

随着深度学习软件可用性的提高，你可以看到商业化应用在未来几年会迅速增长。

深度学习的强大力量

相对于其他机器学习技术而言，深度学习有四大关键优势：

它能从特征中检测复杂的相互作用。
它能从几乎没有处理的原始数据中学习低层次的特征。
它能处理高基数类成员。
它能处理未标记的数据。

综上所述，拥有这四个优势意味着深度学习可以得到有用的结果而其它方法得不到的有用结果；它能构建比使用其他方法更精确的模型；并且还能减少构建有用模型所需的时间。深度学习在变量间检测相互作用，这些相互作用可能并不明显。相互作用是两个或多个变量组合在一起时产生的效果。比如，假设某种药物在年轻妇女中会有副作用，但是在老年妇女中则没有。一个由性别和年龄组合影响构建的预测模型效果要比单单使用性别影响构建的模型好。

常规的预测建模方法可以度量这些影响，但这需要大量的手工假设检验。 深度学习自动检测这些相互作用，不会依赖于分析师的专业知识或前期假设。 它还会自动创建非线性相互作用，并且可以使用足够的神经元来逼近任意函数，特别是在使用了深度神经网络的时候这种效果尤为明显。

使用常规的预测分析方法，结果的好坏很大程度上取决于数据科学家使用特征工程准备数据的能力，而这一个步骤需要相当多的专业知识和技能。而且特征工程也很耗时。 深度学习几乎不需要处理原始数据，并自动学习最有预测性的特征，而不需要对数据的正确分布做假设 。

下图说明了深度学习的强大能力。这四幅图展示了不同技术是如何对复杂模式建模的。右下角的图，展示了一般线性模型如何用直线拟合数据。基于树的方法，例如随机森林和梯度提升机（分别是左下角和右上角的图）比一般线性模型更好。这些方法通过多条直线而不是一条直线来拟合数据，显著提高了模型的“拟合”性。左上角的图中，深度学习使用复杂曲线拟合数据，得到了精准的模型。

深度学习：实际问题解决指南