转载

微软图像识别系统准确率跃居第一击败谷歌

　　北京时间 12 月 11 日消息，据科技博客 VentureBeat 报道，在第六届 ImageNet 年度图像识别测试中，微软研究院的计算机图像识别系统在几个类别的测试中拔得头筹，击败了谷歌、英特尔、高通、腾讯以及一些创业公司和学术实验室的系统。ImageNet 是全球最大的图像识别数据库。

　　微软的获胜系统名为“图像识别的深度残差学习”(Deep Residual Learning for Image Recognition)，由微软研究员何恺明、张祥雨、任少卿和孙剑组成的团队开发。微软称，公司将在未来发表的论文中详细介绍这一系统。

　　考虑到这项技术的复杂性，它可以称得上一项了不起的成就。“我们对神经网络的训练深度超过了 150 层，”该团队称，“我们提出了一个‘深度残差学习’框架，它能够减少优化，整合极深度网络。当网络的深度在之前基础上显著加深时，我们的’深度残差网络’的准确率就会提升。这种准确率的提升是很多普通网络在加深时无法达到的。”

　　科技公司现在十分热衷于深度学习领域的研究，他们希望借此改进自主内部系统及其消费级产品。深度学习是高性能网络的核心，涉及在照片等大数据基础上训练人工智能神经网络，然后向它们提供新数据，获得推断结果。

　　微软已经通过几款有趣的应用展示了公司在人工智能领域的实力，比如“我看起来有多大”(How Old Do I Look?)、“我的胡子怎么样”(How’s My Moustache Doing?)。微软还建立了 Project Oxford 项目，以实现图像识别技术的商业化。

　　ImageNet 要求参赛系统对来自图片分享网站 Flickr 和搜索引擎的 10 万张照片进行精确定位，然后尽可能准确地将他们划分到 1000 种目标类别下，包括狼蛛、iPod、清真寺、玩具店、调制解调器等。

　　微软获胜系统的分类错误率为 3.5%，定位错误率为9%。过去几年，谷歌、创业公司 larifai、NEC 一直在图像分类准确率上占先。

　　微软的系统今年还在 ImageNet 的目标侦测测试中占据第一位。“甚至连我们自己都不相信这种单一想法能够取得这么好的效果，”孙剑称。

　　百度并未参与今年的 ImageNet 测试。去年，百度的测试存在违规行为，采用了密集测试的方法以提高成绩。百度随后道歉，并解雇了团队负责人。百度因此被禁止提交测试成绩 1 年。

　　在这次测试中，IBM 提供了 SoftLayer 公有云服务供参赛团队使用，使用的是英伟达的图形处理器。

正文到此结束