转载

中国提出深度学习处理器架构

　　“阿尔法狗”（AlphaGo）以4：1 战胜李世石，这让人工智能备受关注。AlphaGo 目前使用了约 170 个图形处理器（GPU）和 1200 个中央处理器（CPU），这些设备可能需要占用一个机房，还要配备大功率的空调，以及多名专家进行系统维护。对此，中国科学家宣称，AlphaGo 目前用的芯片数量，将来如果换成中国人研制的“寒武纪”架构的芯片，估计一个小盒子就全装下了。

　　这意味着“阿尔法狗”将可以跑得更快些。

　　记者 15 日从中科院计算所获悉，该所陈云霁、陈天石课题组在国际上首先提出了深度学习处理器架构寒武纪。本月他们提出的深度学习处理器指令集 DianNaoYu 被计算机体系结构领域顶级国际会议 ISCA2016 所接收，其评分排名为近 300 篇投稿中的第一名。论文第一作者为刘少礼博士。

　　AlphaGo 就是基于深度学习技术而战胜李世石的。深度学习是一类借鉴生物多层神经网络处理模式所发展起来的智能处理技术，已被微软、谷歌、脸书、阿里、百度等公司广泛应用于计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域。

　　“但是深度学习的基本操作是神经元和突触的处理，而传统的处理器指令集（X86 和 ARM 等）是为了进行通用计算发展起来的，其基本操作为算术操作和逻辑操作，往往需要数百甚至上千条指令才能完成一个神经元的处理，深度学习的处理效率不高。”陈天石说，谷歌甚至需要用上万个 X86 的 CPU 核，运行 7 天来训练一个识别猫脸的深度学习神经网络。

　　陈云霁、陈天石课题组的深度学习处理器指令集——DianNaoYu 直接面对大规模神经元和突触的处理，一条指令即可完成一组神经元的处理。陈天石解释说，与谷歌采用的通用处理器不同，我们设计的处理器芯片专门面向深度学习技术。“通用处理器做深度学习好比是用瑞士军刀切肉，而我们设计专门的切肉刀来切。”

　　原标题：让“阿尔法狗”跑得更快些计算机算法“寒武纪”将引领处理器技术

正文到此结束