转载

总结|微软研究院开源项目盘点

总结|微软研究院开源项目盘点

2016 9 GitHub 报告显示,微软已在这一全球最大代码托管网站上拥有 16419 位开源贡献者,成为 GitHub 上排名第一的开源贡献者。对于这个全球最大的代码存放网站和开源社区而言,微软的贡献不仅使 Github 上又拥有了一大批帅气美丽聪慧乐于奉献的程序员(严肃脸),还使得开源界的力量更为壮大。对开发者个人而言,更多的开源项目也将帮助他们节省大量造轮子的时间,从而专注于性能表现与用户体验的优化。

总结|微软研究院开源项目盘点

如何利用好微软提供的这些开源工具包资源呢?这篇合集介绍了微软研究院过去两年的几个重要开源项目,如深度学习领域的微软认知工具包(原名 CNTK) 等。大家只需点击每个项目后所附的链接就可以轻松访问。

微软研究院近期开源工具包一览

1. 微软认知工具包(Microsoft Cognitive Toolkit)

总结|微软研究院开源项目盘点

微软认知工具包(原名CNTK) 是微软出品的开源深度学习工具包。新版的微软认知工具包在原有CNTK的基础上增加了对Python的支持,同时在性能方面也有所提高。而经实验室测试表明,微软认知工具包的性能在同等主流工具中表现突出。其设备要求相对灵活,同时支持CPU和GPU模式。因此没有GPU,或者神经网络比较小的实验,可以直接使用CPU版的微软认知工具包。微软认知工具包将神经网络描述成一个有向图的结构,叶子节点代表输入或者网络参数,其他节点计算步骤,它同时支持卷积神经网络和递归神经网络。其开源项目主页是:https://www.microsoft.com/en-us/research/product/cognitive-toolkit/,Github主页地址为: https://github.com/microsoft/cntk 。

2. LightGBM

总结|微软研究院开源项目盘点

由微软亚洲研究院DMTK(分布式机器学习工具包)团队在在GitHub上开源了性能超越其他boosting工具的LightGBM,在三天之内GitHub上被star了1000 次,fork了200 次。LightGBM(Light Gradient Boosting Machine)是一个实现GBDT算法的框架,支持高效率的并行训练,它的主要优势表现在训练方面的高效性、较低的内存占用、更高的准确率、进行并行学习与大规模数据处理的能力。公开数据表明 LightGBM 相较于同类工具,其学习效率和准确性都表现突出。此外,实验也表明LightGBM 通过使用多台机器进行特定设定的训练能取得线性加速。

LightBGM的开源项目地址参见:https://github.com/Microsoft/LightGBM

关于LightGBM的更多入门指南,将会在明日的推送中分享给大家哦,了解更多请查看文末的相关信息。

3.Project Malmo

总结|微软研究院开源项目盘点

微软研究院曾在不久前演示过用游戏《我的世界》来训练人工智能的实验性项目。现在这款项目 Project Malmo 通过GitHub正式开源。研究者可以通过《我的世界》测试人工智能算法,指导人工智能学习并完成一些复杂任务。这一计划可以通过游戏中的人完成现实生活中的计划任务。当微软研究员团队在利用这个工具训练人工智能的角色学习如何爬到虚拟世界的最高点时,这些角色使用的是与人类学习新任务时相同类型的资源。也就是说,这个由科学家研究的小人与普通的人类玩家并无区别,是真正的以人为基础进行的仿真。这样的仿真使研究者完全不需要开发人工智能实体,因此也不再要求研究者有机器人方面的开发背景,就可以进行一些原来只能靠机器人或通过极高成本才能进行的工作。

项目主页可打开连接:https://github.com/Microsoft/malmo

4. SDN

总结|微软研究院开源项目盘点

分布式服务器中的多台服务器该如何连接?连接之后又该如何确保数据传送效率和实时支撑呢? SDN(Software Defined Network) 由此应运而生,它颠覆了传统网络搭建的逻辑,采用虚拟化技术,根据应用数据的不同使用方式,动态调整和分配资源,优化数据的存贮和转移。据此,SDN技术可以为不同的用户群建立不同的虚拟网络,实现不同的资源配置,从而使得物理网络的能力被更加合理的利用。微软现已开发SDN工具帮助开发者快速部署起一套SDN平台。

该项目源码与具体应用方式可打开连接:https://github.com/Microsoft/SDN

5. Sora

总结|微软研究院开源项目盘点

微软亚洲研究院开源的软件无线电项目Sora是一个完全可编程的高性能软件无线电系统,能够快捷而有效地实现当前最前沿的无线通信技术。软硬件平台的创新使Sora在PC上就可以完成高性能的无线信号处理。自2009年首次发表以来,Sora已在学术界获得多项最佳论文和演示大奖。目前已有50多家大学和科研机构在教学和科研中使用Sora。为满足研究者们日益迫切的研究需求,完全开源的Sora系统提供了大量特性,其中包括:支持定制的射频前端,RCB和通信模式。

Github主页:https://github.com/Microsoft/Sora

6. GraphView

总结|微软研究院开源项目盘点

2015年12月16日,微软亚洲研究院系统算法组开发的图数据库GraphView通过GitHub平台开源。GraphView是一款中间件软件,方便用户使用关系数据库SQL Server 或Azure SQL Database高效地管理和处理大规模图数据。GraphView 在物理数据表达以及系统运行行为上和原生图数据库完全一致,填补了关系数据库和图数据库之间的鸿沟。它还继承了关系数据库领域数十年的科研成果,可以提供市面上原生图数据库难以媲美的性能。GraphView的功能包括:完备的查询语言,索引,事物处理和系统管理等等。

GitHub主页为:https://github.com/Microsoft/GraphView

项目更多介绍可访问:http://research.microsoft.com/en-us/projects/graphview/

7. Graph Engine

总结|微软研究院开源项目盘点

2015年5月20日,微软亚洲研究院Graph Engine 1.0预览版正式发布。 Graph Engine 是一个基于内存的分布式大规模图数据处理引擎,能够帮助用户更方便地构建实时查询应用和高吞吐量离线分析平台。Graph Engine在学术界有个更广为人之的名称,叫做Trinity。此外,Graph Engine 还可与强大的集成开发环境Visual Studio以及微软云计算平台Azure无缝集成。无论本地开发还是云端部署,Graph Engine都可以给开发者带来极佳的用户体验。

Github主页源码:https://github.com/Microsoft/GraphEngine

项目主页:https://www.graphengine.io/

以上所有开源工具都体现了这样一种追求:在云时代与移动时代的大背景下,微软奉行的“移动优先、云优先”的新愿景使微软将视野拓展到更为广阔的范围。微软的服务不仅可以在微软的软件或硬件上使用,同时,在各个平台,甚至在不同开发者的应用上,微软的服务也能为更多用户带来更新的技术和更智能易用的用户体验,这才能真正让技术之光照进我们日常生活的每一个角落。毕竟,微软想做的,是真正的“开发者之友”。

以下是福利时间。

微软亚洲研究院第三期线上分享正式启动啦!如何看待微软亚洲研究院新开源的LightGBM?关于LightGBM你有什么想知道的?请关注明天的推送。

总结|微软研究院开源项目盘点

原文  http://blog.sina.com.cn/s/blog_4caedc7a0102wqld.html
正文到此结束
Loading...