转载

为什么说FB制作人口地图是一场重大胜利?

为什么说FB制作人口地图是一场重大胜利?

  美国人使用的地图服务非常精良。在网上键入“汉堡王”几个字,谷歌就可以提供附近十几个汉堡王餐厅的信息,每一个都有精确的经度和纬度数据。

  但在世界上很多其他地方,并没有这样的地图可用。虽然这些国家可能开展了普查工作,但可能只有县一级或者省一级的数据可用,不会详细到街道。

  就拿人口数据来举例吧,现在全世界有 74 亿人口。他们生活在人口密集的城市中心,或者居住在农场分隔的小城镇中,或者住在丛林边缘。但是其中有很多人口,没人知道他们究竟住在哪里。

  现在,Facebook 表示,它已经 20 亿人制作出了不错的人口地图,效果超过以往任何的项目。该公司的连接实验室(Connectivity Labs) 本周宣布,它制作了 20 个国家(其中大部分是发展中国家)的高分辨率人口分布图。但是要到今年晚些时候,它才会发布这些地图中的绝大部分。不过,如果这些地图真的准确,它们就会是大多数国家有史以来质量最好的人口地图。

  这些地图值得注意的另一个原因是:如果它们很准确,就会宣告一个新的人工智能辅助时代的到来。

  人口地图的重要性

  在富裕国家,可靠的人口信息被视为是理所当然的事情。

  人口分布图在不同领域有几十种应用。城市规划者需要用它来估计城市密度,以便规划和改善道路状况。流行病学和公共卫生工作者使用它来跟踪疫情或分析人们获得卫生医疗服务的状况。如果有灾难发生,人口地图都可以用来确定应该优先考虑为哪些地方提供紧急援助。

  Facebook 对这种数据的兴趣存在利润上的原因。全球大约有 40 亿人还没有使用 Facebook,这事关该公司的未来发展前景,所以它对地图的兴趣,有基础设施方面的原因。该公司想知道,对于这些地方的人,用哪种方法上网最好:使用光纤,还是无人机、卫星或高空气球?

  这就是 Facebook 为什么会选择这些国家的部分原因:在这些国家的一些农村地区,人们仍然无法上网。一共有 20 个国家,包括尼日利亚、肯尼亚、乌干达、土耳其、乌克兰、乌兹别克斯坦和印度。随便说一句,Facebook 的 Free Basics 产品刚刚在印度被泼了一瓢凉水。Free Basics 和连接实验室都隶属于 Internet.org,这个组织的目标是扩大网络以及 Facebook 服务的覆盖范围。

  Facebook 的方法很简单?

  但是,在所有这 20 个国家,Facebook 是怎么做出更好的人口地图,超越了当地政府水平的呢?他们又没有像谷歌街景车那样到处转悠。答案就在于 Facebook 拥有极为可观的计算能力。

  这些地图其实是这么制作的:首先,Facebook 的连接实验室要拿到当前最优质的世界人口信息,这是哥伦比亚大学(Columbia University)提供的一个数据集,被称为“全球人口网格”(Gridded Population of the World)。它综合了各地的人口普查数据,调整到相同的年份。虽然它是全世界目前最优质的人口地图,但它的分辨率不怎么高: Facebook 表示,一个网格可以代表城市地区的几平方公里,也可以代表农村地区的几万平方公里。

  然后,Facebook 又从 DigitalGlobe 公司购买了大量的高分辨率卫星图像。目前太空中大部分私人的高分辨率地球观测卫星都是由这家公司经营的。当你在谷歌地图上看自己的房子时,你通常是(但并不总是)通过 DigitalGlobe 公司的四个轨道镜头之一看到的。

  DigitalGlobe 公司的图像大多数属于“小度量的”,也就是说,网格的一条边不是数百公里,而是 50 厘米。 Facebook 的开发人员训练该公司的神经网络算法,让它识别在这些数据中,一栋建筑物从上面看起来是什么样子。然后开始进行识别。该软件根据它能看到的建筑物数量来估计城市人口密度,并且进行推算,把当前最佳人口数据分配到居住区中。

  “他们设定了一个相当基本的假设:如果看见到一栋建筑物,必定就有人在那里,”哥伦比亚大学地球科学家说罗伯特·陈说。他是 Facebook 所使用的基础数据集“全球人口网格”团队的主管。

  你可能觉得这种方式听上去很简单,其实它本来就这么简单。它仅仅需要访问神经学习软件,需要耗用大量计算能力。 Facebook 估计它分析了 20 个国家的 2160 万平方公里土地,“为此,我们用神经网络处理了 146 亿张图像;这是 Facebook 每天分析的所有图像数量的十倍多”。

  罗伯特·陈警告说,Facebook 的数据不能被用来计算和当地居民有关的城市密度。但是,“你可以想见,在其他很多情况下,这些数据有多么宝贵,”他说。

  Facebook 还没有发布这些地图的最终版本。它说,最终版本将在今年夏天发布。在发布之前,罗伯特·陈的团队将对它的准确性进行判定。虽然 Facebook 的早期结果令人鼓舞,他罗伯特·陈说,他仍然不知道这项技术会有多么精确,也不知道适用性是否广泛。 “我们只看到了它的部分状况,”他说,但是,如果该技术的效果令人满意,Facebook 的这个项目就会新增另外 6 个国家。

  一个重大胜利?

  如果事实证明这些数据很有用,那么连接实验室的成功就会标志着一个重大胜利的到来,因为长期以来,开发人员在使用卫星数据时一直面临着一个阻碍:用算法解释图像。

  在未来的五年里,硅谷投资的卫星公司将向公众发布大量影像,远远超过以前的水平。这些影像的成本会比以往任何时候都更加便宜,而且也更加“新鲜”:由于卫星制造上的进步,以及火箭成本的下降,一些公司承诺提供每周六、七次的重访问率(revisit rates)。

  如果公司——尤其是金融公司——学不会如何用机器破译这种新的数据,它们就不会有什么价值。公司必须懂得如何从影像中抽取信息,而不需要人员坐在桌子旁埋头苦干,目前,像 Skybox(属于 Alphabet 集团)和笛卡尔实验室(Descartes Labs)这样的初创公司表示,他们已经在这方面取得了一些进步。如果 Facebook 制作的地图真的成功了,那么这个目标的可行性就会获得进一步的证实。

正文到此结束
Loading...