转载

谷歌BigQuery增加了新的公开数据集

Stack Overflow 近日 宣布 ,通过谷歌 BigQuery 提供它的数据集。开发人员可以使用平常的SQL语句查询完整的Stack Overflow数据集,包括帖子、投票、标签和徽章。使用BigQuery的 REST API ,开发人员可以根据需要使用他们自选的工具导出数据。BigQuery上的数据集支持联合查询,开发人员使用普通的SQL就可以跨领域获得有用的见解。

除了Stack Overflow的数据集以外,BigQuery还支持对 Hacker News 数据集 和 GitHub数据集 的访问,这两个数据集连同Stack Overflow数据集可以提供有用的见解。BigQuery近日还围绕纽约市的数据增加了三个数据集,分别是关于 机动车碰撞 、 城市自行车旅行 及311非紧急市政服务 电话请求 。BigQuery之前已经有一个数据集,其中包含2009年到2015年纽约市的每一次 出租车和豪华轿车旅行 ,上述三个数据集对此是一个补充。

当前,BigQuery还有其他可用的数据集,其中包括 气象信息 ( 部分数据远至1763年 )、 医疗 数据、350万 数字化图书 、一个包含元数据并标注了900万URL的 图像数据集 、美国国税局及美国职棒大联盟的数据。还有一个数据集包含了世界各地的新闻和事件,每15分钟更新一次。该数据集是由 GDELT项目 提供的。此外,BigQuery还包含 Personal Genome项目 提供的 Genomics数据集 、 Wikipedia 页面访问量数据以及将近20亿条 Reddit评论 。

感兴趣的读者可以通过 BigQuery控制台 获取Stack Overflow数据集,也可以通过 reddit社区 参与进一步的讨论。

查看英文原文: Google BigQuery Adds New Public Datasets

原文  http://www.infoq.com/cn/news/2017/01/Google-BigQuery-Public-Datasets
正文到此结束
Loading...