Quora 是一家以“分享和推动全球知识增长”为己任的网站。Xavier Amatriain 是 Quora 的工程副总裁。近日,他撰文介绍了 Quora 如何应用机器学习。
Quora 希望提供一个高效且有吸引力的知识分享平台。他们非常关注下面三个维度:
在数据上,可以将 Quora 看作是一个知识库、主题兴趣网络和社交网络的结合体,如下图所示:
可以看出,Quora 创建了一个可以用于机器学习的数据及数据关系生态系统。例如,一个用户可以在特定主题上跟随并支持另一个用户,一个用户可以关注一个主题,等等。这个复杂的生态系统为 Quora 利用数据改进产品和用户体验提供了许多机会。Quora 的数据科学团队已经在这方面做了许多有趣的研究(1、2)。
Quora 的许多功能都使用了机器学习算法,以下是其中的部分功能:
上述每一种解决方案都需要不同的数据用于不同机器学习模型的训练、测试和特征生成。下面是 Quora 用到的部分机器学习模型:
他们之所以用到了这么多模型,是因为不同的模型都有其最适合的场景。
感兴趣的读者,还可以查看关于该主题的博文、视频和幻灯片。