转载

Quora是如何应用机器学习的?

  Quora 是一家以“分享和推动全球知识增长”为己任的网站。Xavier Amatriain 是 Quora 的工程副总裁。近日,他撰文介绍了 Quora 如何应用机器学习。

  Quora 希望提供一个高效且有吸引力的知识分享平台。他们非常关注下面三个维度:

  • 相关性:确保每个人都获得了他们最感兴趣的那类知识;
  • 需求:确保许多人都有的问题得到好的回答;
  • 质量:确保知识的高质量。

  在数据上,可以将 Quora 看作是一个知识库、主题兴趣网络和社交网络的结合体,如下图所示:

Quora是如何应用机器学习的?

  可以看出,Quora 创建了一个可以用于机器学习的数据及数据关系生态系统。例如,一个用户可以在特定主题上跟随并支持另一个用户,一个用户可以关注一个主题,等等。这个复杂的生态系统为 Quora 利用数据改进产品和用户体验提供了许多机会。Quora 的数据科学团队已经在这方面做了许多有趣的研究(1、2)。

  Quora 的许多功能都使用了机器学习算法,以下是其中的部分功能:

  • 答案排序
  • 订阅讯息排序
  • 主题推荐
  • 用户推荐
  • 邮件摘要
  • Ask2Answer
  • 重复问题
  • 相关问题

  上述每一种解决方案都需要不同的数据用于不同机器学习模型的训练、测试和特征生成。下面是 Quora 用到的部分机器学习模型:

  • 逻辑回归
  • 弹性网络
  • 梯度步进决策树
  • 随机森林
  • (深度)神经网络
  • LambdaMART
  • 矩阵因子分解
  • LDA

  他们之所以用到了这么多模型,是因为不同的模型都有其最适合的场景。

  感兴趣的读者,还可以查看关于该主题的博文、视频和幻灯片。

正文到此结束
Loading...