使用Solr和Mahout的推荐系统[已关闭]

2022-09-03 14:27:38

我一直在阅读有关使用Solr和Mahout开发推荐系统的信息。

据我所知,他们处理两个不同的问题。

  1. 由于Solr是一个搜索引擎+分类系统,因此它主要用于Drupal中的“更像这样”之类的推荐 - http://jamidwyer.com/d7/node/21

(或 StackOverflow 中的“相关”功能)

  1. 在Mahout的情况下,它实现了像Collaborative Filtering.It 这样的机器学习算法,可以用来根据用户以前的操作在亚马逊上实现建议等功能。(喜欢,购买的物品)

我的问题 ,

它们是否用于解决两个不同的问题?

它们可以集成吗?

我读到Mahout做离线处理和可扩展。这是否意味着Solr无法缩放?


答案 1

这些是针对不同问题的不同工具。Solr并没有真正提出建议,它根据内容提出了类似的文档。这不是个性化的,因为它与用户无关。它非常擅长这个特定的问题。

Taste / Mahout用于协作过滤,它不是特定于文档或任何其他类型的东西,并且在“类似项目”和建议基于用户 - 项目交互而不是项目属性方面存在重大差异。

两者都可以很好地扩展,具体取决于您的需求和含义。没有理由怀疑Solr。

关于Mahout和推荐者,简而言之,它有两部分。One piece(Taste)是实时的,而不是基于Hadoop的,并且可以在一台机器上扩展到适度的数据集(可能是1000万个数据点)。然后,Mahout添加了一个基于Hadoop的,非实时的,可以扩展的批处理实现。(Ad:我是上述文章的主要作者,并且正在开发一个基于这两个系统的下一代系统,称为Myrrix。如果您对可扩展和实时Mahout风格的推荐器感兴趣,它将很有吸引力。

如果你对一家公司基于上述内容组建一个平台感兴趣,包括Solr,你应该看看NGDATA


答案 2

你是对的,他们解决了两个不同的问题,到目前为止,我还没有看到/发现任何现有的集成可以开箱即用。

您可以做的是使用 Mahout 分类结果向索引文档添加更多信息,然后这些信息可用于提升目的。

关于你最后的答案 - Solr可以扩展,使用刚刚发布的4.0版本,它甚至可以比以前更好地扩展。但它解决了不同的目的,并很好地扩展了它。

你的问题有点不具体,所以我希望这在某种程度上有所帮助。

干杯


推荐