Apache Helix vs YARN
2022-09-02 23:09:24
Apache Helix和Hadoop YARN(MRv2)有什么区别?有没有人对这两种技术都有经验?有人可以解释一下Helix相对于YARN的优缺点,以及为什么LinkedIn的人开发了自己的集群管理而不是使用YARN?
提前感谢托比
Apache Helix和Hadoop YARN(MRv2)有什么区别?有没有人对这两种技术都有经验?有人可以解释一下Helix相对于YARN的优缺点,以及为什么LinkedIn的人开发了自己的集群管理而不是使用YARN?
提前感谢托比
虽然Helix和YARN都提供了管理分布式应用程序的功能,但两者之间存在重要差异。
YARN 主要跨计算机群集提供资源管理功能,同时要求应用程序编写其自定义逻辑以从资源管理器协商资源。另一方面,Helix 提供了一种以声明方式管理分布式应用程序状态的方法,从而使应用程序不必执行自定义实现。目前,Helix不提供与YARN相同的资源管理功能。因此,这两个系统是相当互补的。
如图所示,假设您有一组节点,并且想要在这些节点上启动一些容器。
YARN提供了框架/机器来做上述工作。拥有容器后,必须实现以下功能:
Helix可以轻松实现上述功能。在YARN中,需要编写应用程序主机来实现这些(这种实现的一个例子是hadoop map reduce作业的应用程序主机)。
Helix是在LinkedIn开发的,用于管理在线/近线空间中的分布式数据系统。在这个空间中,一旦容器被启动,它就会永远运行,直到崩溃。当容器失败时,任务可能会在其余容器之间重新分配。
YARN附带资源调度算法,允许灵活有效地利用可用硬件来完成短期任务,如map reduce作业。