Apache Hadoop YARN是什么

Apache Hadoop YARN是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

Apache Hadoop YARN

YARN 是新一代 Hadoop 资源管理器,通过 YARN,用户可以运行和管理同一个物理集群机上的多种作业,例如 MapReduce 批处理和图形处理作业。这样不仅可以巩固一个组织管理的系统数目,而且可以对相同的数据进行不同类型的数据分析。某些情况下,整个数据流可以执行在同一个集群机上。

YARN 的基本思想是将 JobTracker 的两个主要功能(资源管理和作业调度/监控)分离,主要方法是创建一个全局的 ResourceManager(RM)和若干个针对应用程序的 ApplicationMaster(AM)。这里的应用程序是指传统的 MapReduce 作业或作业的 DAG(有向无环图)。

YARN 分层结构的本质是 ResourceManager。这个实体控制整个集群并管理应用程序向基础计算资源的分配。ResourceManager 将各个资源部分(计算、内存、带宽等)精心安排给基础 NodeManager(YARN 的每节点代理)。ResourceManager 还与 ApplicationMaster 一起分配资源,与 NodeManager 一起启动和监视它们的基础应用程序。在此上下文中,ApplicationMaster 承担了以前的 TaskTracker 的一些角色,ResourceManager 承担了 JobTracker 的角色。ApplicationMaster 管理一个在 YARN 内运行的应用程序的每个实例。ApplicationMaster 负责协调来自 ResourceManager 的资源,并通过 NodeManager 监视容器的执行和资源使用(CPU、内存等的资源分配)。请注意,尽管目前的资源更加传统(CPU 核心、内存),但未来会带来基于手头任务的新资源类型(比如图形处理单元或专用处理设备)。从 YARN 角度讲,ApplicationMaster 是用户代码,因此存在潜在的安全问题。YARN 假设 ApplicationMaster 存在错误或者甚至是恶意的,因此将它们当作无特权的代码对待。

NodeManager 管理一个 YARN 集群中的每个节点。NodeManager 提供针对集群中每个节点的服务,从监督对一个容器的终生管理到监视资源和跟踪节点健康。MRv1 通过插槽管理 Map 和 Reduce 任务的执行,而 NodeManager 管理抽象容器,这些容器代表着可供一个特定应用程序使用的针对每个节点的资源。YARN 继续使用 HDFS 层。它的主要 NameNode 用于元数据服务,而 DataNode 用于分散在一个集群中的复制存储服务。

要使用一个 YARN 集群,首先需要来自包含一个应用程序的客户的请求。ResourceManager 协商一个容器的必要资源,启动一个 ApplicationMaster 来表示已提交的应用程序。通过使用一个资源请求协议,ApplicationMaster 协商每个节点上供应用程序使用的资源容器。执行应用程序时,ApplicationMaster 监视容器直到完成。当应用程序完成时,ApplicationMaster 从 ResourceManager 注销其容器,执行周期就完成了。

基本缺陷

MapReduce 的第一个版本既有优点也有缺点。MRv1 是目前使用的标准的大数据处理系统。但是,这种架构存在不足,主要表现在大型集群上。当集群包含的节点超过 4,000 个时(其中每个节点可能是多核的),就会表现出一定的不可预测性。其中一个最大的问题是级联故障,由于要尝试复制数据和重载活动的节点,所以一个故障会通过网络泛洪形式导致整个集群严重恶化。

但 MRv1 的最大问题是多租户。随着集群规模的增加,一种可取的方式是为这些集群采用各种不同的模型。MRv1 的节点专用于 Hadoop,所以可以改变它们的用途以用于其他应用程序和工作负载。当大数据和 Hadoop 成为云部署中一个更重要的使用模型时,这种能力也会增强,因为它允许在服务器上对 Hadoop 进行物理化,而无需虚拟化且不会增加管理、计算和输入/输出开销。

主要优点

大大减小了 JobTracker(也就是现在的 ResourceManager)的资源消耗,并且让监测每一个 Job 子任务 (tasks) 状态的程序分布式化了,更安全、更优美。

在新的 Yarn 中,ApplicationMaster 是一个可变更的部分,用户可以对不同的编程模型写自己的 AppMst,让更多类型的编程模型能够跑在 Hadoop 集群中,可以参考 hadoop Yarn 官方配置模板中的 mapred-site.xml 配置。

对于资源的表示以内存为单位 ( 在目前版本的 Yarn 中,没有考虑 cpu 的占用 ),比之前以剩余 slot 数目更合理。

老的框架中,JobTracker 一个很大的负担就是监控 job 下的 tasks 的运行状况,现在,这个部分就扔给 ApplicationMaster 做了,而 ResourceManager 中有一个模块叫做 ApplicationsMasters( 注意不是 ApplicationMaster),它是监测 ApplicationMaster 的运行状况,如果出问题,会将其在其他机器上重启。

Container 是 Yarn 为了将来作资源隔离而提出的一个框架。这一点应该借鉴了 Mesos 的工作,目前是一个框架,仅仅提供 java 虚拟机内存的隔离,hadoop 团队的设计思路应该后续能支持更多的资源调度和控制 , 既然资源表示成内存量,那就没有了之前的 map slot/reduce slot 分开造成集群资源闲置的尴尬情况。

(0)
时间不会说谎  的头像时间不会说谎  

相关推荐

  • 台式电脑摄像头驱动,如何安装和更新驱动程序

    本文目录一览为什么需要安装和更新台式电脑摄像头驱动程序?如何安装台式电脑摄像头驱动程序?如何更新台式电脑摄像头驱动程序?如何解决摄像头驱动程序问题?结论在开始讲述如何安装和更新台式电脑摄像头驱动程序之前,首先需要了解什么是台式电脑摄

    2023年12月15日
  • 长虹3d42c3000i,怎样调节最佳画质

    本文目录一览长虹3d42c3000i(怎样调节最佳画质)长虹3d42c3000i(怎样调节最佳画质)长虹3d42c3000i是一款非常优秀的电视,它的画面效果非常出色。但是,如果你想得到最佳的画质效果,你需要进行一些调节。下面,我将为你介

    2023年10月26日
  • 海康威视三年后工资会涨吗,解析海康威视员工薪资制度

    关键词:海康威视三年后工资海康威视作为中国最大的监控设备制造商之一,其在行业内的地位不言而喻。作为一家大型企业,其员工薪资也是广受关注的话题。那么,海康威视员工的薪资制度是怎样的?三年后工资会涨吗?本文将对此进行解析。一、海康威视员工薪

    2023年12月4日
  • 小学生投影仪手工制作,如何制作简易投影仪

    作为一名小学生,你是否曾经想过自己动手制作一台投影仪呢?今天,我将为大家介绍一种简单易行的小学生手工制作投影仪的方法。材料准备:1.卡纸2.透明胶带3.放大镜4.手机或平板电脑5.黑色纸板6.剪刀7.胶水步骤一:制作投影仪

    2024年1月3日
  • 抖音怎么删除历史浏览记录

    打开抖音在自己的界面中点击下图选中的按钮,点击打开界面;然后就可以看到对应的【观看历史】功能,点击进入到界面中;然后在界面中只需要点击右上角的【清空】就可以删除所有的观看历史记录,…

  • 爱华A29学生平板电脑,值得购买吗?

    作为一名学生,拥有一款适合自己的平板电脑是非常必要的。而爱华A29学生平板电脑作为市面上备受瞩目的学生平板电脑之一,究竟值不值得购买呢?本文将从性能、外观、价格等多个方面进行分析,为大家解答这个问题。一、性能首先,我们来看看爱华A29学

    2023年12月11日
  • 联想K26笔记本参数,包括处理器、内存、硬盘等配置是什么

    作为一款备受关注的笔记本电脑,联想K26笔记本备受瞩目。它的处理器、内存、硬盘等配置参数是什么呢?在本文中,我们将对这些参数进行详细的介绍,帮助您更好地了解这款笔记本电脑。处理器首先,让我们来看看联想K26笔记本的处理器。它采用了英特尔

    2023年10月6日
  • 嵌入式文件系统是什么

    嵌入式文件系统是指嵌入式系统中实现文件存取、管理等功能的模块,提供一系列文件输入输出等文件管理功能,为嵌入式系统和设备提供文件系统支持。 嵌入式文件系统(Embedded file…

  • 百诺a2681t三脚架,值得购买吗?

    作为一名摄影爱好者,拍摄稳定是非常重要的,而三脚架就是我们拍摄时的得力助手。其中,百诺a2681t三脚架备受好评,但是它是否值得购买呢?今天,我们就来一探究竟。一、百诺a2681t三脚架的外观百诺a2681t三脚架是一款轻便型三脚架,重

    2023年11月26日
  • 手机如何录制微课,简单易学的技巧分享

    随着互联网的发展,微课成为了一种非常流行的学习方式。微课不仅可以方便学生随时随地地学习,也可以帮助老师更好地教学。而手机录制微课也成为了一种非常方便的方式。在这篇文章中,我们将会为大家介绍一些简单易学的技巧,帮助大家更好地使用手机录制微课。

    2023年11月4日
  • win10分辨率不合适怎么办,如何快速调整屏幕分辨率

    本文目录一览Win10分辨率不合适怎么办(如何快速调整屏幕分辨率)什么是屏幕分辨率?为什么会出现分辨率不合适的问题?如何快速调整屏幕分辨率?总结Win10分辨率不合适怎么办(如何快速调整屏幕分辨率)Win10是目前广泛使用的操作系

    2023年11月24日
  • 交通银行信用卡还款日是什么时候

    交行信用卡还款日也就是账单日后的第 25 天,如果你的信用卡账单日为固定的每月 3 号,那还款日就是账单日后第 25 天,也就是每月 28 号。 交行信用卡还款日也就是账单日后的第…

  • JBL Reflect Flow Pro 专为运动打造的真无线耳塞

    JBL Reflect Flow Pro 是一套出色的真正无线运动耳机,在贴合度、音质、电池寿命和专为艰苦运动而打造的设计之间取得了适当的平衡。它们的主动降噪技术也表现良好,虽然在…

  • 华为Nova 12怎么开启长辈关怀功能?

    相较于华为之前推出的华为Mate60系列来说,华为Nova12的价格要便宜的多,虽然性能配置要差一点,但日常使用还是非常不错的。很多小伙伴都为家中的长辈购买了这款手机,为了方便长辈们的使用,大家可以在华为Nova12上开启长辈关怀模式。

    2024年1月28日
  • 软件著作权专有许可和非专有许可有什么区别

    软件著作权的专有许可使用包括独占使用许可和排他使用许可。软件著作权人仅许可一家以某种方式使用自己的软件,不再向第三人发放同样许可。非专有许可就是普通使用许可,软件著作权人许可一家以…

发表回复

登录后才能评论