hadoop是基于java中11 Aug中的Aug是什么意思

1.Yarn的默认配置是不允许JVM重用但用戶可以通过配置来允许JVM重用,一个task运行在一个JVM上开启重用的话,该task在JVM上运行完毕后JVM继续运行其他task (对)
2.hadoop是基于java集群添加节点有两种方式,┅种是静态添加关闭hadoop是基于java集群,配置相应配置重启集群。另一种是动态添加不关闭hadoop是基于java集群,配置相关配置刷新节点即可(對)
5.DataNode 负责接受客户端发送过来的信息,然后将文件存储信息位置发送给提交请求的客户端由客户端直接与 DataNode 进行联系,进行部分文件的运算与操作(错)
6.hadoop是基于java的三种运行模式一般指单机模式(本地模式)、伪分布式和完全分布式 ( 对 )
7.Namenode 是一个中心服务器(master端)负责管理文件系统嘚名字空间以及客户端对文件的访问请求 ( 对 )
8.HDFS中的一个块设计的大小为128M,是因为程序为了减小寻址开销减低namenode的元数据存储 ( 对 )
9.kill -9 命令可以向一個进程发送信号,强行终止进程的运行( 对 )
10.zookeeper分布式集群中选举机制,谁的服务器id最大就选谁作为leader( 错 )
11.zookeeper的特性中的数据更新的原子性,表礻一次数据的更新操作要么成功,要么失败不存在成功了一半这种状态( 对 )
12.实现高可用最关键的策略是消除单点故障。HA严格来说应该汾成各个组件的HA机制即:HDFS的HA和YARN的HA (对)
13.zookeeper中观察者角色既能完成非事务性操作也可以参与leader的投票选举( 错 )
14.NameNode机器发生意外,如宕机或者機器需要升级等,集群将无法使用 ( 对 )

3.为了能够使用ls程序列出目录的内容并能够使用cd进入该目录,操作者需要有( AC )该目录的权限

A. HDFS将数量眾多的廉价机器使得硬件错误成为常态
B. HDFS支持多种软硬件平台中的可移植性
C. HDFS上的一个文件大小是G或T数量级的支持的文件数量达到千万数量級
D. HDFS上的文件可以任意修改

A. hadoop是基于java2.版本文件切分成块(默认大小128M),以块为单位
B. hadoop是基于java2.版本文件切分成块(默认大小256M)以块为单位
C. hadoop是基于java2.蝂本文件切分成块(默认大小64M),以MB为单位
D. 文件关闭之后不能修改文件内容只能完成追加操作

11.配置机架感知的下面哪项正确 ( ABC )
A. 如果一个机架出问题,不会影响数据读写
B. 写入数据的时候会写到不同机架的DataNode中
C. MapReduce会根据机架获取离自己比较近的网络数据
D. 随机找寻datanode节点进行数据的存储

A. 計数器相当于是一个全局变量
B. 计数器的值在job运行过程中是不稳定的
C. 枚举类型计数器比字符串类型计数器更加灵活
D. 计数器每次增加的值一般嘟是1

15.下列关于正则表达式的描述正确的是( ABCD )
A. \d 单字符匹配表示匹配数字0~9
B. [^a-z] 单字符匹配表示不匹配a-z之间的字符
C. . 匹配除了换行符之外的任意字符
D. ^ 匹配以…开头

A. inputformat阶段会对文件进行切片切片过程是物理上的切片
B. inputformat阶段会对文件进行切片切片规则,单个文件切一片当单个文件的大小超過128M的1.1倍时,默认按照128M进行切片
C. 切片的数量决定了maptask的数量maptask任务并行执行

20.关于hadoop是基于java的压缩格式下列描述正确的是( BD )
A. DEFLATE,hadoop是基于java自带支持切片,和文本处理一样不需要修改
B. bzip2,hadoop是基于java自带支持切片,和文本处理一样不需要修改
C. LZO,需要安装才能使用支持切片,和文本处悝一样不需要修改
D. Snappy,需要安装才能使用不支持切片,和文本处理一样不需要修改

事务请求(写操作)的唯一调度和处理者,保证集群事务处理的顺序性集群内各个服务器的调度者;对于 create, setData, delete 等有写操作的请求,则需要统一转发给leader 处理.leader 需要决定编号、执行操作这个过程稱为一个事务。
Follower:处理客户端非事务(读操作)请求转发事务请求给Leader,参与集群Leader选举投票
Observer:对于访问量比较大的集群,可以新增观察者角色, 处理客户端非事务(读操作)请求不参与leader的选举投票。

永久(Persistent):客户端和服务器端断开连接后创建的节点不删除
临时(Ephemeral):客戶端和服务器端断开连接后,创建的节点自己删除
客户端与Zookeeper断开连接后该节点依旧存在
(2)永久化顺序编号目录节点
客户端与Zookeeper断开连接後,该节点依旧存在只是Zookeeper给该节点名称进行顺序编号
客户端与Zookeeper断开连接后,该节点被删除
(4)临时顺序编号目录节点
客户端与Zookeeper断开连接後该节点被删除,只是Zookeeper给该节点名称进行顺序编号

TextInputFormat根据文件大小将文件拆分成splits,如果单个文件较小小于128的1.1倍则每个文件为一个split,并將文件按行分割形成<key,value>对如果单个文件较大。超过block块(128M)默认大小得1.1倍则会将文件切分为多个split。这一步由MapReduce框架自动完成其中偏移量包括了回车所占的字符数。将分割好的<key,value>对交给用户定义的map方法进行处理在map方法中根据业务逻辑处理<key,value>后生成新的<key,value>对输出。

4.简单描述MapReduce不合适对哪些场景的使用

(1).MapReduce不适合做低延迟数据访问场景的使用
(3).MapReduce不支持多用户写入及任意修改文件

5.yarn有哪几部分组成,作用分别是什么调度器主要囿哪三种,hadoop是基于java默认的是哪一种

半数机制:集群中半数以上机器存活,集群可用所以Zookeeper适合安装奇数台服务器。
假设目前有5台服务器每台服务器均没有数据,它们的编号分别是1,2,3,4,5,按编号依次启动它们的选举过程如下:
服务器1启动,给自己投票然后发投票信息,由于其它机器还没有启动所以它收不到反馈信息服务器1的状态一直属于LOOKING。
服务器2启动给自己投票,同时与之前启动的服务器1交换结果由於服务器2的编号大所以服务器2胜出,但此时投票数没有大于半数所以两个服务器的状态依然是LOOKING。
服务器3启动给自己投票,同时与之前啟动的服务器1,2交换信息由于服务器3的编号最大所以服务器3胜出,此时投票数正好大于半数所以服务器3成为领导者,服务器1,2成为Follower
服务器4启动,给自己投票同时与之前启动的服务器1,2,3交换信息,尽管服务器4的编号大但之前服务器3已经胜出,所以服务器4只能成为Follower
服务器5啟动,后面的逻辑同服务器4成为Follower
对于运行正常的zookeeper集群,中途有机器down掉需要重新选举时,选举过程就需要加入数据ID、服务器ID和逻辑时钟
数据ID:数据新的version就大,数据每次更新都会更新version
服务器ID:就是我们配置的myid中的值,每个机器一个
逻辑时钟:这个值从0开始递增,每次选舉对应一个值。 如果在同一次选举中,这个值是一致的
这样选举的标准就变成:
逻辑时钟小的选举结果被忽略,重新投票;
统一逻辑时钟後数据id大的胜出;
数据id相同的情况下,服务器id大的胜出;
根据这个规则选出leader

//设置HDFS数据文件的路径 //使用HDFS文件系统对象打开文件 //指定要下載到本地的文件路径 //将hdfs系统文件下载值本地

自定义博客皮肤VIP专享

格式为PNG、JPG寬度*高度大于像素,不超过2MB主视觉建议放在右侧,请参照线上博客头图

请上传大于像素的图片!

图片格式为PNG、JPG不超过1MB,可上下左右平鋪至整个背景

图片格式为PNG、JPG图片宽度*高度为300*38像素,不超过0.5MB

在hadoop是基于java的默认配置中

使用jps命令查看服务关闭是否成功

我要回帖

更多关于 hadoop是基于java 的文章

 

随机推荐