服务器启动出现,memory status error?


推荐于 · TA获得超过3.7万个赞


下载百度知道APP,抢鲜体验

使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。

在hadoop启动的时候,会出现各种各样的问题,NameNode,JobTracker等各个模块都会有莫名奇妙的问题出现,在这里对hdfs的问题进行一下简单的记录

启动了集群之后发现namenode起来了,但是各个slave节点的datanode却都没起起来。去看namenode日志发现错误日志:

具体原因还不是很清楚,当防火墙不关闭的时候可能出现,但是当异常宕掉整个系统再重启的时候也会出现。解决办法是master和slave同时重新格式化

在运行任务的过程中,计算突然停止,去计算节点查看TaskTracker日志,发现在计算的过程中抛出以上错误,经查证是因为你的作业打开的文件个数超过系统设置一个进程可以打开的文件的个数的上限。更改/etc/security/limits.conf的配置加入如下配置

查看系统事件记录以了解严重故障事件。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

环境温度到了超出许可范围的某个点。

请参阅"系统冷却问题故障排除"。

内存已超过许可温度,系统已将其禁用以防止组件损坏。

断开系统的交流电源 10 秒,然后重新启动系统。

请参阅"系统冷却问题故障排除"。如果问题仍然存在,请参阅"获得帮助"。

CMOS 电池丢失,或电压超出许可范围。

请参阅"系统电池故障排除"。

RAID 电池丢失、损坏或因温度问题而无法再充电。

重新插入 RAID 电池连接器。请参阅"安装RAID 电池"和"系统冷却问题故障排除"。

3.3V 稳压器出现故障。

请卸下并重置 PCIe 扩充卡。如果问题仍然存在,请参阅"扩充卡故障排除"。

特定处理器 VCORE 稳压器出现故障。

请重置处理器。请参阅"处理器故障排除"。

如果问题仍然存在,请参阅"获得帮助"。

特定处理器 VTT 稳压器出现故障。

请重置处理器。请参阅"处理器故障排除"。

如果问题仍然存在,请参阅"获得帮助"。

接通处理器电源时检测到电源故障。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

某个内存稳压器出现故障。

重置内存模块。请参阅"系统内存故障排除"。

某个内置稳压器出现故障。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

特定风扇的每分钟转数超出预期的操作范围。

请参阅"系统冷却问题故障排除"。

特定模块中的特定风扇的每分钟转数超出预期的操作范围。

请参阅"系统冷却问题故障排除"。

系统中的风扇不再有冗余。如果再次发生风扇故障,系统将存在过热危险。

请查看 LCD 以了解其它滚动信息。请参阅"风扇故障排除"。

检测到严重的系统错误。

请查看 LCD 以了解其它滚动信息。断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

特定处理器已超出可接受的温度范围。

请确保已正确安装了处理器的散热器。请参阅"处理器故障排除"和"系统冷却问题故障排除"。

指定的处理器丢失或损坏,系统的配置不受支持。

请确保指定处理器已正确安装。请参阅"处理器故障排除"。

请确保您的处理器与系统的《使用入门指南》中概述的处理器技术规格所述的型号相符并匹配。

系统 BIOS 已报告处理器协议错误。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 已报告处理器总线奇偶校验错误。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 已报告机器检查错误。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

特定电源设备已拆卸,或者系统缺失此设备。

请参阅"对电源设备进行故障排除"。

特定电源设备出现故障。

请参阅"对电源设备进行故障排除"。

出现电源风扇故障、温度过高的情况,或电源通信错误,导致发出即将发生电源故障的预警。

请参阅"对电源设备进行故障排除"。

已为系统连接上特定电源设备,但没有交流电输入。

检查指定电源设备的交流电源。如果问题仍然存在,请参阅"对电源设备进行故障排除"。

特定电源设备的交流电输入超出了许可范围。

检查指定电源设备的交流电源。如果问题仍然存在,请参阅"对电源设备进行故障排除"。

电源设备子系统不再提供冗余。如果其余电源设备错误,系统将关闭。

请参阅"对电源设备进行故障排除"。

系统中的电源设备功率不同。

请确保安装了功率相匹配的电源设备。请参阅系统《使用入门指南》中列出的技术规格。

系统配置要求使用比电源设备可提供的功率数更大的功率,即使存在节流也是如此。

关闭系统电源,降低硬件配置,或者安装较高功率的电源设备,然后重新启动系统。

请查看 SEL 中的详细信息,然后清除SEL。断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 已报告组件发生 PCI 奇偶校验错误,该组件位于总线 ## 设备 ##功能 ## 的 PCI 配置空间。

请卸下并重置 PCIe 扩充卡。如果问题仍然存在,请参阅"扩充卡故障排除"。

系统 BIOS 已报告位于指定插槽中的组件发生 PCI 奇偶校验错误。

请卸下并重置 PCIe 扩充卡。如果问题仍然存在,请参阅"扩充卡故障排除"。

系统 BIOS 已报告组件发生 PCI 系统错误,该组件位于总线 ## 设备 ## 功能## 的 PCI 配置空间。

请卸下并重置 PCIe 扩充卡。如果问题仍然存在,请参阅"扩充卡故障排除"。

系统 BIOS 已报告组件发生 PCI 系统错误,该组件位于指定的插槽。

请重新安装扩充卡提升板。请参阅"扩充卡和扩充卡提升板"。如果问题仍然存在,则表示提升卡或系统板出现故障。请参阅"获得帮助"。

系统 BIOS 已确定系统中存在错误,但无法确定错误来源。

请查看 SEL 中的详细信息,然后清除SEL。断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 判定系统中存在严重错误。

请查看 SEL 以了解详细信息,然后清除SEL。断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 报告了驻留在总线 ##,设备##,功能 ## 中的芯片集内部错误。

请查看 SEL 以了解详细信息,然后清除SEL。断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 判定指定处理器发生了内部错误。

请查看 SEL 以了解详细信息,然后清除SEL。断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统 BIOS 已报告组件发生 PCIe 致命错误,该组件位于总线 ## 设备 ## 功能 ## 的 PCI 配置空间。

请卸下并重置 PCIe 扩充卡。如果问题仍然存在,请参阅"扩充卡故障排除"。

系统 BIOS 已报告组件发生 PCIe 致命错误,该组件位于指定的插槽。

请重新安装扩充卡提升板。请参阅"扩充卡和扩充卡提升板"。如果问题仍然存在,则表示提升卡或系统板出现故障。请参阅"获得帮助"。

指定的硬盘驱动器出现故障。

请参阅"硬盘驱动器故障排除"。

指定的硬盘驱动器已从系统中卸下。

PCIe 提升板配置不正确。某些无效的配置会阻止系统通电。

请重新安装扩充卡提升板。请参阅"扩充卡和扩充卡提升板"。

如果问题仍然存在,则表示提升卡或系统板出现故障。请参阅"获得帮助"。

丢失一个或两个 PCIe 提升板。这会阻止系统启动。

请重新安装丢失的提升卡。请参阅"装回扩充卡提升板 1"和"装回扩充卡提升板 2"。

SAS 电缆 A 丢失或损坏。

重置电缆。如果问题仍然存在,请更换电缆。

如果问题仍然存在,请参阅"获得帮助"。

SAS 电缆 B 丢失或损坏。

重置电缆。如果问题仍然存在,请更换电缆。

如果问题仍然存在,请参阅"获得帮助"。

连接到控制面板的 USB 电缆丢失或损坏。

重置电缆。如果问题仍然存在,请更换电缆。

如果问题仍然存在,请参阅"获得帮助"。

安装内存或重置内存模块。请参阅"安装内存模块"或"系统内存故障排除"。

检测到内存,但是内存不可配置。配置内存期间检测到错误。

请参阅"系统内存故障排除"。

内存已配置,但不可用。

请参阅"系统内存故障排除"。

系统 BIOS 无法将其快擦写映像复制到内存中。

请参阅"系统内存故障排除"。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

DMA 控制器出现故障。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

可编程间隔计时器错误。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

系统管理中断 (SMI) 初始化失败。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

BIOS 关闭检测程序失败。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"获得帮助"。

请参阅"系统内存故障排除"。

如果问题仍然存在,请参阅"获得帮助"。

请查看屏幕上的具体错误信息。请参阅"处理器故障排除"。

请查看屏幕上的具体错误信息。请参阅"系统内存故障排除"。

请查看屏幕上的具体错误信息。

由于内存模块发生故障或内存配置无效,系统 BIOS 无法启用内存镜像功能。

请参阅"系统内存故障排除"。

插槽 "##" 中的内存模块已发生多位错误 (MBE)。

请参阅"系统内存故障排除"。

系统 BIOS 已禁用内存单位错误 (SBE)记录,在重新引导系统之前,不会再记录更多的 SBE。"##"代表 BIOS 指示的内存模块。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"系统内存故障排除"。

由于系统 BIOS 确定半数镜像中存在太多错误,因此已禁用内存镜像功能。"##和 ##"代表 BIOS 指示的内存模块对。

断开系统的交流电源 10 秒,然后重新启动系统。

如果问题仍然存在,请参阅"系统内存故障排除"。

LCD 溢出信息。LCD 上最多只能按顺序显示十条错误信息。第十一条信息指导用户检查 SEL 以了解事件详情。

查看 SEL 以获取事件详细信息。

断开系统的交流电源 10 秒,或者清除SEL。

SEL 记录的事件已满,无法记录其它内容。

请查看 SEL 中的详细信息,然后清除SEL。

预先警告 RAID 电池只剩下不足 24 小时的电量。

RAID 电池充电,使其剩余电量大于 24小时。

如果问题仍然存在,请更换 RAID 电池。请参阅"安装 RAID 电池"。

系统配置需要使用比电源设备可提供的功率更大的功率。

关闭系统电源,降低硬件配置,或者安装较高功率的电源设备,然后重新启动系统。

系统配置需要使用比电源设备可提供的功率更大的功率,但是如果使用节流功能可以引导。

关闭系统电源,降低硬件配置,或者安装较高功率的电源设备,然后重新启动系统。

我要回帖

更多关于 服务器systembooting 的文章

 

随机推荐