如何在rocks安装 cluster 安装装软件

基于Rocks的高性能集群平台搭建与应用_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
基于Rocks的高性能集群平台搭建与应用
上传于||暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩1页未读,继续阅读
你可能喜欢新手园地& & & 硬件问题Linux系统管理Linux网络问题Linux环境编程Linux桌面系统国产LinuxBSD& & & BSD文档中心AIX& & & 新手入门& & & AIX文档中心& & & 资源下载& & & Power高级应用& & & IBM存储AS400Solaris& & & Solaris文档中心HP-UX& & & HP文档中心SCO UNIX& & & SCO文档中心互操作专区IRIXTru64 UNIXMac OS X门户网站运维集群和高可用服务器应用监控和防护虚拟化技术架构设计行业应用和管理服务器及硬件技术& & & 服务器资源下载云计算& & & 云计算文档中心& & & 云计算业界& & & 云计算资源下载存储备份& & & 存储文档中心& & & 存储业界& & & 存储资源下载& & & Symantec技术交流区安全技术网络技术& & & 网络技术文档中心C/C++& & & GUI编程& & & Functional编程内核源码& & & 内核问题移动开发& & & 移动开发技术资料ShellPerlJava& & & Java文档中心PHP& & & php文档中心Python& & & Python文档中心RubyCPU与编译器嵌入式开发驱动开发Web开发VoIP开发技术MySQL& & & MySQL文档中心SybaseOraclePostgreSQLDB2Informix数据仓库与数据挖掘NoSQL技术IT业界新闻与评论IT职业生涯& & & 猎头招聘IT图书与评论& & & CU技术图书大系& & & Linux书友会二手交易下载共享Linux文档专区IT培训与认证& & & 培训交流& & & 认证培训清茶斋投资理财运动地带快乐数码摄影& & & 摄影器材& & & 摄影比赛专区IT爱车族旅游天下站务交流版主会议室博客SNS站务交流区CU活动专区& & & Power活动专区& & & 拍卖交流区频道交流区
UID8384757空间积分0 积分4阅读权限10帖子精华可用积分4 信誉积分106 专家积分0 在线时间2 小时注册时间最后登录
白手起家, 积分 4, 距离下一级还需 196 积分
帖子主题精华可用积分4 信誉积分106 专家积分0 在线时间2 小时注册时间最后登录
论坛徽章:0
当申请资源超过8个cpu(单个计算节点为8个计算核心),也就是需要超过一个计算节点的cpu时,脚本就不能正常运行,具体如下:
Rocks cluster 5.3,使用SGE提交脚本来测试mpi-ring(脚本来自Rocks sge范例),使用8个或者更少的计算核心时,运行正常,如:
$ qsub -pe orte 2 mpi-ring.qsub
使用超过8个计算核心时,运行不正常,运行状态先是&r&,而后变成&dr&,如:
[xuwenyue@big mpi-test]$ qstat
job-ID&&prior& &name& && & user& && && &state submit/start at& &&&queue& && && && && && && && &&&slots ja-task-ID
-----------------------------------------------------------------------------------------------------------------
& &&&25 0.55500 mpi-test.q xuwenyue& &&&r& &&&04/20/:22 & && && & 16& && &&&
[xuwenyue@big mpi-test]$ qstat
job-ID&&prior& &name& && & user& && && &state submit/start at& &&&queue& && && && && && && && &&&slots ja-task-ID
-----------------------------------------------------------------------------------------------------------------
& &&&25 0.55500 mpi-test.q xuwenyue& &&&dr& & 04/20/:22 & && && & 16& && &&&
生成的错误信息如下:
[xuwenyue@big mpi-test]$ cat mpi-test.qsub.o25
error: error: ending connection before all data received
error reading job context from &qlogin_starter&
--------------------------------------------------------------------------
A daemon (pid 8970) died unexpectedly with status 1 while attempting
to launch so we are aborting.
There may be more information reported by the environment (see above).
This may be because the daemon was unable to find all the needed shared
libraries on the remote node. You may set your LD_LIBRARY_PATH to have the
location of the shared libraries on the remote nodes and this will
automatically be forwarded to the remote nodes.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that the job aborted, but has no info as to the process
that caused that situation.
--------------------------------------------------------------------------
mpirun: clean termination accomplished
qlogin命令正常,qrsh不正常,如
# qrsh -verbose
Your job 62 (&QRLOGIN&) has been submitted
waiting for interactive job to be scheduled ...(several minutes)error:
error: ending connection before all data received
error reading job context from &qlogin_starter&
&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp
UID1719234空间积分0 积分1547阅读权限30帖子精华可用积分1547 信誉积分112 专家积分5 在线时间723 小时注册时间最后登录
家境小康, 积分 1547, 距离下一级还需 453 积分
帖子主题精华可用积分1547 信誉积分112 专家积分5 在线时间723 小时注册时间最后登录
论坛徽章:0
集群是否允许了rsh登陆?
UID8384757空间积分0 积分4阅读权限10帖子精华可用积分4 信誉积分106 专家积分0 在线时间2 小时注册时间最后登录
白手起家, 积分 4, 距离下一级还需 196 积分
帖子主题精华可用积分4 信誉积分106 专家积分0 在线时间2 小时注册时间最后登录
论坛徽章:0
需要开启rsh么?应该不是这样吧
Inglorious Bastards
UID空间积分0 积分168阅读权限10帖子精华可用积分168 信誉积分100 专家积分0 在线时间23 小时注册时间最后登录
白手起家, 积分 168, 距离下一级还需 32 积分
帖子主题精华可用积分168 信誉积分100 专家积分0 在线时间23 小时注册时间最后登录
论坛徽章:0
本帖最后由 numdisp 于
09:50 编辑
This may be because the daemon was unable to find all the needed shared
libraries on the remote node. You may set your LD_LIBRARY_PATH to have the
location of the shared libraries on the remote nodes and this will
automatically be forwarded to the remote nodes.
涸泽而渔 发表于
这不是有提示么,计算节点上有相应的运行库么?
ssh到任意计算节点,然后在该节点上本地运行一下程序(不提交到SGE),能正确执行么?
rsh的话,只是有些程序需要(主要是一些使用了老的运行库的程序),现在的大部分应用应该不需要了。
不过Rocks的玩意实在是bug多。曾经研究过他们的一些源代码,许多地方简直令人发指。文档也不怎么样,经常是新版本的文档里还混杂着极其旧的信息,完全误导。
创客168第4期:业务导向下的运维管理
创客168第4期沙龙活动聚焦运维话题,邀请优秀互联网企业技术专家分享运维平台建设,运维常用工具实践,成长型企业面临的运维和安全问题,应用性能管理解决方案等运维话题。,聚焦发展中的关键和共性运维技术难点。
----------------------------------------
活动日期:日
活动地点:长林咖啡书屋
北京皓辰网域网络信息技术有限公司. 版权所有 京ICP证:060528号 北京市公安局海淀分局网监中心备案编号:
广播电视节目制作经营许可证(京) 字第1234号
中国互联网协会会员&&联系我们:
感谢所有关心和支持过ChinaUnix的朋友们
转载本站内容请注明原作者名及出处Rocks Cluster Distribution 6.2发布 - 推酷
Rocks Cluster Distribution 6.2发布
前几天Philip Papadopoulos 宣布发布最新的稳定版本
Distribution 6.2,这是基于CentOS设计来建设真实和虚拟
这次发布的最新的版本代号为 Sidewinder,此版本只支持64位并且是基于CentOS 6.6以上系统,并且此操作系统有所有截止到日的更新软件。
主要更新:
● 对ZFS的支持已经更新到ZFS 0.6.4.1 版本
● Condor 是HTCondor 8.2.8版本
● 支持perfSONAR, 当你在主机上自定义安装 &perfSONAR &时会给你四个 perfSONAR 的元素属性
建立者能够决定是否完全安装GUI或者只是安装命令工具
● 能够重新配置集群的全称域名(FQDN)
注意事项:
当用巨型帧在网络建立前端时,集群建立者能在创建命令行指定MTU值
更多信息:
下载地址:
(3,334MB,MD5, pkglist).
Rocks是一份完整的光盘机群解决方案,它面向x86及IA64的Red Hat
COTS机群。组建一套Rocks
并不需要任何机群方面的经历,实际上,机群架构师将能找到一条灵活的并且标题化的方式来重新设计整个软件栈,而这对大多数用户而言则适当地隐藏了。尽管Rocks包括了在任何机群软件结构中都应指望的工具(PBS、Maui、GM支持、Ganglia等),它的安装简易性则是独一无二的。
已发表评论数()
已收藏到推刊!
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
没有分页内容
图片无法显示
视频无法显示
与原文不一致

我要回帖

更多关于 rockscluster 的文章

 

随机推荐