淘宝刷评论兼职用手机刷单兼职怎么做

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>淘宝 >>淘宝刷评论兼职用手机刷单兼职怎么做

淘宝刷评论兼职用手机刷单兼职怎么做

来源：蜘蛛抓取(WebSpider) 时间：2017-12-15 13:56 标签：淘宝刷评论兼职

博客访问： 336889
博文数量： 79
博客积分： 3472
博客等级：中校
技术积分： 940
注册时间：
IT168企业级官微
微信号：IT168qiye
系统架构师大会
微信号：SACC2013
分类： LINUX
这几天在看spark0.8.1的源码，不禁被scala的简洁性折服，尤其是Actor的概念，在以往的程序设计中，我一直想找到一个基于Owner+Actor+Action的模型来简化设计，没想到Actor基本实现了我的想法，而且在分布式方面更超过我的预想。一直以为Scala会成为用户使用Spark的一个障碍，现在来看即使不用Spark，程序员也应该学习一下Scala.
Spark0.8.1的Scheduler有StandAlone, Mesos和Yarn几种，这里只从最简单的StandAlone入手，由于只是根据代码形成的，没有实际运行测试，个别地方也许会有错误，欢迎指正。后续会有更新。
阅读(5679) | 评论(0) | 转发(0) |
相关热门文章
给主人留下些什么吧！~~
请登录后评论。帐号:密码:下次自动登录{url:/nForum/slist.json?uid=guest&root=list-section}{url:/nForum/nlist.json?uid=guest&root=list-section}
贴数:6&分页:甘兰凉肃发信人: nokia9300 (甘兰凉肃), 信区: Java
标&&题: Re: spark和Hadoop做比较，Hadoop还有用的吗？
发信站: 水木社区 (Mon Mar 27 12:24:18 2017), 站内 && 有啊。比如spark的资源管理像屎一样，所以真搞大任务还是要靠yarn或者神马来调配资源。
还有很多已经成型的模块，凑合跑着改改对比用spark重写一遍，肯定是凑合跑比较划算。
还有就是Spark现在虽然2.x了，但是由于有傻逼选了scala，runtime的效率可傻逼可傻逼了。
【在 legendjack 的大作中提到: 】
: 同样是计算hdfs里的单词个数，一个代码比另一个简洁多了，当然，这是语言的原因，但是从这一点来看，也比Hadoop有前途啊。
: 那么，Hadoop还有公司用吗？
: ##################这个Scala的spark写的######################
: ...................
&& -- && ※ 来源:·水木社区 ·[FROM: 50.136.203.*]
甘兰凉肃发信人: nokia9300 (甘兰凉肃), 信区: Java
标&&题: Re: spark和Hadoop做比较，Hadoop还有用的吗？
发信站: 水木社区 (Mon Mar 27 14:23:29 2017), 站内 && 你是写框架的还是写app的？
我觉得如果是写app的话，用到streaming只是spark诸多模块里面的一个，你先抓点profiling的数据看看你的产品数据流究竟能有多大再说吧。
scala导致runtime傻逼是原生在语言定义里面的，immutable collection这种好高骛远的玩意儿先不说，单说没有premitive type 导致n多的boxing/unboxing这个就足够傻逼了。 && 如果你是写spark框架的，那么你应该知道databricks那群amplab的傻逼博士根本不知道performance是啥。自己选了一个垃圾语言，结果还要去搞tungsten这种脱裤子放屁的东西，真是非常的搞笑。
【在 lnliang 的大作中提到: 】
: 我专门做spark streaming开发，产品都已经上线了。
: 说scala导致runtime的效率不行的，我感觉你就是不会用。
:&& && -- && ※ 来源:·水木社区 ·[FROM: 50.136.203.*]
甘兰凉肃发信人: nokia9300 (甘兰凉肃), 信区: Java
标&&题: Re: spark和Hadoop做比较，Hadoop还有用的吗？
发信站: 水木社区 (Mon Mar 27 14:56:45 2017), 站内 && 10K op/s 这个基本上只要代码功能是对的，就算是用python写出来的玩意儿也不会有啥难度的。 && spark这个东西概念是好的，用DAG来搞scheduling，然后尽可能的回避磁盘的读写。如果spark这个东西用其他的语言来写，效果比用scala好太多。 && 感觉现在硬件性能过剩导致开发效率的重要性远远高于运行效率。当年spark summit上一个ucb的傻逼女博士搞了一个图，说CPU的主频过去若干年都没变，所以cpu性能木有进步。当时我就觉得时代变了，这么傻逼的言论竟然是科班出身的博士说出来的。。。我说的就是那个写出著名的二逼paper “making sense of spark performance” 的人。
【在 lnliang 的大作中提到: 】
: 单台服务器处理10000条/s对于大部分业务足够了，每条大概10k.
: redis也不过是100000条/s，何况spark还有大量的复杂计算。
: 虽然spark还有不少问题，但也没有其他替换品，
: ...................
&& -- && ※ 来源:·水木社区 ·[FROM: 50.136.203.*]
甘兰凉肃发信人: nokia9300 (甘兰凉肃), 信区: Java
标&&题: Re: spark和Hadoop做比较，Hadoop还有用的吗？
发信站: 水木社区 (Mon Mar 27 15:28:20 2017), 站内 && 峰值25k op/s。哥哥你真是好厉害。话说这个峰值只需随便一个高配的dual socket SKX-EP 一台就搞定了你们竟然还要上三台。。。。 && Spark自己的scalability是非常傻逼的。不信的话你去问问部署spark超过1000节点的哥们，看看他们敢不敢用standalone 跑。
Spark不仅资源管理傻逼，而且单节点上面的多线程scalability也非常傻逼。不信你去搜搜看看网上关于每个节点放几个executor，每个executor配几个core 的文章。如果spark的scalability真如你说的那么牛逼，这种文章就不会出现。 && 说道streaming，其实挺好奇storm和flink为啥没入你的法眼。Intel上海还有人写过一个叫gear pump的东西，你应该没听说过吧。。。 && 有的时候听搞笑的，三个节点连搭hdfs都嫌大炮轰蚊子，竟然有人上个spark，峰值 qps 25k total。。。。。 && 敢问你司那三个节点都是啥配置？amazon/阿里的 “你都不知道啥配置” 的云主机么？想当年ucb那个傻逼女博士跑数据的时候就是用Amazon的云主机，连底下bare metal是毛都不知道就发个paper喷性能，真是好有意思。
【在 lnliang 的大作中提到: 】
: 注意我说的是单台，两台处理能力加倍，
: 而且还能很好地处理一致性，扩容性良好。
: 实际上我们的线上产品部署了3台服务器，峰值大概25000 op/s。
: ...................
&& -- && ※ 来源:·水木社区 ·[FROM: 50.136.203.*]
甘兰凉肃发信人: nokia9300 (甘兰凉肃), 信区: Java
标&&题: Re: spark和Hadoop做比较，Hadoop还有用的吗？
发信站: 水木社区 (Mon Mar 27 16:20:33 2017), 站内 && 嗯，看来规模不大的情况下，速推一个能上线的玩意儿是最重要的。话说你用的应该是e3 一个socket吧，如果只是e3的一个core，那个配置可是相当的飙血。。。
而且你们如果机型神马的都不是很固定，怎么保证SLA？靠信仰么？
SparkSQL 跟Spark stream是两个独立的模块吧，你怎么不去用spark stream把sparksql写一遍？
【在 lnliang 的大作中提到: 】
: 不用standalone是处理单点故障问题，
: 配置这问题太复杂了，各个现场机型数量都不一样。
: 测试的时候每台机都只用了e3一个核，毕竟现场还要跑大量其他任务。
: ...................
&& -- && ※ 来源:·水木社区 ·[FROM: 50.136.203.*]
甘兰凉肃发信人: nokia9300 (甘兰凉肃), 信区: Java
标&&题: Re: spark和Hadoop做比较，Hadoop还有用的吗？
发信站: 水木社区 (Mon Mar 27 17:13:19 2017), 站内 && 哥们你们的一个核上还跑os 和 jvm 的各种线程以及spark自己的Daemon么？这个是很反人类的用法呃。
【在 lnliang 的大作中提到: 】
: 记得就一核，
: 如果不是需要实时用SparkSQL计算，那还不如不用spark stream。
:&& && -- && ※ 来源:·水木社区 ·[FROM: 50.136.203.*]
文章数:6&分页:本文主要讲解spark 环境的搭建
主机配置 &4核8线程,主频3.4G，16G内存
虚拟环境： VMWare
虚拟环境系统：Ubuntu 14.10
虚拟机运行环境：
jdk-1.7.0_79（64bit）
hadoop-2.6.0.tar.gz
scala-2.10.4.tar
spark-1.5.0-bin -hadoop-2.6.0.tgz
（一）样本虚拟机的搭建
1）虚拟机安装ubuntu，每个分配3G内存，完成后后输入如下命令来获得root权限：
　　#sudo passwd　
2）ubuntu下源的更改：
　　#sudo gedit /etc/apt/sources.list
　　找到一个还用的源替换掉&/etc/apt/sources.list中原来的内容
　　执行更新：
　　#sudo apt-get update
3）安装ssh，以便远程登录
　　ssh-client ：本机作为客户机通过ssh链接远程的服务器
　　ssh-server：本机作为远程服务器，可以被客户机链接
　　#sudo apt-get install ssh-client
　　注意上述命令可能出现问题 & &依赖：openssh-client (= 1:6.6p1-2ubuntu1)&
　　使用这条命令即可解决： #sudo apt-get install ssh-client= 1:6.6p1-2ubuntu1
　　接下来安装#sudo apt-get install ssh-server (或者&apt-get install openssh-server)
4）查看ssh服务是否启动
　　#ps -e |grep ssh
　　显现出sshd 则说明安装成功
5）更新vim
　　#sudo apt-get remove vim
　　#sudo apt-get install vim
6）修改/etc/ssh/sshd_config &文件，使得本机允许远程连接，现在即可通过putty，xshell等连接该机
　　&# Authentication:　　LoginGraceTime 120　　PermitRootLogin yes　　StrictModes yes
7）修改host主机名
　　#vi &/etc/hostname 将该文件该为spark1
　　然后 #vi /ect/hosts 改成与上述文件相同的名字&
　　重启 &#hostname 查看是否生效
&8）注意虚拟机的网络设置为桥接
　　#ifconfig 可来查看网络状态
&9）根据求查看是否需要固定IP
　　设置静态IP方法如下：
　　#sudo vim /etc/network/interfaces
　　#修改如下部分：
　　auto eth0　　iface eth0 inet static　　address 192.168.0.117　　gateway 192.168.0.1 #这个地址你要确认下网关是不是这个地址　　netmask 255.255.255.0　　network 192.168.0.0　　broadcast 192.168.0.255
　　因为以前是dhcp解析，所以会自动分配dns服务器地址，而一旦设置为静态ip后就没有自动获取到的dns服务器了，设置静态IP地址后，再重启后就无法解析域名。想重新设置一下DNS，有两个办法：
&通过/etc/network/interfaces，在它的最后增加一句：
　　　　dns-nameservers 8.8.8.8
　　　　8.8.8.8是Google提供的DNS服务，这里只是举一个例子，你也可以改成电信运营商的DNS。重启后DNS就生效了。
&通过修改：
　　　　/etc/resolvconf/resolv.conf.d/base（这个文件默认是空的）
　　　　在里面插入：　　　　nameserver 8.8.8.8　　　　nameserver 8.8.4.4
　　　　如果有多个DNS就一行一个，修改好保存，然后执行resolvconf -u再看/etc/resolv.conf，最下面就多了2行：
　　　　nameserver 8.8.8.8　　　　nameserver 8.8.4.4
　　可以看到我们的设置已经加上了，然后再ping一个域名，当时就可以解析了，无需重启。
　　以上测试在我这里测试可想行不通，最后还是没有修改，完全是桥接，DHCP自动获取的，好在学校内部重启后IP地址是不变的，所以暂时先这样了，以后变了再改
&10）关闭防火墙 #ufw disable
&11）安装jdk
　　下载对应版本的JDK，切记X64为64位系统X86_64为64位系统，否则为32位
　　解压tar -zxvf jdk1.7.0_79 -C /usr/lib
　　配置环境变量 #vi /etc/priofile ,添加如下字段
　　export JAVA_HOME=/usr/lib/jdk1.7.0_79
　　export PATH=$JAVA_HOME/bin:$PATH
　　export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
　　使改动生效 source /etc/profile
　　验证 java-version
12）安装scala
　　方法类似于java，上传scala2.10.4包，解压，#tar -zxvf &scala-2.10.4.tgz -C /usr/lib/scala
　　到/etc/profile里配置路径：
　　export SCALA_HOME=/usr/lib/scala/scala-2.10.4
　　export PATH=$PATH:${SCALA_HOME}/bin
　　输入如下命令使得配置生效#source /etc/profile
　　验证 #scala -version
13)克隆该样本机，克隆出4个备份，然后分别配置每个机器的主机名与IP地址。
　　改玩后自行测试看每个机器是否正确
14）设置ssh免密码连接（注意公钥汇总的命名）
　　这里参考
15）下载hadoop-2.6.0_x64.tar.gz包，将该包解压到/app/hadoop/文件夹下，并在切换到#cd /app/hadoop/hadoop-2.6.0/，创建三个文件夹#mkdir tmp #mkdir name #mkdir data　　
16）接下来要配置hadoop环境变量
　　　　首先切换到 #cd&/app/hadoop/hadoop-2.6.0/etc/hadoop，打开如下文件#vi&hadoop-env.sh，加入如下路径：
　　　　export JAVA_HOME=/usr/lib/ivm/jdk1.7.0_79
　　　　export PATH=$PATH:/app/hadoop/hadoop-2.6.0/bin
　　　　配置好后输入# source hadoop-env.sh使得配置生效，接下来#hadoop version测试是否配置成功。
17）配置yarn-env.sh
　　　　在/app/hadoop/hadoop-2.6.0/etc/hadoop打开配置文件yarn-env.sh
　　　　#cd /app/hadoop/hadoop-2.6.0/etc/hadoop
　　　　#sudo vi yarn-env.sh
　　　　加入配置内容，设置JAVA_HOME路径
　　　　export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_79
　　　　使用source yarn-env.sh使之生效
18）配置core-site.xml　　
&configuration&
&property&
&name&fs.default.name&/name&
&value&hdfs://spark1:9000&/value&
&/property&
&property&
&name&fs.defaultFS&/name&
&value&hdfs://spark1:9000&/value&
&/property&
&property&
&name&io.file.buffer.size&/name&
&value&131072&/value&
&/property&
&property&
&name&hadoop.tmp.dir&/name&
&value&file:/app/hadoop/hadoop-2.6.0/tmp&/value&
&description&Abase for other temporary directories.&/description&
&/property&
&property&
&name&hadoop.proxyuser.hduser.hosts&/name&
&value&*&/value&
&/property&
&property&
&name&hadoop.proxyuser.hduser.groups&/name&
&value&*&/value&
&/property&
&/configuration&
19)配置hdfs-site.xml
&configuration&
&property&
&name&dfs.namenode.secondary.http-address&/name&
&value&spark1:9001&/value&
&/property&
&property&
&name&dfs.namenode.name.dir&/name&
&value&file:/app/hadoop/hadoop-2.6.0/name&/value&
&/property&
&property&
&name&dfs.datanode.data.dir&/name&
&value&file:/app/hadoop/hadoop-2.6.0/data&/value&
&/property&
&property&
&name&dfs.replication&/name&
&value&2&/value&
&/property&
&property&
&name&dfs.webhdfs.enabled&/name&
&value&true&/value&
&/property&
&/configuration&
20)配置mapred-site.xml，一般情况下，只有一个mapred-site.xml.template ,# cp&mapred-site.xml.template mapred-site.xml复制出来一份即可：
&configuration&
&property&
&name&mapreduce.framework.name&/name&
&value&yarn&/value&
&/property&
&property&
&name&mapreduce.jobhistory.address&/name&
&value&spark1:10020&/value&
&/property&
&property&
&name&mapreduce.jobhistory.webapp.address&/name&
&value&spark1:19888&/value&
&/property&
&/configuration&
21)配置yarn-site.xml
&configuration&
&property&
&name&yarn.nodemanager.aux-services&/name&
&value&mapreduce_shuffle&/value&
&/property&
&property&
&name&yarn.nodemanager.aux-services.mapreduce.shuffle.class&/name&
&value&org.apache.hadoop.mapred.ShuffleHandler&/value&
&/property&
&property&
&name&yarn.resourcemanager.address&/name&
&value&spark1:8032&/value&
&/property&
&property&
&name&yarn.resourcemanager.scheduler.address&/name&
&value&spark1:8030&/value&
&/property&
&property&
&name&yarn.resourcemanager.resource-tracker.address&/name&
&value&spark1:8031&/value&
&/property&
&property&
&name&yarn.resourcemanager.admin.address&/name&
&value&spark1:8033&/value&
&/property&
&property&
&name&yarn.resourcemanager.webapp.address&/name&
&value&spark1:8088&/value&
&/property&
&/configuration&
22）配置slaves
　　　　#vi slaves
　　　　在slaves里加入：　　　　
　　　　spark1
　　　　spark2
　　　　spark3
　　　　spark4
23）用scp分别向各个节点分发配置好的hadoop
　　　　在个个slave里建立对应的文件目录 /app/hadoop/, spark1切换到/app/hadoop目录下
　　　　# scp hadoop-2.6.0 root@spark2:/app/hadoop
　　　　# scp hadoop-2.6.0 root@spark3:/app/hadoop
　　　　# scp hadoop-2.6.0 root@spark4:/app/hadoop
24)格式化namenode
　　　　#cd /app/hadoop/hadoop-2.6.0
　　　　#hadoop namenode -format
25)启动hdfs
　　　　$cd /app/hadoop/hadoop-2.6.0/sbin
　　　　$./start-dfs.sh
&　　　 &启动hdfs时候，报如下错误：Error: Cannot find configuration directory: /etc/hadoop，则应该在 /etc/profile里加入如下配置：
　　　　#hadoop
　　　　export HADOOP_HOME=/app/hadoop/hadoop-2.6.0　　　　export YARN_HOME=/app/hadoop/hadoop-2.6.0　　　　export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop　　　　export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
　　　　并且#source etc/profile 使得其生效
　　　　若slave中部分datanode没启动，则#./stop-all.sh,然后删除所有节点中的tmp，name，data三个文件夹,重新建立新的空文件夹
　　　　格式化namenode #hadoop namenode -format，现在启动应该正常了！
&26）验证hdfs是否成功启动
　　　　#jps ，此时在spark1上面运行的进程有：NameNode、SecondaryNameNode和DataNode
　　　　spark2-spark4上运行的有DataNode
25）启动yarn
　　　　#cd /app/hadoop/hadoop-2.6.0/sbin
　　　　#./start-yarn.sh
　　　　此时在spark1上的进程有：NameNode、SecondaryNameNode、DataNode、NodeManager和ResourceManager
　　　　spark2-spark4上的进程有：DataNode NodeManager
　　　　至此，hadoop安装已经完成！！！接下来就是spark的安装!
27)跑一下hadoop附带的例子来测试是否安装成功，下面以wordcount为例。
28）首先到spark官网下载hadoop2.6对应的安装包，spark1.5.0-bin-hadoop2.6.tgz,上传到/ooon,解压缩# tar -zxvf &spark1.5.0-bin-hadoop2.6.tgz &-C &/app/hadoop，切换到spark主目录，#cd &/app/hadoop/spark-1.5.0-bin-hadoop-2.6.0
29）配置spark的环境变量，&打开配置文件/etc/profile，&定义SPARK_HOME并把spark路径加入到PATH参数中
　　　　SPARK_HOME=/app/hadoop/spark-1.5.0
　　　　PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
30）配置conf/spark-env.sh
　　　　# conf/&
　　　　#cp &spark-env.sh.template &spark-env.sh
　　　　#vi&spark-env.sh
　　　　在最后介入如下内容：
　　　　export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_79
　　　　export SPARK_MASTER_IP=spark1 （注意这里有个坑，若是你的IDE环境搭建在spark1以外的机器上，这里最好直接写成spark1的IP172.21.75.100，血泪史）
　　　　export SPARK_MASTER_PORT=7077
　　　　export SPARK_WORKER_CORES=1
　　　　export SPARK_WORKER_INSTANCES=1
　　　　export SPARK_WORKER_MEMORY=1g
　　　　source spark-env.sh使得配置生效。
31)配置slaves,如下
32）scp分发到各个节点
　　　　#cd /app/hadoop
　　　　#scp &-r spark-1.5.0-bin-hadoop-2.6.0 root@spark2:/app/hadoop
　　　　#scp &-r spark-1.5.0-bin-hadoop-2.6.0 root@spark3:/app/hadoop&
　　　　#scp &-r spark-1.5.0-bin-hadoop-2.6.0 root@spark3:/app/hadoop&&
　　　　接下来启动spark
　　　　#cd &sbin
　　　　#./start-all.sh
&　　　　spark1的进程有：
　　　　spark2-spark4的进程有：
　　　　现在spark也装好了！！！
33)在浏览器中输入地址172.21.75.102:8080，可以看到集群的状态
34）验证客户端连接
　　进入hadoop1节点，进入spark的bin目录，使用spark-shell连接集群
　　$cd /app/hadoop/spark-1.1.0/bin
　　$./spark-shell --master spark://spark1:7077 --executor-memory 500m
　　在命令中只指定了内存大小并没有指定核数，所以该客户端将占用该集群所有核并在每个节点分配500M内存, &下图可见其分配情况
　　现在，我们已经通过spark-shell连接到了集群，现在就可以运行一下spark的示例wordcount
35）运行wordcound
　　首先上传数据到hdfs，#hadoop fs -mkdir -p &/usr/hadoop/testdata
　　$./spark-shell --master spark://spark1:7077 --executor-memory 512m --driver-memory 500m
　　接下来在shark-shell里键入如下代码执行wordcount的计算
scala&val rdd=sc.textFile("hdfs://hadoop1:9000/user/hadoop/testdata/core-site.xml")
scala&rdd.cache()
scala&val wordcount=rdd.flatMap(_.split(" ")).map(x=&(x,1)).reduceByKey(_+_)
scala&wordcount.take(10)
scala&val wordsort=wordcount.map(x=&(x._2,x._1)).sortByKey(false).map(x=&(x._2,x._1))
scala&wordsort.take(10)
　　　结果如下：Array[(String, Int)] = Array(("",100), (the,7), (&/property&,6), (&property&,6), (under,3), (in,3), (License,3), (this,2), (--&,2), (file.,2))
&35）最后需要注意的是学校的IP变化后的处理
　　除了 /etc/hosts 需要处理外，另外 spark-env.sh &也需要制定spark-master 的IP
　　source spark-env.sh使得配置生效。
阅读(...) 评论()

淘宝刷评论兼职用手机刷单兼职怎么做

我要回帖

更多关于淘宝刷评论兼职的文章

随机推荐

淘宝刷评论兼职用手机刷单兼职怎么做

我要回帖

更多关于 淘宝刷评论兼职 的文章

随机推荐

更多关于淘宝刷评论兼职的文章