cloudera大数据认证这么火,请问它的认证有什么用呢?

Cloudera大数据管理员认证怎样?_百度知道
Cloudera大数据管理员认证怎样?
我有更好的答案
这家是国外的认证,权威性较强,国内的直接找精准数源
为您推荐:
其他类似问题
您可能关注的内容
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。Cloudera苗凯翔:大数据在金融领域的应用案例(含PPT)_36大数据_传送门
Cloudera苗凯翔:大数据在金融领域的应用案例(含PPT)
日上午9时,由上海市科学技术委员会、上海市现代服务业联合会作为指导单位,上海大数据产业技术创新战略联盟主办,张江新经济杂志承办的2014数据中国产业创新峰会暨首届中国大数据最具投资价值排行榜星光盛典在上海浦东香格里拉大酒店紫金楼三楼盛事堂成功召开,下面是Cloudera副总裁苗凯翔在会上的演讲,演讲主题为《点数成金—大数据在金融领域的解决方案与应用案例》。谢谢大家,这里面大家听说过Cloudera吗?有,不是特别多,有百分之七八,如果你在美国搞大数据的话,如果没有通过Cloudera公司的,大在全国还是处于非常领先的定位,因为Cloudera搞大数据平台,你干大数据不管是哪行那业,搞应用,你得需要平台。平台的话Cloudera在全球是处于第一位的,他在全球的市场名额占得非常高,金融行业不能超过90%,搞金融,美国那边最大的一些银行都在Cloudera,所以刚才谈到英特尔在今年的一季度宣传要投入Cloudera7.4亿的美金,Cloudera等于是一个很主义的合作。Cloudera公司,我先介绍一下,因为大家还不是特别了解,这个公司是成立于2008年,由4个公司搞大数据的人,从谷歌、facebook出来成立的Cloudera,这个是2008年的事情他发展得非常快,去年是600人,基本上一年只能增加了1.5,现在规模已经到750亿客户,他提供24乘7的全球服务。他现在的客户,我昨天看了一篇文章他的Cloudera客户,每个季度就要增加四五十个客户,所有这些数据300个库,这个就不太确切了,可能是去年或者是前年的数据,现在他的客户非常多了。他在的软件公司不大,750人,但是他的合作伙伴范围非常广,包括Cloudera、微软、EMC,几乎这些大的名字都是他的伙伴,所以他在全球的地位还是蛮强的,他是专门提供大数据培训,培训的话他会有证书,这是目前的一个状态。因为时间比较匆忙,我就不再仔细介绍。再看一下在Cloudera成长过程中,从2008年成立到今天的里程碑,第一,他成立之后,马上和杜普创始人叫Cloudera,他今年12月会来中国搞活动,Cloudera在成立之后,他发表了一个软件的版本叫CDH,现在已经第5代了,今年现在已经到了5.3、5.2的状态,所以他的发展,他的客户在不断地增加,现在在全球的大数据大概占有百分之七八十的份额,他的公司的发展状态。举个例子,比如说你在美国那边要用手机的话,美国70%的智能手机后端的驱动都是Cloudera的产品。刚才提到四大银行,在美国四大的统计银行都是他们的客户,在金融界他们蛮成功,除金融界之外,他在电信行业,在制造,在政府都有很多的客户,所以他的金融案例非常多。再来看一下英特尔对Cloudera的投资7.4亿,这是占了很大一块Cloudera的股份,因为这个投资,Cloudera说跟英特尔达成协议,因为Cloudera在中国没有公司,所以要把英特尔搞大数据的团队分出一部分来,然后成立Cloudera中国,当时公布是在5月份,真正成立是6周前,9月15日,我们等于是正式从英特尔出来,成立了Cloudera中国,这是我们现在的状态,现在站在这里,实际上并不是英特尔来了,是Cloudera来了。这就是目前的状态,当然这里面有很多故事,合作模式是什么,计划是什么,这都是其他的板块。今天的主题应该是针对金融,看看架构是什么状态,然后搞大数据的架构是什么样子,然后举一个案例。回顾一下整个工业界的转折,大数据最近几年发生的事情,这个词是3年以前,他慢慢变得非常的热。这个里面是要有很多故事,这一块儿总结了一下,等于说大数据他的变革是一个很深的理解,他的发展意味着有很深的变革,不光是一些平常听到的数据量大,首先来讲,你的计算,你的IT的架构,需要一个根本的变革。过去的架构是什么样子的?过去是一个以计算为中心的架构,我要干一件事情需要计算,计算是有数据,为了搞计算把数据挪过来,计算完之后,结果挪出去,所以计算跟存储是分开的,数据挪来挪去是为了计算,而且是干某一件事情,再换一件事情还可以干,干不同的事情可以互通的,以计算为中心的整合架构,他们之间是什么关系,这是过去的架构,就是左边那个图。现在大数据大了,你怎么挪?你挪不了了。举个例子,我经常看到客户要挪一个数据,要花几天时间,几个礼拜时间挪数据,这个你怎么办?根本就不可能挪,这意味着什么呢?意味着我需要一个新的架构,也就是说数据库挪了,计算没挪,数据在那儿不动,我可以计算,就是右边那个图,这就意味着根本性的变革,从过去以计算为中心,这个烟囱式的架构,要转到一个以数据为中间的统计架构,这个非常大的逻辑。这个变革具体再往深一层讲的话就是合度,合度的理念是什么,他把数据与计算成为一体,他能存储,同时也能计算,这就是合度架构,这个变化是几个巨大的变化,这个里面有很多的东西,过去的计算架构模式,他很难扩容的,数据量大了,存不了,没办法,花钱买更多存储,非常昂贵,很难。所以这个网络是一个瓶颈,因为数据量大了,不可能搬来搬去,网络再宽也不够你,所以我们价钱非常的贵。再看看右边那一块,合度品牌,这些问题全解决了,而且价钱差非常大,过去一个Cloudera需要3万美元,现在只需要几百,同样的东西,为什么说额度在大数据这个领域这么热,技术架构解决了过去根本性的问题,能够计算跟存储融合,而很便宜,而且可以无限扩容,这就是一个架构层。再继续来看,把过去的传统架构总结一下他是一个烟囱式架构,以计算为中心,存储放在一块儿,希望干事了搬来搬去,这就是现代典型的IT行业的架构,他有很多烟筒,他们之间是隔离的,数据横断大,干事情了把数据拿过去,所以仓库也好,数据库也好,文件系统也好,习惯把数据搬过去,这个架构在大数据时代已经过时了,他非常昂贵,很多客户想干事情,他干不了,因为他不可能再用这个架构来干他要干的事情,太贵了,花不起这个钱,而且这个信用也非常复杂,这个时候需要一个新的架构,他需要中间有一个新的统一平台,跟其他想干的事情,跟其他的系统是相笼统的,他是这么一个东西,他功能非常强,可以无限扩容,因为它的服务器是标准服务器,这样的话他可能把东西都统一起来,而且不改变过去的架构,他放在中间跟你相兼容,可以给你干很多事情,把里面原始的东西,你需要的话,他给你搞BTL转过去。基本上这么一个东西,这个东西实际上是目前你搞金融也好,搞各个行业,你说我这个架构到头了,大数据时代我没办法了,我想扩,没办法扩了,东西太复杂,太昂贵,怎么办?这就是你的答案,这是一个新的大数据时代,IT行业的架构,目前就是这些问题,中间他的核心就是这个合度平台,跟其他传统的数据接上来,融合在一块可以干很多事情,我待会儿讲一些案例,实际上就是根据这个平台,我们这些客户在全球部署,用这个平台为客户节约很多钱,而且解决很多问题,创新的问题,新的业务产生,节省了资源,把问题简单化,都可以达到。谈到应用的话,现在的大数据,我们通过的接触,他们也有很多人过来,他们跟中国的客户有很多的接触,有很多的讨论,基本上结论,中国大数据这一块要谈到搞应用,搞大数据部署,他的发展阶段也基本上比美国滞后两年,因为美国跑得比较快,美国的发展的状态,大数据发展起源于互联网,第一步基本都不是在硅谷,在美国的西航发出了,这大约是四五年的事儿。然后是华盛顿政府掌握大数据了,东西有用,然后在华盛顿热起来了,像美国联邦政府都开始搞,我们进去之后,美国大数据发展的历史第一步是西航微软公司,第二步政府,第三步金融,纽约就是去年的事情,纽约金融市场起来了,现在遍地开花,基本上金融、电信、制造业、零售业、医疗全部起来了,现在大数据发展基本上渗透硕士,中国网开始意识到大家感兴趣,搞数据最关键是干什么,你有很多数据怎么干,这个定义和应用非常重要,美国那边起步比较早,他们已经摸索了各种各样的应用场地,搞出很多有用的案例来,然后去推广,然后有价值。基本这些行业大数据我们都有部署,都有应用,但是基本上还都是美国那边,现在中国的特点,当然互联网公司阿里巴巴搞,然后就是电信要稍微跑得快一点,还有金融,然后是中国特色智慧城市不错的,交通、人脸识别、安全,中国这一块搞得不错,美国那边这块好像没有的,然后中国那边开始看医疗有一些案例,零零散散比较少,还是一种非常早的阶段。然后这个例子,就像金融、电信、医疗、传媒,金融、银行、这里面没有,还有美国银行,非常大的银行,都是在用Cloudera的方案,都是在搞他们的各部门的金融,然后电信、医疗都有。但是很多的案例,从各种各样大数据的应用案例很多,但是内部做这些工作,想一想,研究了一下,归了一下类,就这么几类,从案例来讲,虽然非常多,但是你抽象的,归类就这么7类,可能最流行的就是第1类,叫做360度分析,金融可能也有,金融是你的客户,不光是搞保险,对他的行为分析,历史的分析,这是一个很沉淀的东西。然后供应链、优化,这可能在零售,像沃尔玛,客户某一个产品放在仓库里面没有卖,你是放多多少,这怎么找,你要优化,你的供应链怎么去管理,这也是大数据问题,然后审计。很多大数据行业,政府都有规定,要求你数据存几年,智慧城市2年,美国金融7年,还得备份,还得能查询,还能找东西,这都是大数据的方案能解决的,量太大了,搞数据服务,现在我们在国内谈一些项目,比如说某个互联网公司,或者小公司也好,他想把大数据作为一个服务,服务于各行各业,金融可能也好,可能是某一个公司我想搞一个,我可以来服务你。还有其他的机构,像风险分析,金融比较关注的风险,正常客户有一种特殊的方法,他怎么干事情,你可以说有一个记录,但是他某种行为不正常,你要报警,这个太正常,要防不好的事情发生,欺诈的事情发生,这个部分很重要,所以这个是一类的。因为总归来讲有几类,但是这里面不全,比如说我们能想到的,比如说电信行业搞了很多的分析,也可能是其他用户网络的行为,因为在你的网络里面窜到其他类里面去。因为时间不多,我就马上讲几个案例,案例我们这边非常多,所以这边只能举几个例子,稍微讲一下。第一个,这个案例我在两年前就讲过,两年前我在国内讲,知道的人非常少,现在我再讲这个案例,很多人都知道了。因为案例是一个比较典型的,在保险行业。有人听说过,开车的人,你要买车险,怎么去定格车险的金额,这个人你要保他一年多少钱,那个人多少钱,这个你怎么定,过去没有什么基础,过去就知道多少钱,或者你车什么样,我问一问,现在可以更精确的方法来定,这个现在在欧美已经很流行了,在国内有的公司已经开始实行,有些故事将来会发生,据我了解国内还没什么。什么东西呢?保险公司在你车里装一尺小盒子,他能监测到你开车的位置、速度、地点,然后你每天开多少车去哪儿了,开车的行为他能很了解,然后他帮你的开车行为,开车的时间,去哪儿了,哪儿去得最频繁,速度多少,跟他的数据库里面说,我知道这个城市哪儿最容易出事儿,哪儿出事儿频率最多,跟他一对,你这个开车行为可能是比较危险的,或者是比较保险,然后我给你定一个,保多少险,这个在欧美已经很流行了,这个就是大数据,因为数据量是巨大的,他要牵涉到很多开车人的数据,根据城市里面的数据,时间的数据,很可能事实行为分析,这是一个保险行业,保险金融的案例。这一个可能是一个支付行业,因为我在美国的时候就开始用这个公司去搞一些支付,大家可能都能猜到他是支付行业,在线支付行业在全球最早开始搞,现在发展很快的美国公司,但是我不能说这个公司,因为他们没有签说明的合同,我不能讲,但是案例我可以讲。这个是全球最大的支付,他干什么事儿呢?他数据量非常大,刚才提到,他想把数据都统合起来做更好的分析,他当时现有的系统再多的话付不起钱了,太贵了,当时就说咱们看一下其他的方法,然后我们就把项目放在哪儿,然后就开始干了,干完之后想过非常好,他们存十几年的数据,而且可以分析,不光这样,他还可以产生新业务,他搞一些新业务,很多客户不光是个人客户,企业客户都有。他们说给这个企业形成实时报表,然后他弄了一个新业务,他用他过去的数据,过去是结构化了,现在这里非常有用,他说报表非常用,在这个新的报表业务里面,他现在是10亿美金的收入,完全是新的业务,过去没有的,因为他干了这个事情,他创新了,过去不能干的事情干了,而且这个数据量大了,他发掘出来,然后分析之后利用起来,这个数据非常有用,这个业务成长非常快,这个业务到了10亿美金。数据并不是解决你现在的困难问题,他还可以创新,创新之后还产生收益,大数据等于是解决问题加创业。实际上刚才那个保险行业的创新过去干不了的,通过大数据可以干。所以说大数据的案例来讲,可能从两个方面看,一个是IT架构本身产生的困扰怎么样消除解决掉,我能解决困扰,我能把数据分析出来,有很多创新,有新的业务。再一个例子,好事达(音),这个是知道的一个公司,这个公司在美国非常有名,就我一个人,刚到美国买完车就买了一个保险,他是美国最好的保险公司,他是80年的公司,数据量非常的大。他也有故事,美国50周的数据,他现在能分析,分析一个周需要半天的时间,一天分析一个周,数量太大了,分析某一个特性,在这个周里面找出某一个特性来。这样他就有困惑,然后就来找我,听说你们有新的架构,大数据,咱们来看一看,搞一个项目,能不能干点事儿,然后我们搞项目,然后给大家介绍了一个新的架构,咱们把数据搬到那儿去,看结果怎么样。结果搬之后,工作量也不是特别大,花了1天时间,然后50周分析下来,我们需要16个小时,这是去年的事情。今年大家知道Cloudera这个产品,他是专门搞查询的,我们现在再搞一遍,现在实际上是40多股,有时候说40多股搞定,从50天到60点,他这个效果非常好,这个实际上他节省了大量的资源,过去干不了的事情现在能干了,而且数倍翻得非常快,过去那么长的时间,资金投入是巨大的。再往前走,这个是我曾经在国内搞金融行业的案例,这是国内的四大行,大家知道国内有商行、工行、建行、农行,这四大行职业,这个项目实际上也是说服力的,当时那个银行最多只能存一年的数据,他想说我要为客户服务更好,多存一点存不了,这个钱太贵了。所以我们说再看其他方案,去年的时候我们还没有到国内来,还是用的英特尔的方案去搞这个方案,当时也用了一些标准的服务器,用英特尔和杜普干的项目,干完之后,他们说我们这个系统,时时最多给300人服务,就是时时的,这块儿他叫并发用户300,所以新的系统是30万,因为他的特点是并行,据我了解那个价钱,如果他解决的方案,要想找其他途径的话,这个价钱至少从这个方案高10倍,实际上差不多10倍的。这个数据存储量变成了10年,过去是1年,现在是10年,还没有太优化,系统的优化,再看一下,我觉得这个还会更多一点。所以这是一个真实在国内搞的,我们叫历史数据差距,历史数据存到系统里面去,客户回来找的时候,哪年哪月那个钱怎么回事儿,能够在几秒钟内给他反馈,查出来,你这个系统要是只能存一年的话,我只能找到去年的,前年的就找不到。我在国内待了10年,我的国籍还是外国的,美国那边找我,你这一年的税怎么回事,那我打一个电话。因为时间关系,影像数据,很多金融行业,他的数据不光是结构化的,还有非结构化的,过去没法处理,现在可以了,现在有很多影像数据,多美体数据。因为在银行有很多的复印件,过去是没法弄的,你要人工去找,是不行的。特别是在医疗行业,医疗行业的特点数据有图像,数据非常大,搞医疗大数据是非常复杂的,但是金融行业也是同样的,有复印件,你要存的话,你的数据处理还要快,这个也是我们在国内四大行之一搞的一个项目,影像数据用这个搞出来的,监管我讲一个例子,这是美国的,现在在美国金融数据要求你保留7年,因为他还得有备份,这是美国的法律规定,银行要干的事情。如果你按这个想法算,这个价钱非常昂贵,7年这么多人的数据,我稍微比较了一下,你用传统的方法相比,基本结论,监管机构每年节省数亿美金,这两种方案,你用新型合度的方案,这个差异巨大的,金融行业要用数据来干事,用比较新的方案,我觉得是一个案例。举一个例子,在政府的规定,要达到技术手段,针对金融行业备份,这个是非常昂贵的,所以你要选好一个方案。基本上讲的就这么多,时间也到了,谢谢大家!End.↓↓↓更多请点击“阅读原文”。
觉得不错,分享给更多人看到
36大数据 微信二维码
分享这篇文章
36大数据 最新文章Cloudera-大数据大学_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
Cloudera-大数据大学
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢&&&&&&& 简单来说,Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。
cloudera manager有四大功能:  (1)管理:对集群进行管理,如添加、删除节点等操作。  (2)监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。  (3)诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。  (4)集成:对hadoop的多组件进行整合。
阅读(...) 评论()专访Cloudera首席技术官:大数据创企,别再做底层基础平台了
作者:夜叶
几年前,大数据还只是新兴概念,现在数据早成行业和公司眼里的香饽饽,从底层基础平台,中间层通用技术,到上层行业应用,大数据产业链条日臻完善。
作为马云口中构建未来智能世界三个最主要要素之一,大数据自身是衍伸发挥的生产资料来源,而对数据的存储、计算又是整个大数据生态的基石,底层基础平台主要就解决这个问题。
而论及底层技术Hadoop领域,就得说到明星公司Cloudera,今年4月底已在纽交所上市。
Cloudera是首家将Hadoop商用的公司,以提供开源Hadoop发行版起家,通过解决部署安装过程中各样的问题盈利。如Cloudera Manager就是其核心付费产品,它能帮企业管理Hadoop集群,包括部署、和对节点、服务实时监控。约80%的营收来源是以这种软件订阅模式,订阅期通常为1-3年。小部分靠人力支撑的服务获利,如提供专业服务、培训等。
2008年成立的Cloudera可以说占据市场先发优势,但随着时间推移,入局者增多,市场竞争变得愈发激烈:同类Hadoop玩家有MapR、早于Cloudera上市的Hortonworks等,还需面对亚马逊AWS、微软Azure等云厂商,及传统数据库厂商的竞争。
对此,Cloudera首席技术官Amr Awadallahg的看法是,这块市场很大,IDC预测到2020年总规模会达到2000亿美元。他向36氪着重强调了公司技术方面的优势,如产品方面持续创新,及有全球2600多家合作伙伴,有利共同打造垂直行业解决方案。
恐怕最让Cloudera忧心的还是像AWS这类云厂商,对企业而言,用亚马逊、微软提供的公有云或私有云服务,再延伸至底层基础技术产品,可能就是水到渠成的事,巨头布局生态就有这种好处。对此, Awadallah坦言云基础设施供应商既是合作伙伴又是竞争对手。
合作方面,Cloudera的客户是以云厂商提供的基础设施服务为基础,运行Cloudera软件,Awadallah透露这样的客户数量正快速增长。面对巨头同样涉足底层基础技术解决方案,Awadallah认为Cloudera的优势,一方面是公司技术的专注性,另一方面能将解决方案与行业客户具体实践相结合,更注重企业客户具体需求。若从长远角度考虑,Awadallah觉得企业客户会担心将人工智能等关键知识产权全然锁定在云服务供应商专有机器学习的算法里,有取而代之的风险,而Cloudera的好处是平台可迁移、移植,跨云甚至是跨环境,另外开源算法有助企业客户加以分析、甚至改进,以确保差异化竞争优势,把核心掌握在自己手中。
大数据行业正处在风口,有不少创企在此聚集。以底层基础平台为例,国内做该细分领域的有专注Hadoop发行版的星环科技、红象云腾和天云大数据,有传统数据库厂商人大金仓和南大通用,有研发新型分布式数据库的巨杉数据库,还有唯一来自中国的Apache社区顶级项目Kylin背后公司Kyligence。硬件厂商巨头华为也提供Hadoop发行版。
Awadallah是Cloudera团队创始成员之一,他指出创业是有难度的事,任何创业公司都有三点需要考虑。
首先,创业之初必须找到切实可行的使命和目标,解决一个非常真实的问题。如Cloudera就希望利用数据解决今天无法解决的问题。其次,正确的团队很关键,除了有行业优秀人才、努力工作的必要条件,还得注意团队文化的契合。第三,有非常清晰的发展目标和阶段性目标,月度或季度评估目标节点,灵活变通调整。
针对大数据、机器学习、人工智能领域的创企,Awadallah则建议不要再做像Cloudera九年前已经做过的事,即别创建底层基础技术平台。而是要把注意力放在已有平台基础上,利用机器学习、人工智能去构建各种各样的应用,服务如医疗健康、农业、制造业、金融服务等行业需求。
Cloudera2014年已进入中国,目前有中国联通、中国银联等客户。
以下是36氪对Cloudera首席技术官Amr Awadallah采访整理:
Q:现在Hadoop应用比较多,怎么让客户在使用Cloudera产品上更有黏性?目前国内也有一些像星环这样做Hadoop架构的企业,Cloudera有哪些竞争策略?
A:首先,现在Cloudera的解决方案和技术绝不仅限于Hadoop,Hadoop是我们起步之初的解决方案。公司在2008年创立一开始的时候我们就有Hadoop产品,主要是基于Hadoop的文件系统和MapReduce,现在已经至少有了25个解决方案,而且在我们已有平台的基础之上,还在不断地添加新的产品和解决方案。
比如说Impala,它是一个SQL分析解决方案,它的竞争对手主要是传统的SQL领域的公司,比方说Teradata和Oracle。另外主要是用于机器学习和实时流处理的Spark技术,这样的技术对物联网和人工智能有着非常好的用途。另外是Hbase是用于实时处理的。去年刚刚发布的kudu在今年年初的时候,实现全面商用。kudu主要是用于实时物联网数据的摄取和处理。
所以大家可以看到今天的Cloudera在技术和能力方面,绝不仅限于Hadoop,已经有了非常大的扩展。
至于我们如何与竞争对手相比保持竞争优势,这样的竞争对手绝不仅限于在中国本土的竞争友商,也包括美国、欧洲及全球的竞争对手。我们的优势主要表现在以下几个方面:
首先,要继续确保拥有最好的平台,在我们平台的基础之上不断进行创新,不断推出新的东西。比方说kudu和Impala,在同类的产品当中处理速度是最快的。
第二,我们要继续确保能够提供卓越的体验,并且把我们的平台打造成一个知识的中心,以便在各个垂直行业实施,比如医疗、银行、农业、制造业。
第三,我们也开发了很多付费版本的创新组件和产品,比如Cloudera Data Science Workbench,就是我们专有的一个技术。
再如:当我们的客户在运行Cloudera产品、软件的时候,我们具备一系列的像遥感、遥测的远程监测能力,能够把客户运行的集群当中的各种信息实时加以了解。其中包括在客户实时运行的集群当中还有多少内存,CPU情况怎么样,系统配置状况如何,能够涵盖现在发行版本当中的所有29个项目,以及客户在完成任务过程当中,监测他们的可管理性、难易程度。
通过这样的数据的遥测、远程监测,Cloudera自己也有一个集群。在我们的集群当中把所有的遥测信息给存储下来,然后自己有一个专门的机器学习的算法,能够在我们关于客户集群运行信息的基础之上来进行计算。这样就能够实现一些预测性的故障警告。
比如我们可以给一个客户发出提醒,两周以后你们集群可能会宕机,如果不换掉现在的服务器、不改变系统的参数,或者不改变目前来进行查询的算法的话,两周以后你们的集群会出问题。而且在这样的服务模式当中,我们的客户数量越多,积累的信息和数据越多,我们这种预防性故障警报的能力也就越强。目前我们在给客户提供的维护服务当中,有20%都是有我刚才所介绍的通过预警而自动生成的。
Q:创新之后给用户体验情况究竟如何?Cloudera服务的垂直行业有些什么样的侧重呢?
A:在回答这个问题前首先再去强调一下Cloudera的使命和长远的目标,那就是通过正确的方式来利用数据,把今天不可能解决的一些问题变成明天可以加以解决的问题,这是我们终极的使命。完成这项使命基础性的工作是收集和存储数据,而从长远来看我们是在这些数据的基础之上要通过机器学习、先进分析和人工智能来帮助解决世界上最富有挑战性的一些难题。
举一个具体的例子,像摩根大通集团是全世界最大的银行集团之一,他们多年以来一直是Cloudera的客户,也是我们早期就发展的客户之一。这些年来,我们看到他们在Cloudera的技术使用方面以及在整个技术堆栈成熟度方面,从初期基础性的数据收集、存储和处理,已经进入到了机器学习和人工智能阶段。
比如,他们不久前部署的一个应用,就是对于摩根大通在过去几十年当中和合作伙伴签的各种各样的法律合同进行分析,把合同的输入要素和产出的结果来进行分析。通过这样的智能分析之后,他们现在的人工智能系统已经能够以非常高的精确度来复制律师的工作。这样数以十万计小时的人工律师的工作,现在用他们的人工智能的系统、用计算机来处理的话10分钟就可以完成这些任务。也就是说,他们的人工智能律师现在是能够处理大量传统的特别是常规性的法律问题,而他们的人工律师的精力现在就主要集中在处理例外情况和真正棘手的难题。
再来举一个例子,在美国有一家做医疗软件的公司叫Cerner,他们的软件主要是为手术患者提供服务。当一个患者到医院去做手术的时候,如果在手术过程当中,他的血液受到感染并且没有得到及时处理的话会有可能形成败血症,而败血症严重的话会造成患者的死亡。但一些患者出现败血症是比较难被发现,如果不能够在最初的两天之内被发现并且得到处理的话,就会非常难控制,可能会导致死亡。
现在这家公司通过使用了Cloudera的解决方案,通过数据的收集和分析,对于患者的术前、术中、术后数据的收集和分析,能够以非常高的准确度来预测患者会不会出现败血症。如果我们对于收集到的数据认为风险很高的话,那这套系统会提出建议,就是术后这个患者不能够出院,要留在医院当中进一步处理。
接下来再举一个例子,这家公司叫Navistar,它是一个整车厂,主要是生产巴士车和卡车。目前在他们已经出厂投入运行的30万辆车当中,已经装上了传感器。通过传感器能够去收集发动机的参数,以及驾驶员驾车速度的信息。
Cloudera的软件能够帮助他们做两件事,第一件事是通过传感器收集数据进行分析,能够去预测故障,比如车辆的哪一个部件有可能到什么时候会发生故障。第二是一旦预测到即将发生故障之后,他们会把所有的信息再放到Cloudera的优化算法当中,通过优化算法能够给卡车定一条路线,以便路途中排除故障。因为是一个预测性的故障,所以不需要改变正常工作。当卡车在下一个卸货点停留,同时维护、维修团队也向路线最优的下一个停留点出发,时间是协调好的,然后对卡车进行换件或者是维修。
这样的一种维修,节约了大量时间,对于这辆货车的工作没有太大的中断和干扰。通过实施这样的解决方案,这家公司得到的结果是他们车队汽油的消耗量和维修维护的成本下降了5倍,也就是500%的提高和改进。
关于第二个问题,我们重点的垂直行业有以下几个,首先是金融服务业,金融服务业当中又包括几个子行业,例如像银行、保险公司、证券公司。然后是电信行业,电信行业既包括像中国联通、沃达丰、英国电信这样的电信运营商,也包括手机移动终端制造商,比方说小米用了我们的kudu。用kudu对于小米手机当中的数据进行分析,特别是对小米部署到手机当中的软件进行分析,然后去提前发现软件可能会出现的一些缺陷,这样小米公司就能够及时向手机用户发布补丁,让他们及时打补丁。
另外一个垂直行业是制造行业,刚才举了Navistar的例子,像医疗行业举了Cerner的例子。还有一个非常广泛的行业,也就是网络安全预防黑客入侵。
最后要讲的一个垂直行业,对于我们来说是非常重要的,那就是政府行业。政府行业可以分为两类,第一类是像智慧城市、智慧政务的项目,例如新加坡在智慧城市方面是Cloudera最大的客户之一。另外还有安保,比如在反恐方面的应用。
Q:Cloudera把AWS和微软的Azure基础设施供应商也列为竞争对手,Cloudera的竞争点在哪?
A:像亚马逊的AWS和微软的Azure,也包括像谷歌云和阿里云,既是我们的合作伙伴,也是我们的竞争对手。
首先,在合作伙伴的层面,因为这些云基础设施供应商都向客户群提供IaaS服务化基础设施的服务,在客户群当中有一部分客户就是在这些云供应商的基础设施的平台之上来运行Cloudera的软件。在Cloudera目前的客户当中,有20%是在这种不同的云环境当中来运行Cloudera的软件,另外有80%的客户是在现场安装Cloudera的软件来运行的,比如刚讲到的小米。
但是有一个现象,在公有云运行Cloudera的软件,把基础设施当作一项服务来获取的数量在快速增加,这是我们和他们为合作伙伴的一面,因为我们的客户在他们提供基础设施服务的基础之上来运行使用我们的软件。
另外一方面,他们也是我们的竞争对手,因为这些云服务供应商也开始推出了一些服务,这些服务在外观上、使用感觉上是有点类似我们的软件。比如他们提供的一些服务具备了数据的收集、处理以及一定的机器学习和人工智能的能力,所以从这个意义上来说,我们也是竞争对手。
至于为什么我们同类的解决方案优于他们的解决方案。因为Cloudera从第一天开始就在专注于解决机器学习和先进分析的问题。我们这样的一个优越性不仅仅是体现在技术上,我们能把这样的解决方案和行业客户具体的实践结合在一起,包括客户的系统管理、安全性、资源分配、调度、协调、治理,所有的这些层面。我们更专注企业级客户的具体需求。
还有点关键的差异化竞争优势,我们一直着眼于未来。刚说的摩根大通用人工智能代替部分律师的工作;医疗服务行业也会看到人工智能取代部分人类医生;保险行业当中的保险精算师的工作会由人工智能来取代。这样对于一家走向未来的公司来说,实际上人工智能和机器学习就构成了核心的知识产权。
如果一家大的银行、大的医院,或者是一个大的制造企业把这种人工智能和机器学习的解决方案百分之百地依赖于像亚马逊、阿里云这样的云服务供应商的话,经过一段时间之后,特别是把他们所有最关键的知识产权锁定在这些云服务供应商专有机器学习的算法之中,在这样的条件下也许若干年之后,可能这样的云服务供应商会想我为什么不自己来做保险、不自己来做垂直的行业?就会有一个取而代之的风险。
而Cloudera软件有两个关键的优势,我们能够帮助客户保住自己的知识产权,把核心的知识产权掌握在自己手中。
首先Cloudera的平台是完全可迁移、可移植,是跨云甚至是跨环境的平台,可以使用亚马逊、微软或者是阿里云任何一个公共云平台,也可以把Cloudera的平台放在自己现场部署的私有云环境当中。
第二,Cloudera平台是开源的,对于机器学习和先进分析的算法,它作为开源的本质我们的客户是可以看得到,可以对之加以分析,甚至加以做一些更改来确保自己差异化的竞争优势,这样我们的客户就能够把自己的命运掌握在自己手中。
Q:关于人工智能和先进分析方面,Cloudera之后会有怎样的发展?
A:我先总体笼统讲一下,Cloudera公司的使命,就是通过正确地使用数据来把今天不可能解决的或者非常难以解决的问题变得可以解决,所以我们会继续在平台的基础之上增加各种能力。
具体的例子,比如不久前刚刚发布了一个新的产品叫Altus。Altus是把我们的软件以一种平台即服务(PaaS),而不是以基础设施即服务(IaaS)的方式交付给用户。
在过去三到四年当中,很多在云当中来使用我们软件的客户,他们都必须要自己建一个集群,比方说10个节点、20个节点的集群,用这个集群来处理各种各样的任务和查询。有了Altus之后,不再是一种基础设施即服务,而是平台即服务的模式,这意味着当客户有一个具体的查询或任务的时候,他把这样的查询和任务交给我们的软件,Altus软件就能够根据这项查询或者是任务自动地对查询和任务进行分析之后,动态地生成一个集群完成这个任务,然后再关掉这个集群,这样就具备了更高的弹性和动态可调的特点。
这样的一种模式或这样的产品能够带来多方面的好处,首先是增加了灵敏度,而且从开发者的角度来说不需要再去关注集群,把注意力放在任务、查询和算法之上就可以了。毫无疑问,这样的一个经济性、节约成本的效果是非常显著的,我们不需要长期地去运行服务器和节点,只需要在需要完成任务和需要完成查询的时候动态地去形成集群运行服务器和节点。
Q:Cloudera财报,订阅费是主要营收来源。在最新公布的财报中,服务成本是较去年同期提升了将近3倍的情况下,服务的营收反而下跌了,这里面主要是有哪一些的问题?Cloudera打算怎么提升运营能力?
A:首先我是首席技术官,不是首席财务官,不适合详细讲财务上的问题。
收入有两部分,一部分称之为软件订阅,另外一部分是服务。两者加在一起总收入是同比增长了41%,软件订阅的是增加了59%。实际上从投资者、从市场的角度来说,他们主要看重的是软件订阅的增长。因为服务的业务是需要靠人力来支撑的,服务做得越多,公司用的人就越多,所以服务本身并不是对公司很健康或者是很盈利的指标。市场更加看重的软件,我们的收入是同比有了59%的强劲增长。
现在唯一产生混淆或误读的,就是对于计费账单这一块。账单计费是指把账单发给客户,然后客户签字确认,是我们和客户之间的账单或文件交换的过程。在一季度,我们及时把账单发给客户并且得到签字确认,这项工作做得稍微有一些缓慢,但是这绝不等同于收入,我们的收入保持着强劲增长。市场上对于我们的计费或账单指标有一些误读,现在我们的首席财务官也是在做解释。
根据IDC的预测,到2020年我们做的市场的总规模会达到2000亿美元的规模,我们的方针就是在这样的一个市场当中要不断地去推动自身的发展,而且我们的结果将会证明一切。
Q:Cloudera是从一个创业公司慢慢做上来的,现在创业公司做大数据底层基础平台创业是否还会有机会,如何完成从0到1的冷启动呢?
A:首先创业是有难度的,就是在创业非常成熟的硅谷只有十分之一的创业公司能够得到良好的发展。我所讲的良好发展,是能够把规模做大,将来或者是上市或者是被大公司收购。只有千分之一的创业企业,最后能够做到几十亿美元的量级,就像Cloudera今天这样。Cloudera上市以后,市值是在20亿到30亿美元的区间。
要做到这一点,主要是强调三点:
首先,在创业之初必须找到一个非常切实可行的使命和目标。创业者所要找到问题,并且要去解决的问题,必须是一个非常真实的问题。就Cloudera而言,我们认为如果能够对数据进行正确地搜集和利用的话,能够解决很多今天不能够解决的问题,这就是一个非常现实的问题,也就是说你要围绕着一个非常真实的问题来进行创业。
第二,要有正确的团队,团队当中比如说要有行业最优秀的人组成,工作要非常努力,而且创业企业在团队的文化上也要能够契合。
第三,要有非常清晰的发展目标和阶段性的目标,即使作为一个创业企业也要月度或季度地对于自己的目标的节点进行评估。一旦发现多次达不到目标之后,也要具有一个很好的灵活变通性,或者是调整目标,或者是调整你的策略。
另外一点,我是专门给大数据、机器学习、人工智能领域的创业企业给的建议。不要再去做像Cloudera做过的同样事情,再去创建一个平台。这个平台已经创建了,有这样一个平台是已经得到解决问题了。而是要把注意力放在在已有平台的基础之上,利用机器学习、人工智能去构建各种各样的应用来服务于像医疗健康、农业、制造业、金融服务业行业的需求。运用已存在的底层的平台、底层的能力来打造智能的解决方案、智能的应用,而不是再去发明一个九年前已经创建出来的平台。
Q:在行业这一块,刚才了解到关注的许多垂直行业,比如金融、银行、保险等等。在国内外接触的客户中,对行业专业性的需求包括数据分析等等专业性的需求,客户能清晰描述出来吗?
A:两种情况都有,有一些客户在技术上更加成熟,他们了解这个技术,所以能够更加清晰地去沟通和讲述要求。另外一些客户,接触技术还是时间比较短,他们提出的要求比较笼统,比如帮我们上AI,对什么AI就不是很清楚。碰到这样的情况,Cloudera自己也有各个主要行业的行业专家,包括金融、保险、电信、物联网、制造、医疗方面,碰到这样的客户会让行业专家过去给他们做一个介绍,去讲讲同行业的客户是怎么样做的部署实施以及解决什么样的问题。
Q:对于行业专家这一块,过去我们对行业理解像传统的IBM,对传统金融行业理解比较深,在趋势把握上具有前瞻性。Cloudera成立时间不是特别长,有9年左右,在行业积累上现在是什么样的水平?能够给到客户真正达到趋势性产品的咨询或服务吗?
A:对于这个问题,我们如何向客户去提供更好、更高质量的建议和方案,这里面有两个方面。
首先是行业的知识、行业的能力,但是第二方面更加重要的是你的技术、平台能够具备的能力。对于IBM,我是非常尊重的,像Cloudera在将来在某种意义上希望有些方面发展成类似于IBM。从技术角度来讲,IBM技术还是过去传统的技术,IBM数据方面的产品和平台并没有及时发展演进达到Cloudera已经达到的灵活性、灵敏度和强大的性能。所以说在机器学习、人工智能、先进分析方面,Cloudera的技术是优于IBM的。
另外在行业知识、人员方面,Cloudera招聘了大量的具体行业的专家,比如来自医疗、金融等行业。这些专家在加入Cloudera之前,在相关的垂直行业已经有了长期的工作经验,比如说长达30年、40年的工作经验。我们现在所招聘的金融行业的专家,过去也为IBM金融客户工作过。到了Cloudera之后,在金融方面有非常深厚的背景,我们把Cloudera的技术和解决方案介绍给他之后,他会相当容易地把金融行业客户的需求和Cloudera解决方案的技术能力结合在一起。
Q:未来在产品路线图上,我们会更加专注通用性的产品,还是会通过行业的需求去做更深入地探索?
A:首先从Cloudera的角度来说,我们会继续专注于打造和演进平台,这是一个跨越行业的横向非常宽广的平台,能够尽可能多地去满足各行各业的需求,这是我们的使命,这也是我们的专注点。
与此同时,要能够为每个客户更好地去服务,我们也非常注重解决方案的垂直行业化。在做垂直行业解决方案的过程当中,我们也并不完全是自己在做,我们有一个非常丰富的合作伙伴的群体,在全球范围之内Cloudera有2600多家合作伙伴,这些合作伙伴有些是系统集成商、解决方案集成商,有一些是软件公司ISV,他们在Cloudera平台基础之上针对具体行业,例如金融行业、电信行业开发软件解决方案。我们的行业专家到了客户当中去,了解到客户的具体需求之后,能够把Cloudera产品优势与最合适的合作伙伴结合在一起共同满足客户的需求。
Q:Gartner将Cloudera列为挑战者,目前Cloudera面临的竞争其实还是蛮激烈的,可能有像Hortonworks、MapR,还有云厂商、传统数据库的厂商。您对这一块市场的竞争格局是怎样的看待?
A:IDC预估2020年整个市场的体量能够到2000亿美元,这是个有着巨大前景的市场,毫无疑问会有多家公司在努力成为这个市场的领军企业。如果这个市场只有Cloudera在主导的话,没有Hortonworks、MapR,也没有中国的公司星环,这只能说明这个市场本身很小。目前的竞争格局,恰恰说明了这个市场的规模非常大、非常有前景。
当然我是Cloudera的共同创始人之一,我的观点也许是有一些偏颇,但是我认为Cloudera已经是这个行业当中的领先者,主要是基于三点。
首先,Cloudera的技术是最先进。有了我们的平台,有了我们平台之上支持的29个项目,特别是陆续发布的像kudu、Cloudera Data Science Workbench、Altus,使得我们的平台在技术上是最先进、最优越的。
第二,在这个领域的解决方案和系统构建方面的知识和专长是最优的。在过去的九年当中,我们陆续为像摩根大通这样银行业的客户,以及中国联通、英国电信的电信业客户,以及Navistar制造业客户,以及大医院,为各行各业的客户打造解决方案过程中,我们积累了非常丰富的知识和专长。与此同时,我们也同时对客户在使用我们产品当中的大量数据不断收集和分析,对于Cloudera的技术他们是怎样来使用的,有了这些数据、分析之后,我们能够更好地对于客户的系统、对客户运行我们产品的过程进行维护,所以我们在帮助客户实现的可靠性方面也是优于他人的。而且我们客户用得越多,收集到的数据越多,我们维护和服务的能力越强。
第三,我们具有庞大的合作伙伴生态系统。我们在这个行业当中的合作伙伴的规模是最大的,在数量上是最多的,有2600家。像其他的一些竞争对手,像MapR和Hortonworks,他们的合作伙伴的数量是非常之小的。另外,正是由于我们的成功和我们的领先,像Oracle在这个领域和Cloudera是独家合作。
Q:Cloudera2014年进入中国,目前中国的企业客户大概有多少?
A:对于在中国客户数量的总量是不能披露的,之前举过一些案例像中国联通、中国银联都是我们的客户。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点

我要回帖

更多关于 cloudera大数据认证 的文章

 

随机推荐