这个数据表格有老司机能看懂的图嘛

小白学数据:一文看懂NoSQL数据库--百度百家
小白学数据:一文看懂NoSQL数据库
分享到微信朋友圈
此猫简介:姓名滴滴,性别男,国籍美国。性格温顺,宅死,喜欢陪主人上班和学数据,主人是大数据文摘非专栏主编Aileen,据主人介绍,滴滴很愿意为大数据文摘“小白学数据”系列代言
小白学数据:一文看懂NoSQL数据库
此猫简介:姓名滴滴,性别男,国籍美国。性格温顺,宅死,喜欢陪主人上班和学数据,主人是大数据文摘非专栏主编Aileen,据主人介绍,滴滴很愿意为大数据文摘“小白学数据”系列代言
大数据文摘作品,转载需授权
作者:&薛菲
审稿:张远园 &Aileen
“小白学数据”系列是大数据文摘新的尝试,欢迎大家给我们提出宝贵意见,更欢迎给我们推荐文章和投稿,给我们后台留言即可,谢谢。
如果你关注大数据科技动向,可能听说过一个叫NoSQL数据库的名词,这可能让人有些云里雾里。其实我们处在一个激动人心的技术更迭时代,以甲骨文为代表的SQL数据库已经称霸了企业市场30年,而近年来的NoSQL则是强有力的更新换代的竞争者。这篇文章就通过问答的方式来给小白解释NoSQL数据库系统是什么,无论你的技术背景如何都能看得懂。对于数据分析从业人员来说,了解数据库的趋势可以让你的职业生涯如虎添翼;而对于工程师来说,了解新的基础系统更是必不可少的行业知识。
几个基本问题
小白问:数据库是什么东西,可以吃吗?
答:......不可以。数据库呢,就是存储数据的地方,就像冰箱是存储食物的地方一样。
小白问:诶?我的数据就存储在自己电脑里面的excel表里里,还要数据库干嘛?
答:自己的数据的确很方便,但是对于企业来说就不一样了。一个公司里面可能有成千上万的Excel表格,还在不同的电脑上,而他们的员工和客户需要实时看到企业给他们提供的所有数据,这种文件管理的方法就很麻烦,总不能每分钟都把一个新的巨大无比的excel文件发给所有客户呀!而且数据库更有用的是进行查询,企业会给内部或者客户开发不同的应用,而这些应用需要数据的时候可以直接实用数据库的查询语句快速得到结果。
小白问:哦,那是说所有的人都直接在这个系统上查数据和改数据吗?
答:是的,数据库也会帮助你处理“并发”,也就是如果多个人同时在改数据的情况。比如你在支付宝给小灰转账,而小灰这个时候又偏偏刚好在给你转账,这时候数据库系统就要保证你们两个人最后余额都是正确的,并且在你们进行交易的时候别人如果同时查询你们俩人的余额都会得到精确的结果。在一个企业系统中,一秒钟可能有成千上万个这样的查询和改动发生呢。
小白问:那SQL又是什么鬼?
答:SQL是一种可以查询关系型数据库的语言,关系型数据库也叫SQL数据库。
所谓关系型数据库就是数据是以表格的形式进行存储的,就和你电脑上的Excel表一样,数据是一行一列整整齐齐的躺着的。表格之间有着这样或那样的关系,可以通过某信息连接在一起&。想查这些表格里的任何数据的程序员们就可以把他们想要的数据形式转化成SQL语句然后发给数据库,得到数据结果。比如你可以有一个食物管理的数据库,里面有两个表(食物表和主人表),长成下面的这个样子:
食物编号食物名称数量&喜爱程度主人编号
1 &&&&&&&&&&&&猕猴桃&&&&&&4 &&&&&53
2 &&&菠菜&&&&&&&&&10 &&&&&2 &2
3巧克力&&&&&&99 &&&1001
主人编号主人姓名&&&&&&主人性别&
1小白&&&&&&&&&&&&&&&&&女&
2小黑&&&&&&&&&&&&&&&&&男&
3小灰&&&&&&&&&&&&&&&&&男&
我们可以写一句简单的SQL语句直接调出所有男主人拥有的食品及数量。
SELECT 主人姓名,食物名称,数量
FROM 食物表,主人表
WHERE &食物表.主人编号=主人表.主人编号&AND 主人性别=‘男’
主人姓名食物名称数量
小黑菠菜10
小灰猕猴桃&4
小白问:哦,那NoSQL到底有什么过人之处呢?
答:因为近年来企业要处理的数据越来越多,越来越复杂,就出现了两个之前关系型数据库解决不了的问题:快速增长的数据规模和日渐复杂的数据模型。
第一个问题就是数据越来越多,公司以前买的装关系型数据库的那台电脑放不下了,那这个时候就有两种选择:
一种就是直接去买一台更大空间的计算机取代现有的机器。这个方法是有限制的,因为这种机器的价格一般非常昂贵,而且这个空间总是有一个上限的。
另外一种选择就是再买一台机器,然后把新的数据放到新机器里的另外一个SQL数据库里面,这个过程也叫“分片”(sharding)。&这个时候程序员要开始杯具的加班了。因为这个转换的过程非常容易出问题,而且会给使用数据库的应用增加很多的复杂度。比如我们之前的例子,在查询食品和数量的语句的时候我们要将同样的语句同时发给两个服务器,然后把最后的结果综合起来,给应用的开发增加了很多不必要的负担。分片还有很多别的缺点我就不一一赘述了。
而NoSQL数据库的服务器本身就支持很多个机器存储数据进行分布式查询,这样当空间不够用的时候就直接去扛一台新的机器回来连接到已有的计算机集群上装好数据库即可,程序员可以回家睡个好觉啦。
小白问:明白了,那另外一个关系型数据库没有解决的问题呢?
答:另外的一个问题就是把数据放到SQL数据之前要进行数据建模,也就是要考虑好每一个表里面每一列都代表什么,不同的表格之间要怎样相互关联起来。这对很多公司来说是一件非常耗费时间和精力的事情,因为他们的数据源的种类太多了。而且在数据进入数据库之后,如果在表中增加新的一列(比如想把食物的种类加进第一个表中)或者是要改变某一列的特性的话,对于系统来说是非常困难的,因为表中的数据已经一行行的存好了。
而NoSQL数据库就减轻了数据建模的负担,比如上面的表里面的一行可以变成下面JSON文档的样子:
食物名称:猕猴桃,
喜爱程度:5,
姓名:小灰,
这样很方便的可以修改数据模型的样子,而且从源数据不需要怎么改就可以放入数据库。目前用有一个行业叫做ETL,就是专门做数据形状转化的:他们将不同的源数据打磨到想要的表格的模子里,然后放入关系型数据库。这个行业价值好几十亿美元呢,很疯狂吧?用了NoSQL,公司可以节省好多时间和人民币呢。
小白:那是说NoSQL就是用文档,而SQL就是用表格吗?
答:NoSQL其实有很多不同的种类的,适用在不同的情况中并且分别有不同的存储方法。JSON是文档类NoSQL的典型格式,我们平时使用的word和pdf文件都可以很容易放入文档型数据库进行查询。而其他种类的NoSQL也可能是用图或者哈希表的模型来存储数据。如果你的数据存储的是一个社交网络类型的应用,那么对你来说用一个基于图的数据库可能更加合适,因为你关心的社交网络场景中的问题都可以得到比较快速的回答。
小白问:既然叫NoSQL,那和SQL肯定是水火不容咯?
答:哪有,NoSql其实是Not Only SQL,就是不仅仅是SQL,有一些NoSQL数据库还支持直接用SQL来做查询呢。两者的区别主要是我上面提到的两点: 1.对数据建模的要求不同:NoSQL的建模程序比较简单灵活;2.对数据增加的处理方式不同:使用NoSQL可以直接进行分布式处理。在数据规模增长需要增加新的机器的时候,不需要程序员对使用数据库的应用进行代码进行改动,直接在数据库集群中增加一台新的计算机就可以啦。
----------------------------------&
预告:这篇文章是NoSQL的入门介绍。如果你对数据库已经有所了解,请期待我们的下一篇文章,将介绍不同种类的NoSQL数据库、如何在不同的应用场景中选取适合的数据库系统以及未来技术展望,敬请期待。
【小调查】欢迎各位读者反馈意见,也欢迎给我们留言
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:2983
阅读:1178
阅读:37万
阅读:18万
阅读:19万
热门文章HOT NEWS
王宝强离婚财产分割一案可能也会或多或少影响到明星或企业家群体中...
娱乐资本论
八卦掌门人
杨国英观察
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻如何看懂利润表_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
如何看懂利润表
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩9页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢(兜里只剩十块钱)
(Zico的小女友)
第三方登录:大数据如何让你1秒钟看懂100万份Excel|界面新闻oJMedia马克思&韦伯有一个著名论断,大致是:所谓资本主义,就是用计算的方式决定所有市场行为。看看我们周遭的世界:如今每天诞生的数据量相当于人类从公元元年至大约一千年产生数据的总和;Twitter每小时诞生的数据量远超17世纪一个英国人穷尽一生接收到的信息量;2018年全球大数据方面的开支将达到令人咋舌的1140亿美元&&马克思&韦伯忘了教导世人,在这个变量日趋混乱的时代,若想用计算的方式决定市场行为,该如何分辨出随数据洪流裹挟而至的福音与噪音。&未来数据将会像石油一样成为根本性资源&,但别忘了,倘若这个世界没有汽车和飞机,那么石油的归宿或许仍然是印第安人涂在身上的颜料和骗子手中的&万能药膏&。
嗯,现在对任何机构而言,大数据都催生出了更加多元的业务逻辑,但与石油一样,大数据是手段而非目的,如何让数据落地,真正降低决策成本,才是那些希望置身数据浪潮之巅的CIO/CTO们该思考的核心问题。
大体而言,大数据的整个产业链环节包括采集&处理&分析&可视化。在我看来,尽管身为视觉动物,但不少人都极易低估最后一环&&大数据可视化的作用。所谓大数据可视化,即是通过分析工具,把繁杂多维的数据用艺术化的视觉语言表达出来,发掘隐匿在数据之中的潜在价值,用海云数据创始人冯一村的话说,就是&让人一秒钟之内看懂100万份Excel的数据信息。&11月3日,这家曾被比尔盖茨造访,行事却颇为低调的数据运营商,发布了最新产品图易4.0,一款自助完成数据可视化的在线工具,公开资料显示,世界500强中已有76家购买过这家数据公司产品和服务。
嗯,大数据可视化更像一种新的媒介,将比特洪流以一种界面友好的艺术形式翻译成可信赖的决策工具。当然,毫无疑问,所谓艺术性终究要归于用户体验的范畴,大数据可视化的唯一目的其实颇为直白:有用。
毕竟在互联网时代,我们已经听过太多没用的概念。
数据在流动,只是你看不见
凯文&凯利先生曾说过:&数据并非用来收藏和存储,它们需要的是流动,与其他数据相连接,数据处于流动状态,才能发挥出更为强大的作用。&而随着数据指数级的扩张,数据的自身形态似乎也在向更易&流动&的方向悄然进化:资料显示,在现存数据中有75%是&非结构化数据&,并不是之前占据主流的&结构性数据&。
所谓结构性数据,一个不错的例子就是各单位人力部门的Excel表格:每位员工的姓名,年龄,籍贯,职位,政治面貌,毕业院校&&条条框框,清清楚楚,就像电子科技大学教授周涛所言:&处理这类数据,用一些简单的机器学习办法,如决策树、神经网络等就能得到各个变量间的关联,并做一些简单预测。比如在某个职岗上到底是男性、还是女性,来自于什么地区,毕业于什么学校,可能他的绩效更好。&
而非结构化数据则藏匿于比特世界的各个角落,各种文字,语音,图像,视频,社交关系,空间轨迹&&他们基本异构且分别独立,如同一座座信息孤岛,人类自身不可能以类似&上帝视角&察觉各数据之间的相关性,也就难以协同工作,发挥这些数据本应拥有的价值。
事实上,海量数据的孤岛状也是不少机构驾驭数据的最大瓶颈。譬如,海云数据曾服务于某国内最大的航空公司之一,其共有3600余套系统,数据庞大,但这些系统来自于不同的系统供应商,异构数据无法实现有助于商业决策的关联分析。
非常遗憾的是,目前国内企业在进行大数据分析时,似乎仍以结构化数据为主,部分原因当然是市场上缺少真正有效且相对简单的应用工具。这也是我认为图易4.0的机会所在。
Palantir:数据宛如水晶球
非常值得关注的是,在海云数据的客户名单里,不少都是像总理办公室、地方公安局和交管局等政府职能部门,而谈及特殊机构与大数据运营商的合作关系,若你对硅谷创业公司&&尤其是创业公司的估值稍有了解,无疑会想起一个&大神&级的名字:Palantir。随着最新一轮1.05亿美金的融资,这家神秘的数据公司的估值达到了202亿美金,是继Uber,小米,Airbnb之后全球估值第四高的创业公司。
那么它究竟是干嘛的?这家由彼得&蒂尔担任联合创始人,2004年就已成立的公司因从事高度机密的数据分析工作而为人侧目。据媒体报道,在它的客户眼中,Palantir恰如《指环王》中白衣巫师萨鲁曼用的水晶球一般,可看透那些暗藏于表象之外的真相。看看Palantir的传奇履历:它是美国CIA和FBI寻求的合作对象;它曾在战乱之中的巴格达计算安全驾驶路线;帮银行追回纳斯达克前主席麦道夫隐藏的数十亿美元巨款;据说曾帮助奥巴马政府追捕本&拉登行动;跟踪沙门氏菌的爆发路径;帮助摩根大通内部定位网络欺诈,当然,它也可以帮助好时公司提升巧克力的销售利润。
那么Palantir是怎么做到的?简单地讲,就是通过复杂的算法和模型,让机器拥有&上帝视角&,人类只需为它输入各个维度的海量数据,再等它输出我们迫切希望得知的结果即可,比如:到底哪里最有可能发生犯罪?嗯,想起《少数派报告》了么?
某种程度上,海云数据的产品甚至发展路径都与Palantir极为相近。彼得&蒂尔曾坦言,一开始与CIA、FBI等机构合作,流程要漫长许多,但换来的却是最为有力的背书,这会增进&普通&客户对Palantir的信任感。所以,&中国的Palantir&?也许这才是海云数据最大的野心。
事实上,从上世纪50年代计算机图形学的诞生,数据可视化已有几十年的历史。而若将视野拉至人类与数据的关系,从古埃及时代开始,人类就懂得用数据记录日常。某种意义上,判别现代社会的一大标准,即是各个领域决策层&&尤其执政部门对于数字的驾驭程度,人类社会现代化进程无时不在伴随数据量的激增,因为数字是陌生人在现代社会进行精细化协作最为客观的中介。更近一步讲,似乎到了一个临界点之后,数据被悄然赋予了世界主体的地位,成为一个独立的世界。甚至在不少学者看来,比特才是这个宇宙运行的基本粒子,它们存在于一个个&是&或&否&的判断里,不可再分。倘若整个宇宙就是一台处理数据的巨型计算机,那所谓&大数据可视化&也就是一个处于襁褓之中,还在不断演变的概念了。
当然了,至少在现阶段,如巫师手中的&水晶球&那般,&让人1秒钟之内看懂100万份Excel数据信息&才是人们最为关心的,也是对大数据可视化的最佳定义。
0界面JMedia联盟成员知名科技自媒体,致力于为您提供文字优雅的原创科技文章;微信公号:李北辰;个人微信:libeichenniubi相关文章您至少需输入5个字评论()教你一秒钟看懂体检表上的数据,超简单!
教你一秒钟看懂体检表上的数据,超简单!
体检时,化验单上的一堆数值,总让你得“云里雾里”。而无论是手机号码,还是银行卡密码,你却能背得滚瓜烂熟。其实,与身体有关的一些数字值得一生牢记。日前,美国某杂志发表了各科名医整理出的一组与健康有关的最完美指标,小伙伴们可以参考一下!1.血压:&120/80毫米汞柱血压较低者更健康。血压达到或超过140/90毫米汞柱,就被视为高血压。最厉害的“杀手”往往“杀人于无形”,高血压也是如此,它通常无明显症状,一旦拖延不治,会导致中风、心脏病、肾脏损伤、视力及记忆衰退等。2.空腹血糖:&5.5毫摩尔/升空腹至少8小时测得的血糖即为空腹血糖,一旦达到或超过7毫摩尔/升,即被诊断为糖尿病。糖尿病不但可使心脏病风险加倍,还会增加肾病、失明等风险。人过了45岁之后,每3年应查一次血糖。身体超重及有糖尿病家族史的人群应更早检查。另外,减肥也是重要的预防措施。3.总胆固醇:&5.2毫摩尔/升总胆固醇是测量血液中所有的胆固醇和甘油三酯,胆固醇水平越高,心脏病危险越大。总胆固醇的理想值应在5.2以下,超过6.2,就是心脏病高危人群。 20岁后应该检查胆固醇。一旦检查结果异常,最好多锻炼,坚持低胆固醇、低饱和脂肪及低反式脂肪饮食,每年查一次胆固醇。必要时,还应服用降胆固醇药物。4.坏胆固醇(LDL)&2.6毫摩尔/升,好胆固醇(HDL)&1.3毫摩尔/升有人把“坏胆固醇”比喻成饺子馅里的油汤,它的累积使动脉变成了皮薄多油的“饺子”,很容易破裂。而它正是导致动脉硬化、心脏病及中风危险的罪魁祸首。LDL水平一般应控制在2.6毫摩尔/升以下,糖尿病或心脏病患者则应控制在1.8毫摩尔/升以下。 HDL(高密度脂蛋白)叫做“好胆固醇”,顾名思义,这个数值应该越高越好。HDL有助去除血管中的LDL。女性HDL低于1.3毫摩尔/升是心脏病的一大危险因素,而高于1.6毫摩尔/升则有助于保护心脏。为了提高HDL,应该戒烟,常锻炼,以单不饱和脂肪(橄榄油等)取代饱和脂肪及反式脂肪,每天饮酒不要超过1杯。5.甘油三酯:&1.7毫摩尔/升甘油三酯是在血液中检测出的脂质,被认为是血脂肪,它是高血脂的“预警信号”。甘油三酯水平升高会增加2型糖尿病和心脏病风险(特别是女性)。其水平在1.7—2.2毫摩尔/升为临界性升高,超过2.3毫摩尔/升则危险更大。因此,最好每年查一次甘油三酯,这通常为胆固醇检查的一部分。 为了降低甘油三酯水平,应减肥、戒烟、每天饮酒1杯以下,并经常锻炼。如果是单纯高甘油三酯,则应限制食物总量,尤其避免摄入碳水化合物。6.促甲状腺激素:&4.0毫摩尔/升促甲状腺激素(TSH)会影响T3和T4甲状腺素的分泌,除了有助调节新陈代谢、体温和心率之外,也会影响到皮肤、头发、肌肉力量、情绪及大脑功能。TSH超过4.5毫摩尔/升,表明甲状腺无法产生足够的甲状腺素,帮助身体正常运转。 检查促甲状腺激素应从35岁开始。女性中较常见的甲减会升高胆固醇及甘油三酯水平,导致心脏病及抑郁风险增加。如果TSH水平较高,必须服用药物。如果一切正常,可5年检查一次。7.身体质量指数BMI:18.5-24.9身体质量指数(BMI)=体重(公斤)÷身高(米)2,是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准。有调查显示,那些BMI指数超出40的人,比指数处于22.5—25的“健康人群”,往往短寿十年左右。 对中国成年人来说,BMI指数低于18.5属于偏瘦,会增加月经紊乱、生育问题、贫血及骨质流失导致的骨质疏松症等危险。健康体重的BMI指数为18.5-24.9,BMI在25-28之间属于体重超标,超过28即为肥胖症。 每年查一次体重,或在体重增加或减少的时候接受检查。如果超重,则应该控制饮食,增加锻炼,最重要的是常测腰围。这是因为,即使BMI正常,腰围过粗也会增加2型糖尿病、心脏病等危险。8.C-反应蛋白:&1.0毫克/升C-反应蛋白(CRP)指标高,意味着心脏病发作的风险比正常情况高2-5倍。此外,它也是中风、糖尿病及与某些癌症相关的慢性轻微炎症的标志。在不清楚自己的心脏病风险的时候,不妨检查一下CRP。CRP检查并非常规检查,但想了解自己心脏病风险及家族病史情况时,可进行该检查,得出的结果对医生诊断大有帮助。 如果CRP水平较高,应改变生活方式,经常锻炼,并多吃富含欧米伽—3脂肪酸的食物(三文鱼、核桃、菜籽油及亚麻籽油等),以减少体内炎症。9.身高:21岁时身高最标准一般来说,21岁时身高达到最高值。21岁之后每年应测一次身高,如果身高比21岁时矮了3.8厘米,那么应该立即检查骨骼密度或者做脊柱X光检查。大约有一半的女性一生中会发生骨质疏松型骨折。如果你的身高突然降低,那就预示着骨质密度已经开始变化。平时应常吃含钙饮食,补充维生素D,多做快走或打羽毛球等减重锻炼。烟酒习惯也影响骨骼健康。必要时遵医嘱接受药物治疗。10.生活中的其他健康数据有氧运动:每周150—240分钟,包括平日举重、散步和跑步等。力量训练:每周2—3次,举重等。水果蔬菜:每天5—9份。肥鱼:每周吃1次或服用鱼油补品,每天3克以下。维生素C:每天摄入75毫克,或约170克橙汁。钙:每天摄入毫克。维生素D:每天摄入1000国际单位。酒水:每天不超过1杯,白酒28克以下,红酒113克,啤酒340克以下。香烟:0支。睡眠:每晚7—8小时。
发表评论:
馆藏&11925
TA的推荐TA的最新馆藏[转]&

我要回帖

更多关于 能看懂这个 的文章

 

随机推荐