openbsd 号称多少年永不宕机符 图片

楼上好多回答根本就是睁着眼睛说瞎话。。。&br&========================================&br&非学术讨论的话,你可以这么理解:&br&现代UNIX最正统的起源应当是:System V R4。比较常见的系统里:&br&【BSD系列】是去System V删除了AT&T的专利代码后,得到的来自于UNIX,本身是符合POSIX且“纯净的”&b&&u&类-UNIX&/u&&/b& (因为它没有去通过SUS认证);&br&【HP-UX、AIX、Solaris】是&u&&b&正儿八经的UNIX&/b&&/u&,其中Solaris有个开源版本OpenSolaris,其他的都是闭源的,而AIX和HP-UX都和IBM、HP自家的硬件绑起来卖,一般接触不到;&br&【Linux】是符合POSIX标准的&u&&b&类-UNIX&/b&&/u&,它从一开始就是照着UNIX设计的,但LINUX真的不是UNIX;&br&【OS X】乔帮主在NextStep时开发了基于FreeBSD的后端Darwin,回归Apple就给带过去了。OS X便是Darwin + Apple漂亮的壳的、通过了SUSv3认证的&u&&b&UNIX&/b&&/u&。&br&=========================================&br&学术讨论的话,因为“UNIX”是The Open Group所有的商标,任何OS都要符合Single UNIX Specification才能算是“UNIX”。&br&目前能正儿八经说自己是UNIX的只有AIX、HP-UX、OS X、Reliant UNIX、SCO、Solaris、Tru64 UNIX、z/OS。
楼上好多回答根本就是睁着眼睛说瞎话。。。 ======================================== 非学术讨论的话,你可以这么理解: 现代UNIX最正统的起源应当是:System V R4。比较常见的系统里: 【BSD系列】是去System V删除了AT&T的专利代码后,得到的来自于UNIX…
上知乎日报了,来更新点自己的Python知识体系,个人经验,欢迎拍砖。&br&&br&-------------------------------------------------------------------------------------------------------------&br&谢青木资本龙哥邀!&br&&br&答主更多应该算一个trader而不是quant(虽然对quant的一些知识也略懂),下面的答案可能更多是从一个交易员的角度来回答。&br&&br&想在市场上赚钱,必须同时具备两样能力:&br&&ol&&li&研究:做出正确的能够获利的决策,也就是寻找Alpha的能力&br&&/li&&li&交易:基于研究的结果和交易信号,执行相应的下单风控等操作,也就是将Alpha落实到你账户盈利上的能力&/li&&/ol&&br&&b&&u&研究方面&/u&&/b&&br&龙哥的答案已经覆盖了常用的库,这里就从研究的整体方向上来介绍下:&br&&ol&&li&获取数据:可以选择使用TuShare、通联、万得等数据工具下载数据,并将原始的数据格式转化为你自己想用的数据格式(可以用Python脚本实现),以保存到数据库中&/li&&li&存储数据:几乎绝大部分常用的数据库都提供了Python接口,SQL/NoSQL/HDF5等等多种,最常用的应该是MySql和MongoDB,有兴趣学Q的也可以直接去用KDB+,数据库具体会应用的方向包括保存数据、读取数据、数据补全机制、数据变频(TICK变K线等)&/li&&li&数据回测:将数据读取到内存中后(以numpy数组或者pandas序列的形式),进行策略的回测,并对回测结果进行研究(matplotlib绘图),或者对参数进行优化(scipy等)&/li&&li&建模相关:对数据进行一些统计学检验(statsmodel)以及机器学习建模(scikit-learn)&/li&&li&集成开发环境:在有针对性的IDE中实现以上步骤会更加简便快捷(ipython/spyder)&/li&&/ol&&br&&b&&u&交易方面&/u&&/b&&br&这部分是答主的主场了,主要分为两块:&br&1. 执行交易:对于绝大部分量化策略,都在一定程度上需要自动/半自动的下单功能。&br&&ul&&li&CTA策略突破入场(秒级延时)&/li&&li&期权做市实时挂撤单(毫秒级延时)&/li&&li&股指期货高频(微秒级延时)&/li&&li&分级基金套利(批量自动下单,延时没有以上几种重要)&/li&&li&Alpha套利(篮子交易,一般要使用vwap等算法)&/li&&/ul&&br&2. 策略风控:同样一般需要自动或者半自动的风控功能.&br&&ul&&li&期权组合的希腊值风险实时监控对冲&/li&&li&分级基金套利的beta净敞口、行业暴露等实时监控对冲&/li&&li&Alpha套利策略的因子监控&/li&&/ul&&br&具体需要掌握的知识:&br&1. 模拟实盘交易的策略回测:将策略重新编写为可以基于数据回放(逐TICK/逐K线)的模式进行回测的程序,模拟实际交易情况,杜绝未来函数的可能性,实盘交易中使用完全相同的程序进行交易,保证实盘和回测的一致性。这块通常需要专门的框架或者程序,比如通联的优矿、掘金、vn.py框架中的vn.strategy等。&br&&br&2. 实盘交易接口:将想要下的单子通过交易接口发送到经纪商柜台,目前可以实盘直接使用的应该包括掘金(期货)、vn.py中的vn.lts(证券、期权)和vn.ctp(期货)。如果要使用其他的柜台需要自己封装,如恒生、金证等。&br&&br&3. 其他语言拓展:作为最有名的胶水语言之一,Python的拓展功能不用绝对是浪费。针对计算瓶颈可以使用cython拓展,针对API可以用boost.python和swig进行封装,调用matlab直接运行其中提供的特定算法,使用COM接口调用Excel自动生成每日交易记录和报表......&br&&br&4. GUI程序的开发:相当数量的量化交易依旧需要交易员进行实时监控,除了在cmd中不断print一些数据外,更合理的方案是开发自己需要的GUI界面,重点推荐PyQt,比在C++中用Qt开发要来的快捷很多,底层运行的也是C++的代码,速度完全不用担心。一些有特别需求的人也可以考虑开发在浏览器中显示的界面,比如经常想用手机远程监控。&br&&br&&br&目前就想到这些,回头发现遗漏的再补充。&br&&br&&br&-----------------------------------------------------日更新----------------------------------------------&br&个人的Python知识体系:&br&&br&&b&&u&研究方面&/u&&/b&&br&1. 期权目前国内的历史数据较少,所以整体上用万得的API就足以满足需求,做CTA策略研究会从MC导出csv格式的数据再读取到Python中,目前在研究通联的接口,原因无他:方便和性价比。&br&&br&2. 数据储存主要用MongoDB,主要原因同样是方便,既可以用来存历史的行情数据(Tick,K线),也可以存交易系统的日志,甚至用来保存交易系统参数设置等等,存取数据如同使用Python字典一样方便(MySql试过用不惯)。&br&&br&3.
数据回测,比较粗的回测一般就直接在Spyder里随手写测试脚本:读取原始数据,用矩阵的形式计算一些变量(技术指标、希腊值),然后用循环逐行跑回测,结果出来后用matplotlib绘图很方便。比较精细的回测会基于vn.py中模拟实盘交易的回测框架,在速度上会慢些,但是可以基本杜绝未来函数。&br&&br&4. 建模相关:这块不是本人的主攻领域,偶尔有需求拿SciPy边看文档边写。&br&&br&5. 集成开发环境:交互式开发写策略回测一般用Spyder,开发大型程序的时候用WingIDE(朋友友情支持的正版,不得不说非常给力),智能提示、自动完成可以大幅提高开发效率。&br&&br&6. 交易接口:就是答主自己开发的&a href=&///?target=http%3A//vnpy.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&vn.py&i class=&icon-external&&&/i&&/a&框架了,期货方面是CTP接口,股票和期权方面是华宝的LTS接口,熟知大部分底层开发细节(为了封装接口,没办法)。然后针对不同的交易类型、交易策略,针对性的开发一些Python函数和算法,在其中实现特殊的简化下单功能(这些上层功能没放到框架中)。&br&&br&7. Python语言拓展:必须掌握的是cython,提升python计算性能的神器;另外为了封装API用的boost.python,和swig比起来的主要好处是封装完全使用C++语言,同时答主也没有在java/perl中调用封装模块的需求。&br&&br&8. GUI开发:PyQt,功能强大,文档也比较全;高性能的实时绘图:pyqtgraph,一些风控分析的图表可以用matplotlib(嵌入到PyQt中),生成的图表质量更高。&br&&br&&br&&b&&u&最后关于Python在量化交易领域的地位:&/u&&/b&&br&答主认为就像Javascript现在在web领域的地位一样,Python现在可以几乎覆盖整个量化交易业务链:从研究到写交易程序,一气呵成(可以叫做全栈Quant?)。其他的语言总会有这样那样的短板:&br&&br&C++/C#/Java:适合写交易程序,不适合用来做策略开发&br&&br&Matlab/R:适合做策略开发,但是在交易执行方面存在不少问题:速度、不稳定等等&br&&br&Python:速度不如C++,策略开发不如Matlab,但其作为胶水语言,使用这样那样的小技巧后,在两个方面都能满足需求&br&&br&最后也是很多人喜欢问的:Python确实不适合开发超高频/超低延时(追求的性能提升在微秒级)的交易策略,不过:&br&1. 在当前时间点,这个需求已经不那么迫切了;&br&2. 很多资金容量大能赚大钱(不一定是超高的回报率)的策略对延时的要求并没有那么高&br&&br&so it's all up to you
上知乎日报了,来更新点自己的Python知识体系,个人经验,欢迎拍砖。 ------------------------------------------------------------------------------------------------------------- 谢青木资本龙哥邀! 答主更多应该算一个trader而不是quant(虽然对q…
&p&&b&关于出现一部分公司在本人不知情的情况下,私自转载这篇文章到公共媒体平台或者微信公众号作为盈利目的的。我已交由法务去采集证据进行起诉。&/b&&/p&&p&&b&后面再有这样的做的,也一律追究到底。&/b&&/p&&br&&p&&b&-----------------------------------------------------------------------------------------------------------------------------------------&/b&&/p&&p&&b&接触过上万名创业者,开发上线过超过30款App,没有比我更适合回答这个问题的了。。&/b&&/p&&p&&b&本文对想做好一款App项目的人来说这是一篇价值百万的回答!因为这是我们花了几百万试错成本试出来的经验!&/b&&/p&&img src=&/4faf1e0fb5e903c8e14f955d5e248af2_b.png& class=&content_image&&&br&&br&&br&&p&
在我们从事app开发行业以来每天都会收到大量客户的咨询。其中有创业者,公司的项目经理等等。前后2年左右的时间接触了上万名想做App的客户。发现80%的客户都容易犯一些致命的错误。&/p&&p&◆以为做个软件很简单,所以描述需求的时候及其模糊。&/p&&p&◆ 急着想要报价,在自己对需求不确定的时候就要报价。然后就按这个报价开始做。&/p&&p&◆不知道自己要什么,想做个商城说要做的是淘宝。&/p&&p&◆ 网站和手机App区别搞不清楚。要做手机App却说自己要做网站。&/p&&p&◆ 以为所有软件都有模板,而且模板都很便宜。&/p&&p&◆缺乏耐心,不明白也从未想过自己要做的东西有多复杂。&/p&&p&◆自己不知道要做的东西的具体功能,要靠开发商来猜。而且还这时候就要报价。&/p&&br&&br&&p&
事实告诉我们,这些问题一定会导致以下结果。&/p&&br&&p&◆ 项目做出来跟自己想的完全不一样。&/p&&p&◆根据一项国外的专业数据统计机构调查,在外包项目中,有52%的项目经理因为项目失控/失败而被迫离职/降职/开除。&/p&&p&◆ 项目上线的时候漏洞百出,反复修修补补解决不了问题。后面必须重做。(滴滴打车当年的外包就遇到了这种情况,找外包做的一塌糊涂。做出来没用过一次就直接报废重做)&/p&&p&◆ 误把自己都不确定需求时得到的不靠谱报价当做真实报价去开始做预算,导致后期资金预算跟不上继而导致项目失控/破产。&/p&&br&&br&&p&
我们经常遇到客户第一次跟我们咨询的时候说,以前找的某某软件公司太坑爹。做的东西象一坨屎,仔细一问就发现。原来他自己在项目开工之前自己对自己的需求是完全不清楚和不确定的。就这样稀里糊涂就开工了,以为开发商会帮他完善剩余东西。实际这些客户告诉我遇到过的开发商没有一家会去帮他们中途完善。&/p&&p&
原因很简单,需求想的越仔细开发成本越高。一般根据需求的细化程度,成本差出来几倍到几十倍都很正常。10万接的项目,真要扣细节100万的工资成本都不够。这也是一般客户们平时问报价的时候,不同的开发商报价会差出来这么多倍的原因。并不是仅仅是贵和便宜。根本原因是大家对需求的理解完全是不一样的。客户自己不清楚就没人会清楚了。&/p&&br&&p&&b&负责任的外包公司会仔细的问你需求细节,不负责任的外包公司上来就给你报价。&/b&&/p&&br&&p&
人总是有惰性的,一旦要想事情和要思考的时候都懒的思考。所以客户们一般反而会讨厌这种有耐心的会仔细问需求的开发商。反而喜欢这种什么都不问其实不知道你要做什么,但是先报个超低价吸引祝其入坑的开发商。最后带来的结果一般就是我们前面提到的那种情况,项目直接失败。或者中途被黑心开发商宰一把,中途狠狠加价(原来1万能做的功能中途要5万)。因为你已经选了他了,要么做到一半放弃,要么按他的继续加钱。大部分人都不想前面投入一半的预付款打水漂,而又不知道加这么一个功能到底会加多少钱。这时候已经没法再去选其他的开发商试了。所以会选择做下去。。。&/p&&br&&p&
我见过的最常见的例子,就是很多人上来就问做一个APP多少钱?或者问做一个简单的APP多少钱?或者说我要做个类似美团/淘宝/京东/滴滴打车。。。一样的APP多少钱?&/p&&img src=&/d347daf86ec6c41fdcbdc_b.png& class=&content_image&&&p&第一种:问做一个APP多少钱? &/p&&p&
其实你问这个问题就好像你到4S店问,一辆车要多少钱?车有10万的家用轿车也有1000万的超跑。车根据用途(轿车,越野,跑车,赛车,公交也是车),配置,引擎,装置不一样,价格和成本是天差地别。同理,你来问APP也是一样的。必须表达清楚自己要的是什么样的APP,用于什么场景,APP解决什么问题,怎么解决(具体需要哪些功能)。就来问价格,不亚于你去问汽车4S店,我就是要一辆车,你告诉我价格就行了。别人肯定会拿你当傻子。因为你踏马没告诉人家你到底要什么车啊魂淡!!!&/p&&br&&p&如果你只问我做一个APP多少钱? 我只能告诉你,几百块到几个亿,都有可能。&/p&&br&&p&第二种:我要做一个简单的APP,多少钱?&/p&&p&
每个人对简单的定义是不一样的。你说的简单具体是简单到什么程度,你又具体是要做什么东西的,很多人觉得微信也挺简单的。。。建议你每次问的时候都说清楚具体功能。&/p&&img src=&/b3c2cd0f837fb5da2782_b.png& class=&content_image&&&br&&br&&br&&p&第三种:我要做个类似美团/淘宝/京东/滴滴打车。。。一样的APP多少钱?&/p&&p&
一般这么问的创业者有个特点,很多说不清楚自己要的是什么。可能只是看中了比如滴滴打车的地图功能,但是描述的时候说的是跟滴滴打车类似。而滴滴打车的地图功能本身实际只占了滴滴整个软件系统功能的百分之一都不到。同理,有的是看中了美团的团购部分,说自己要做的是美团。有的看到京东有在线支付,就说自己要的是京东。如果你直接这么问,我其实完全不明白你想要的是你举得例子里面的具体什么功能。因为不可能完全仿一个美团/淘宝/京东/滴滴打车。。。&/p&&br&&p&
为什么不能是完全仿做?你看到的貌似简单的美团/淘宝/京东/滴滴打车/微信......这样的APP,每个的软件研发成本都是过千万,乃至几亿的(特别是复杂的后台)。因为这些大公司APP的细节的复杂程度和后台的复杂程度超乎你的想象。现在所谓的很多软件仿京东,微信之类的,网上说能给你开发微信京东之类的公司,可以说真正能做的功能不到微信京东的百分之一。举几个具体的例子。比如就说最基本的注册登录,可能就分为邮箱注册登录,微信授权登录,QQ授权登录,微博授权登录,短信验证码注册登录,密码找回又分为邮箱找回和短信找回。这里就罗列了7种情况,你做一种还是做7种开发成本可能就差了7倍或者更高。&/p&&br&&p&
又比如搜索功能,最简单的搜索功能可能开发一下就是几个小时的事情,但是这种搜索可能在几千个,几万个商品数据的时候还能正常运行。但是如果商品数据有几百万条,这时候肯定会崩溃。而不仅仅是商品数据会起到影响,比如你搜索功能是支持模糊搜索(即输入的关键词可以有偏差)还是精准搜索。模糊搜索能模糊到什么程度,讲究都是很大的。淘宝京东这样大平台的搜索功能,很多大公司光一个搜索功能就是需要十几个人的开发小组常年去进行开发和优化,养这些人的成本一年就是几百万上千万。你现在就可以打开淘宝的搜索功能仔细看看它有多少细节(高级搜索,地域,价位筛选,搜索结果排序等等等等)。感兴趣的可以自己去查查这些上市公司的财报。每个季度在软件开发上的成本都是几千万到几个亿不等。大公司一定是招自己有需要的人,如果不需要肯定不会招这么多人。由于篇幅有限,更详细的原因和要注意的地方不做详述。&/p&&br&&p&&b&这里贴上滴滴打车的招聘广告,感兴趣的可以看看滴滴打车背后的技术团队有多少人。&/b&&/p&&p&&b&仅3月份在招的技术职位就多大上百个。平均年薪都在20到40万之间。&/b&&/p&&a href=&///?target=http%3A///gongsi/j2474.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&滴滴打车招聘职位&i class=&icon-external&&&/i&&/a&&br&&p&
现在诸位能理解为什么很怕这些问题了吗? 因为创业者的确是明明确确的告诉我,要做一个淘宝/京东/滴滴打车类似的APP,但是这种APP的成本是天文数字。你可能要的只是其中一部分功能,或者只是想模仿他的运营模式。&/p&&img src=&/be6fa05ca2aa6a7a58df17_b.png& class=&content_image&&&br&&br&&p&
有些人可能会觉得,这是大公司所以才需要。我创业初期需要考虑的这么细吗?很明确的告诉你,非常需要。&/p&&p&
等到错误发生了你再去解决,所要付出的成本是非常巨大或者会直接导致失败。&/p&&p&大公司不仅仅是因为他是大公司才做得细,是因为他做得细才能成为大公司。&/p&&p&
而且你不考虑没人会替你考虑。不要寄希望于你在网上找的这些软件公司,他们只会告诉你这件事很简单,你快来吧,来了就能发大财,互联网人傻钱多。你不说清楚自己的APP具体需要的是哪些功能,最后吃亏的一定是你自己。因为你在不清楚自己要做的东西具体是什么样子的时候,你找的软件公司就更加不知道。&/p&&br&&p&你寄希望于他们给你去思考细节,他们只会给你偷换概念,偷工减料。因为这样做就可以给你的报价更低增加你选他的概率。&/p&&br&&img src=&/da731de34ca428b849c9_b.png& class=&content_image&&&br&&p&
之前有个真实的例子,一个客户跟个不负责任的开发商只说了有注册登录,而没和他说过要做找回密码,开发商也没有提醒他。而最后软件就是没有找回密码的。如果各位看官不想自己也遇到这样的情况而被坑,就请想清楚自己App尽量多的细节。&/p&&br&&p&
比如一个购物车功能包括,加入购物车,从购物车移除,添加/减少购物车内某个商品的数量,直接输入数字修改商品的数量,批量付款。这些功能里面你说了一个很多开发商就只会做一个,大部分开发商不会考虑其他的。而一般创业者会觉得,淘宝有啊,一般都有啊你为什么没做?(创业者看到的一般都是那种大公司很成熟的产品),你要知道,淘宝的开发成本是亿级别的。而且经过了很多年的迭代和更新。&/p&&br&&p&阿里巴巴集团2015年Q3季度财报显示,2015年第三季度产品开发开支为人民币32.25亿元(约合5.07亿美元),占营收的15%。你没看错,一个季度32亿的开发成本。一年就是一百多亿。&/p&&br&&p&大部分情况下细节方面你不和开发商提,一般就没有。如果别人会替你考虑的越全面,那么开发成本一定会很高。&/p&&p&这里我列举三大块最影响APP软件质量和成本的东西。希望大家一定要记在心里!!!方便找合适的开发商和掌控项目质量。&/p&&br&&p&
1.功能的开发方式&/p&&p&
现在市场上存在的几种开发方式如下:&/p&&br&&p&a.web网页加壳生成APP&/p&&p&web网页加壳生成APP的开发方式,先花几百块钱买个现成的手机网站模板,在加壳打包一个APP只需要5分钟,但是做出来的效果很差,耗流量,浏览体验极差,访问速度慢等等。部分开发商利用客户不懂,把这种5分钟速成的东西,当成原生态开发的APP去欺骗创业者。卖几千到几万的价格。而创业者很多时候还自以为捡了便宜(问了十几家这家最便宜)。&/p&&br&&p&b.Web网页+原生态混编(网页部分占80%以上)&/p&&p&混编方式的APP效果比第一种稍好。但是如果要做出接近原生态的效果,需要不断的优化和改版,花的钱不比原生态少。而如果不对网页和系统优化,只是简单的拼凑。那么做出来的效果和web加壳的差不多.&/p&&br&&p&c.HTML5开发&/p&&p&成本大概是原生态APP的50%到30%,也是比较接近原生开发能达到效果的一种方式。但受到很多限制。各大平台兼容性还不足,相对来说还处于过渡期,同时比较耗系统资源。在低配的手机上更卡。手机淘宝的APP目前就是HTML5+原生态混编的,相对来说在很多低配的手机上还是比较卡的。最近优化了很多,但是早期的表现很不尽人意。Facebook和京东都尝试过HTML5,同时也吃了不成熟的亏。HTML5的未来或许是美好的,但是这期间的试错成本小公司不一定承受得起。&/p&&br&&p&d.原生态开发&/p&&p&是目前最常用和最成熟的方式。越重视细节成本越高。一般根据具体功能要求一个APP的开发成本从几千块到几千万不等。&/p&&br&&p&
2.功能的实现方式(功能的复杂程度和用户量)&/p&&p&
比如上面说到的搜索功能,具体对搜索功能的要求成本会让成本差出来几万倍。不仅仅是搜索,再举几个例子。比如微信里面的聊天,分为文字,图片聊天,录音的语言聊天,语音及时对讲,视频聊天。&/p&&p&语音及时对讲和视频聊天只简单提一提。这些都是开发成本要用百万级和千万级来计算的东西。微信和QQ乃至现在自己的语言对讲和视频聊天都是有很多问题的,比如同时多人聊天会有很大的回声,电流,杂音。不是腾讯不知道,是知道了但是很难解决。&/p&&p&这里具体讲比如录音发送,一般来说我们听一段60秒的音乐是1M左右。而微信的一段60秒的语音压缩到了几十K,来保证发送和接收时的速度。同时还做了语音降噪(减少周围的噪音)等等。而如果这些不去考虑,只是简单的发送一段语音。两者之间的开发成本相差几倍到几百倍很正常。同样的,你的APP做出来你会发现,消息发送很慢,很耗流量等等。&/p&&br&&p&
3.APP在手机上的兼容性&/p&&p&
相信各位在用手机APP的时候,特别是安卓手机。肯定发现有些APP会闪退,卡死之类的情况。这个就是因为APP的一部分功能在这台手机上不兼容或有bug。这些问题非常多而且很难解决。你只是一个用户的时候感觉不会那么强烈,因为你用的大部分都是大公司开发的很成熟的产品。但是你自己作为创业者的时候就必须要考虑了。因为没有人想自己的APP开发出来,10个手机上8个闪退。但是事实又的确如此。很多几十万成本开发出来的APP到处都是闪退。&/p&&p&
兼容性是非常影响成本的(会对成本造成上下几倍到几百倍不等的成本)。仅安卓而言。安卓手机全世界有一万多种机型,各种不同的手机品牌,分辨率,操作系统版本号,都对程序的兼容性有影响。很多时候做兼容性调试的成本还要大于软件的开发成本,真要做到主流手机兼容,光买测试的手机就要花几十万去买。一个APP如果开发出来,不做兼容性调试开发。和做兼容性调试开发,成本也是会差出来N倍的。
&/p&&p&另外在说说模板,很多时候一些项目如果有成熟的模板解决方案能节省很大的成本。&/p&&p&但是模板也一样价格存在巨大的差异。同样的一个商城模板可能价格也上下差出来几十倍,原因也是因为细节功能完全不一样,可能功能差了十几倍。如果你在买之前不仔细观察细节功能,那么一定会出现买了后大呼坑爹的情况。这个系统可能整个流程都是残缺的,更不要提你拿这个残缺的系统去运营了。&/p&&p&另外不是所有APP都有模板,一般来说只有商城相关的APP的模板比较多。而且模板有成熟不成熟的区别,真正成熟的模板开发成本和时间是巨大的,一个公司不可能同时有很多好的模板。因为数量多,必定不精。开发一个好的模板的成本已经巨大了,同时还搞多个,则说明每个模板上投入的成本和精力不会太多。&/p&&br&&p&3月30日更新几个app外包开发常见的几个坑。&/p&&p&----------------------------------------------------------------------------------------------------------------------------------&/p&&p&常见坑一:&/p&&p&&b&客户问外包公司你们有什么知名案例吗? 外包公司说有啊,美团,大众点评,携程,一号店(说出一个一二线,或者是三线有一定知名度app的例子)是我们做的/是我们的案例。&/b&&/p&&p&&b&这种情况下90%是偷换概念或者纯骗。不管你找的这家公司是真有几百个人的大公司还是只有几个人的小公司。&/b& &/p&&br&&p&实际情况是,任何你但凡听说过小有名气的App,基本都是互联网公司自己招人做的 不太可能是找外包。你可以在百度搜索任何一家你听说过的app名字或者互联网公司名字+招聘2个字,都能看到他们长期在招聘大量的程序员工程师,同时公司长期备有几十到几百,甚至上千人的技术团队。&/p&&br&&p&即使真的找外包,可能是最早创业初期的第一期找的外包,但是他们后来出名的那个系统跟最初找外包做的,已经完全不是一回事了不是一个东西了,业务代码已经完全不一样 。&/p&&p&外包做的东西就是前期低成本试错的一个东西,很可能一次都没用过就直接报废。滴滴打车之前最早就是找的外包开发的,但是基本没正式用过就直接报废了自己招人重新做。但是这家外包公司可能在N年后滴滴打车牛逼了后会跳出来跟客户说:滴滴打车是我客户案例,滴滴打车是我做的。利用的就是偷换概念和客户不懂不会较真。&b&滴滴打车当前找他们做并不是因为他们牛逼,而是滴滴打车可能也被他们坑了。&/b&&/p&&p&还有的是,有些外包公司在这个很出名的App公司团队初创的时候,跟这个团队的创始人吹过牛逼,也只是吹过一点牛逼而已,可能并没有实际合作项目。然后这个外包公司N年后发现当年一起吹过牛逼的那小伙做成功了,这时候他跳出来说 XX是我客户,XXApp是我们客户案例。。&/p&&p&还有一种情况就是, 比如很大的互联网公司,比如携程或者大众点评或者一号店,他们平时开发的时候也会有忙不过来的时候 ,偶尔会找些外包公司进行一部分的人员外包,要几个技术员过来帮忙干几个月临时的杂活。一般都是打杂接触点边缘化的没有技术含量的东西,根本接触不到核心部分业务代码。 但是这时候外包公司又会说,大众点评是我们做的。都是偷换概念,显得自己牛逼。 &/p&&p&还有的就是一点关系也扯不上, 强行欺骗来增强客户信任。揭穿了就算了。
&/p&&br&&p&其实你可以做个简单的实验,你在百度或者其他任何平台公司找app外包开发公司的时候,会遇到N家官网上有大众点评,或者在家点点,携程,美团之类的app是他的客户案例的,或者是他们的业务人员亲口跟你吹这样的牛逼。&/p&&p&其实这些被合作的互联网公司并不知道自己被合作了,以前有个梗是说吃了一次肯德基就是肯德基的战略合作伙伴了,加了一次油就是中石化的战略合作伙伴了。 而在app外包领域里真的这么干的公司非常多,不说小的,甚至大量已经上市的外包公司也吹这样的牛逼。偷换概念乐此不疲。&/p&&br&&p&&b&常见坑二:&/b&&/p&&p&&b&外包公司给你的合同一定要仔细看,很多时候被骗的客户自己公司是有法务的但是也一样被骗。因为你的法务和律师根本看不懂那些看似专业的技术词语。所以并不知道他是在扯淡还是合理的。由其是在验收标准和开发要求的这几大块上。基本如果甲方公司没有懂技术的,哪怕有专业的法务也太容易被骗。&/b&&/p&&br&&p&一般体现在合同里对需求描述的不详细或者压根合同里就没有提到需求,只说要做个某某app,多少钱什么时候交付。 这样的合同其实压根没有一点卵用,你们之间商量的做个某某app只有你们自己口头讨论了需求,但是如果没非常详细的落实在合同里,最后外包公司随便给你个东西也能交付。甚至压根就不是最早你们商量的,因为合同里并没有证据能证明你们要做的到底是什么。&/p&&p&同样的还有开发方式(原生还是混编,H5还是加壳),验收的标准是什么这些如果不提,每一次都是提前被埋下的炸弹,遇到骗子你去法院都白瞎。根本就告不倒人家,就是合法的骗。&/p&&br&&p&一般负责任的公司在合同里都会非常详细的给到一个很长的需求文档,根据项目的大小起码有几十页,里面有各自原型图和需求说明。用到的技术,项目架构,开发方式等等都讲的非常清楚。&/p&&br&&p&这个文档是合同非常重要的附件,里面详细的描述了你们这次项目具体是要做成什么样子。如果没有这个,双方签完合同的时候其实都是蒙逼的。要做什么根本没个界定,到时候胡乱拿个东西交差也是不违反合同的。&/p&&br&&p&这个看似常识的东西其实大部分外行都不知道,我每年都至少见到几十起外包开发被骗是被坑在这个地方的。&/p&&br&&p&&b&甲方如果不重视这个,哪怕被人骗了告到哪去都没用。 因为别人没违反合同。你们的合同压根就是一张废纸。&/b& &/p&&br&&p&暂时就更新这么多,app外包坑非常非常深。最好的方式就是甲方自己公司有个懂技术的能参与进来选择开发商和逐步交接。以后有时间在慢慢更新,希望能帮到真正想创业的人。&/p&&br&&br&&br&&br&&br&&br&&p&-----------------------------------------------------------------------------------------------------------------------------------&/p&&p&最近很多朋友问我是否做开发,如果项目开发需求的可以直接私信我或者微信搜索上海鸿狐关注我们的微信公众号交流。专精O2O电商和智能物联网方向。&/p&&p& 加我微信交流 &/p&&p&&a href=&///?target=http%3A///r/TFZFXSbEo3vcrWI_9wNe& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/r/TFZFXSb&/span&&span class=&invisible&&Eo3vcrWI_9wNe&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& (二维码自动识别)&/p&
关于出现一部分公司在本人不知情的情况下,私自转载这篇文章到公共媒体平台或者微信公众号作为盈利目的的。我已交由法务去采集证据进行起诉。后面再有这样的做的,也一律追究到底。 ---------------------------------------------------------------------…
营销这个词,很多外行喜欢拿来代指“宣传”,其实到了宣传环节,最重要的营销工作已经结束了。&br&战略层面的营销,指的就是产品的选择。&br&&br&良好的营销规划,应该从产品概念被提出时就已经开始了。&br&从那个时候开始,你就应该有一套完整的计划,包括渠道、定价、宣传、组织架构,包括产品原型的作用(给投资人看,还是测试团队能力,还是为了小范围试销获得用户反馈),包括小范围试销时,试点选哪儿,获得怎样的反馈后如何处理(这包括:反馈指标的确定;指标低于XX改进产品;高于YY扩大试销范围、直到最后量产;低于zz砍掉项目),一切策划工作都围绕产品展开,并在此基础上评估产品的价值和风险,而不是等产品出来后,再问“怎么营销”,对不起,没戏了。
营销这个词,很多外行喜欢拿来代指“宣传”,其实到了宣传环节,最重要的营销工作已经结束了。 战略层面的营销,指的就是产品的选择。 良好的营销规划,应该从产品概念被提出时就已经开始了。 从那个时候开始,你就应该有一套完整的计划,包括渠道、定价、…
其实上个月就看到这个问题下有对&b&知乎的数据分析&/b&,拿了好多赞。我虽然也想分享我们做的东西,但苦于原材料全是英文,style也比较严肃,调整起来比较烦。终于拖到现在,完成了整个内容的转述,并且加入了一些新的思考。&br&&br&本项目的源起其实要感谢&a href=&///people/6bfadf00a7bdc078d4f5& data-hash=&6bfadf00a7bdc078d4f5& class=&member_mention& data-editable=&true& data-title=&@苏莉安& data-tip=&p$b$6bfadf00a7bdc078d4f5& data-hovercard=&p$b$6bfadf00a7bdc078d4f5&&@苏莉安&/a&,当初就是因为看到他在专栏上发的两篇知乎数据分析的文章,觉得&b&知乎非常有分析的价值&/b&,于是在一个Course Project里提出了这个题目。正如文中已提到的,这个小项目其实远远没达到令人满意的程度,挖得太浅,实际处理的数据量也很小,我其实是还想继续做下去的。如有任何问题敬请指正,如有知友想要在此基础上继续做点啥的也请让我知道。&br&&br&本文的简书版链接:&br&&a href=&///?target=http%3A///p/60ffb949113f& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&知乎社交网络分析(上):基本统计&i class=&icon-external&&&/i&&/a&&br&&a href=&///?target=http%3A///p/3b2a1895a12d& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&知乎社交网络分析(下):关注网络&i class=&icon-external&&&/i&&/a&&br&&br&------------------------------------------------------上篇-基本统计--------------------------------------------------------&br&&b&1.0 简介&/b&&p&本文源自我在2015年&a href=&///?target=https%3A//www.cse.cuhk.edu.hk/irwin.king/teaching/cmsc& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Social Computing&i class=&icon-external&&&/i&&/a&课程中参与的一个小组项目,主要语言为Python。项目的原始材料为英文撰写,内容&b&包括了从爬取知乎数据一直到结果分析的整个过程&/b&。在本文中我打算略去数据爬取和数据库I/O的部分,重点在分享一些有趣的结论。分析过程若有不周之处,还望指正。&/p&&br&&p&为保证可读性,本文将分为上下两篇,一篇只涉及&b&数据介绍及基本的统计分析&/b&,另一篇是&b&基于用户关注网络和关注话题进行的分析&/b&。&/p&&br&&p&如果对这个小项目的全貌感兴趣,甚至想要自己fork过来玩玩,这里是项目的&a href=&///?target=https%3A///simoncos/zhihu-analysis-python& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Github传送门&i class=&icon-external&&&/i&&/a&。数据的压缩包可以在这里&a href=&///?target=http%3A///s/1bos5RqR& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&下载&i class=&icon-external&&&/i&&/a&(使用请注明来源为本答案页面)。(由于时间精力有限,想要做的远远比已经做了的多,数据量也很不让人满意,如果有童鞋感兴趣咱一起继续啊~)&/p&&br&&br&&b&1.1 数据&/b&&p&(自带吐槽模式开启)&/p&&br&&p&虽说不讲数据爬取,但要说清楚我们所使用的数据到底是啥,还是得简单提一下的。2015年10月,我们使用了&a href=&/people/zhao-che& class=&internal&&本人的知乎账号&/a&作为种子,先获得了所有我关注的用户的数据,再获得了这些用户所关注的用户的数据,所以算上种子的话一共是&b&3层的广度遍历&/b&(注意其实这个数据可能是存在严重bias的,毕竟seed是一个逗逼,逗逼关注的人呢...咦怎么感觉脖子一凉)。这里的用户数据包括:用户的回答数,用户获得的赞同数、感谢数,用户关注的人和关注用户的人,用户回答过的问题以及每个问题的话题标签。这里给出数据的简要统计信息:&/p&&br&&ul&&li&数据库文件: 688 MB(SQLite)&/li&&li&数据包含:2.6万名用户, 461万条关注连接, 72万个问题&/li&&/ul&&br&&p&这里是一张数据全貌的图示:&/p&&br&&img src=&/eb5f4b8ae01_b.png& data-rawwidth=&1240& data-rawheight=&1299& class=&origin_image zh-lightbox-thumb& width=&1240& data-original=&/eb5f4b8ae01_r.png&&&p&下面将着重介绍我们所做的分析。&/p&&br&&br&&b&1.2 玩的不是同一个知乎:均值、中位数与标准差&/b&&p&要告诉别人我们在知乎上混得怎样,最基础的几个指标是什么呢?一定是关注、回答、赞同、感谢。所以我们首先对用户的&b&关注数(followee)&/b&、&b&关注者数(follower,粉丝数)&/b&、&b&回答数(answer)&/b&、&b&收到赞同数(agree)&/b&和&b&收到感谢数(thanks)&/b&的平均数、中位数以及标准差进行了计算,结果如下表:&/p&&br&&img src=&/26e7ddcb1313_b.png& data-rawwidth=&814& data-rawheight=&326& class=&origin_image zh-lightbox-thumb& width=&814& data-original=&/26e7ddcb1313_r.png&&&br&&p&这里其实就有许多有趣的结论了。&/p&&br&&p&首先我们看平均值,哇,平均每个人有三千多粉丝,三千多赞同,再看看可怜的我,306个粉和837个赞,而且他们回答的问题也并不多啊,却有那么多赞和粉丝,还让不让人玩知乎了?再看看中位数,顿时心里好受一些了,原来我混得挺不错嘛,五个指标都是我比较大,真开心(你是不是傻)。&/p&&br&&p&究竟是什么原因造成平均值和中位数差异这么大呢,也许我们能从标准差看出来一些端倪——太大了,粉丝数和赞同数的标准差甚至超过了两万。&/p&&br&&p&这意味着什么呢?我们知道,&b&标准差其实衡量了数据个体之间的离散程度,也可以解释为大部分的数值和其平均值之间的差异&/b&。因此这么大的标准差可以说明知乎用户之间的差距可能略大于整个银河系(雾),同时也说明绝大部分用户的数值和平均值有很大的差距,要么大得离谱(比如),要么小得可怜(比如我)。&/p&&br&&p&有人可能会不服气,说标准差严重依赖于数据本身的scale,不能充分说明问题。那么这里使用标准离差率(标准差除以平均值)来算算赞同数,8.4 = 568.9%。我~就~问~你~服~不~服~&/p&&br&&p&以上现象还可以导出一个猜测,那就是知乎用户的这五个指标的值分布,都&b&不大可能是正态分布及其近似&/b&。让我们回想正态分布的样子:&/p&&br&&img src=&/40fe7cfbb6af5b7c081efb_b.png& data-rawwidth=&525& data-rawheight=&263& class=&origin_image zh-lightbox-thumb& width=&525& data-original=&/40fe7cfbb6af5b7c081efb_r.png&&&br&(图片来源:&a href=&///?target=https%3A//zh.wikipedia.org/zh-cn/%25E6%25AD%25A3%25E6%E5%E5%25B8%2583& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&zh.wikipedia.org/zh-cn/&/span&&span class=&invisible&&%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&)&br&&br&&p&如果是正态分布,中位数(最中间的值)、众数(最多的值)以及平均值三者至少应该是非常接近的,然而我们这里却是地月距离(怎么一下缩水那么多)。&/p&&br&&br&&b&1.3 当雪球滚到最后:长尾和幂律分布&/b&&p&为了进一步验证1.2的猜测,我们绘制了五个指标的分布图(Distribution Graph)。&/p&&img src=&/8eeb0a9ec15ee9beb50fa676c757f224_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/8eeb0a9ec15ee9beb50fa676c757f224_r.png&&&img src=&/308db43bcfac4d3f84196_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/308db43bcfac4d3f84196_r.png&&&img src=&/fffdc1d1c9cb6_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/fffdc1d1c9cb6_r.png&&&img src=&/3dc8a51c8e291b3cf6dff6a1e8eb2b44_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/3dc8a51c8e291b3cf6dff6a1e8eb2b44_r.png&&&img src=&/98b05b65_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/98b05b65_r.png&&&p&这里说明一下这五张分布图的含义,横轴表示指标的具体数值,纵轴表示有多少用户具有该指标值。需要注意的是横轴值和纵轴值都取了以10为底的log,这是研究中一种常见的处理办法,能够使图所表达的信息更清晰。以感谢数分布图为例,那个最左上方的点表示在这两万多知乎用户里面,有大于10的三次方也就是1000的人没有获得一个感谢(摸摸大);而最下面那一排点则是说,感谢数是x1,x2,..., xn (反正都不小)的用户,都只有一个人——注意仅这一排点并不能形成什么有效的结论,因为可能感谢数100的只有一个人,101的就有好多人了,这一定程度上大概是因为&b&数据量小,采样不足&/b&。但是如果把下面几排点放到一起考虑,也许会更有启发一些。&/p&&br&&p&顺便提一句,其实关注数和粉丝数的分布图分别还有另外一个名字,它们其实是&b&知乎用户关注网络的出度(out-degree)分布图和入度(in-degree)分布图&/b&,这点在下篇中还会有所提到。&/p&&br&&p&如果是对这种分布图比较熟悉的童鞋,应该一眼就能看出,这绝壁不是正态分布,而极有可能是&b&幂律(power law)分布&/b&(不过因为懒我们并没有做拟合去验证),这种分布在许多有人参与其中的网络中都会出现。此外,仔细&b&比较这五条曲线的整体形状&/b&,有没有觉得有两条与另外三条略有不同?一条是关注数,一条是答案数,这两条曲线向外的弯曲程度似乎更明显,也就是说随着横轴值的增大,纵轴值减小的趋势相对较慢,而恰好五个指标里只有这两个是某个用户自己可以控制的,而其他三个指标则是由其他用户形成的群体所控制,这是很奇妙的一点,我觉得其实还有深挖的可能性。&/p&&br&&p&现在让我们以感谢数为例,再画另外一种分布图。横轴表示每个用户的index也就是0,1, 2, 3...,顺序由感谢数大小决定,纵轴则是该用户收到感谢数的具体数值:&/p&&img src=&/73678bced520d8c47554fa_b.png& data-rawwidth=&1240& data-rawheight=&606& class=&origin_image zh-lightbox-thumb& width=&1240& data-original=&/73678bced520d8c47554fa_r.png&&&p&看到那个突破天际的点了吗,二十七八万的感谢(其实这个点在前面那张感谢数分布图中也出现了,你还认得仅在几个自然段以外的它吗)!再看看下面那条长长的尾巴,人艰莫拆。再来看一个更夸张的,赞同数:&/p&&img src=&/413ba1ee2_b.png& data-rawwidth=&1240& data-rawheight=&606& class=&origin_image zh-lightbox-thumb& width=&1240& data-original=&/413ba1ee2_r.png&&&p&其他三个指标的图的形状也基本如此。&/p&&br&&p&苏莉安曾使用远大于我们的数据量做了&a href=&/sulian/& class=&internal&&类似的分析&/a&,结论是一致的。总结一下就是:大多数人小得可怜,却有极少数人大得可怕,一点也不正(可)态(爱)。前几年不是有本书很火吗,叫做《长尾理论》?所谓&b&长尾&/b&,指的就是这样一种现象(附送我对该现象的一些解释:&a href=&/question//answer/& class=&internal&&什么是「长尾效应」 ? - 赵澈的回答&/a&)&/p&&br&&p&到这里不由得让人提到另外一个东西:&a href=&///?target=https%3A//zh.wikipedia.org/wiki/%25E9%25A9%25AC%25E5%25A4%25AA%25E6%E5%25BA%2594& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&马太效应&i class=&icon-external&&&/i&&/a&。所谓穷的人越来越穷,富的人越来越富,感觉上其实就是长尾效应的动态解释(最近打算看看有没有相关的文献)。富的人掌握大量资源,因此更可能攫取更多资源,而穷的人则相反;大V因为有名而得到更多关注,同时因此变得更加有名;玩游戏carry从而得到更多钱,有了钱买装备又更可能carry。这是典型的正(滚)反(雪)馈(球)。最后造成的结果,就是长尾现象。&/p&&br&&br&&b&1.4 论如何滚成人生赢家:赞同与关注&/b&&p&这一节可以算是对上一节结论的一个支撑。下面这张图同时包含了用户的赞同数和粉丝数两个指标:&/p&&br&&p&(&strong&!密集恐惧症高能预警!&/strong&)&br&&/p&&img src=&/5c55de6f2ac74caf3e72_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/5c55de6f2ac74caf3e72_r.png&&&br&&p&我想不需要我们再做个回归什么的了,一看就是赤裸裸的正相关啊。这也为我等如何冷启动逆袭成为知乎大V提供了理论支持——要么你就有本事回答出几个赞数突破天际的答案,要么你一开始就很有名,没写啥答案也能吸粉...(说的都是屁话...)&/p&&br&------------------------------------------------------下篇-关注网络---------------------------------------------------------&br&&b&2.0 社交网络是什么?&/b&&p&在上篇所述的基本的统计分析之后,我们已经对知乎用户的赞答谢关四个方面的总体情况有了一些了解。现在,让我们先来考虑这样一个问题:我们平常所说的社交网络或者说社会网络,到底是什么意思?也许你会讲,这还不简单,只要一个事情有多人参与,自然就会具有社交的性质,从而产生社交网络。那么让我们思考思考,维基百科算不算具有社交性质?&/p&&br&&p&维基百科确实有很多人参与编辑词条啊,但是这些人之间有没有更直接的互动呢?假设编辑者们通过QQ、微博之类进行互动,那产生出的社交性质算不算是维基百科本身所具有的社交属性呢?即使维基百科提供评论区之类的功能,可以使编辑者之间直接互动,这些互动仍然是基于某个词条的,只要这个词条没什么大问题了,互动基本上也就随着编辑的停止而停止了。我认为这种临时建立起来的关系,并无法得到一个较为稳定的社交网络。&/p&&br&&p&让我们再来思考一个例子。我们知道,一门科学源自跨越时代的许多人的共同贡献,那么这许多人,能够构成社交网络吗?当然不能。所谓牛顿和爱因斯坦的对话只是一种修辞,一篇已经发出的论文,如何能引用一篇未来的论文?但是当我们考虑到同一时代的同一学科,情况就有所不同,学者之间确实存在着各种交流合作的可能,因此我们可以认为学术领域的共同作者关系(Co-authorship)形成的网络其实是带有社交性质的。&/p&&br&&p&从以上粗略的思考中我们或许可以总结&strong&形成社交网络的几个条件:多主体的直接互动、互动的长期性、互动的近同时性&/strong&。&/p&&br&&p&现在让我们重新回到知乎上面来。赞同、感谢、回答、关注,哪一种用户行为最满足以上三个条件?回答是基于问题的,知乎的产品设计并不突出是谁提出了某个问题,并且一个问题可以被不同的人进行编辑(类似维基百科的权限设计),也就是说回答者一般不大在意是谁提出了问题,所以回答连互动都称不上;赞同、感谢以及我们之前没有提到的评论,相对来说互动得稍微直接一点,但是鼠标一点了事,不具有长期性;只有关注关系,同时满足了三个条件。这里可能会有一个疑问,关注也只是鼠标那么一点,这能算长期的吗?不要忘记知乎的时间线(Timeline)机制,这使得关注者有更大的概率看到被关注者的活动并与之进行互动,并且只要关注不取消,这种对时间线的影响就是长期的。&/p&&br&&p&到此,我们可以认为,如果想要对知乎从社交网络的角度上进行分析,首先就可以考虑知乎用户之间的关注关系。接下来开始介绍我们对此进行的具体分析。&/p&&br&&br&&b&2.1 分析对象和分析方法&/b&&p&首先来了解一些网络的基本知识:&/p&&br&&p&&strong&一个网络可以被表示为一种图(graph),其中包含点(vertex / node)与边(edge / link)两种基本要素。&/strong&边可以具有方向性,也就是说对于一个点来说,可以有外连边(out-link)和内连边(in-link)两种边。如果边是具有方向性的,那么这种图称为有向图(directed graph),反之称为无向图(undirected graph)。图反映了点与点之间的某种相关关系,这种关系由边表现。&/p&&br&&p&回到知乎上,我们知道关注和被关注实际上是一件事情的两个角度。A关注了B,等价于B被A关注。在我们所爬取的数据中(见1.1中的数据全貌图),我们知道这2.6万用户中的每个人都关注了哪些人。也就是说,我们知道了2.6万用户点的所有外连边。从另一个角度想,我们其实也知道在这2.6万用户之间谁关注了谁(蓝圈以内的部分),&strong&加上&/strong&他们关注了其他什么人(蓝圈以外的部分)。因此我们只能分析这2.6万用户(红色实心圆),因为我们并不知道其他的人(红色空心圆)的所有连接,这是由我们的广度优先爬取机制所导致的,不爬完知乎整站,不会有真正完整的数据(那些没人关注的账号应该可以忽略)。&/p&&br&&p&此外,即使剔除了蓝圈以外的部分,涉及的连边数仍然具有很大的量级,计算量会是一个问题,所以在这个项目中,我们仅仅选取了这2.6万用户的两个有趣的子集进行分析:获得赞同数大于1万的用户(共1895人)、获得赞同数大于5万的用户(共375人)。方便起见,我们将他们分别命名为&strong&Net10k&/strong&和&strong&Net50k&/strong&,其实可以说就是&strong&两个不同级别的知乎大V群体&/strong&了。&/p&&br&&p&接下来讲讲分析方法。一个网络图,别看里面只有点和边两种东西,其实可以包含复杂到极点的各种现象与性质。网络分析,或者进一步说复杂网络领域之中,存在大量人们为了描述网络的现象而定义的概念、以及为了量化网络的特征而设计的指标。后文将要涉及的分析建立在其中最基本的一些概念和指标上,如果对它们逐个详细介绍,那么本文篇幅会大大加长,而且会多出不少数学公式,这不符合我对本文的写作预期。因此我打算尽量从直觉(intuition)上来解释它们分别表达了什么的含义,即使给出定义也不求严格(数学公式才可带来最清晰严格的定义),重点仍在对分析的思考。此外,由于我们所讨论的知乎关注网络是有向图,&strong&后面所有的指标和算法都只讨论有向图的&/strong&。当然,如果读者已有一定的基础,可以直接跳过相关的段落。&/p&&br&&br&&b&2.2 抱团的大V们:网络总体特征&/b&&p&一直以来知乎就给人一种印象,那就是大V们喜欢抱团。你关注我、我关注他、他又关注你,形成了紧密的圈子。那么我们怎样来量化这种特征?&/p&&br&&p&假设有A、B、C三个用户组成的关注网络,其中唯一的边是A-&B,那么你觉得这个网络是否紧密?我们可以这样想,三个人之间最多可以有6条边,那么我们可以用1除以6来表示这个网络的紧密程度。如果6条边都存在,那么紧密程度是1,都不存在则为0。这就是所谓图的&strong&密度(density)&/strong&。Net10k和Net50k的密度分别是0.064和0.195,到这我们可以猜测,获得赞同更多的大V之间,关注关系也更为紧密。&/p&&br&&p&接下来我们从另一个角度考虑这个猜测,先补充几个定义:&/p&&br&&ul&&li&&p&点的&strong&度(degree)&/strong&:与一个点通过边相连的其他点的数量和,被称为这个点的度。有向图中一个点存在出度和入度两个度,一个只看它能到达哪个点,一个只看哪些点能到达它。对于知乎的关注关系而言,我们很容易就能看到出度就是你关注的人数,入度就是关注你的人数;&/p&&/li&&li&&p&点与点之间的&strong&路径(path)&/strong&:假如从点A出发,经过一条或更多条边,到达了点B,那么我们称这些边按顺序相连形成了一条A与B之间的路径。两点间的路径数量一定是大于等于0的。假设每条边的长度相等,那么包含边数最少的路径,便是所谓最短路径(shortest path),最短路径的长度一般被认为是两点之间的距离(distance);&/p&&/li&&li&&p&图的&strong&平均最短路径长度(average shortest path length)&/strong&:对于一个网络而言,将所有点两两之间的最短路径长度进行算术平均,得到的就是所谓平均最短路径,可以用来衡量网络中点之间的平均距离。传说中的六度分隔(Six Degree Seperation),其实指的就是一个网络的平均最短路径长度为6(这里大家可以想想边、度和路径三者间的联系);&/p&&/li&&li&&p&点的&strong&偏心率(eccentricity)&/strong&:对于图中的任意一点P,算出它与其他各个点的最短路径长度(距离),其中最大的距离称作点P的偏心率。&/p&&/li&&li&&p&图的&strong&半径(radius)&/strong&与&strong&直径(diameter)&/strong&:图的半径、直径分别是图中最小的、最大的点偏心率。注意图的直径不必然是半径的两倍。&/p&&/li&&li&&p&图的&strong&强连通子图&/strong&&b&(strongly connected subgraph)&/b&:设想一个网络图G的一个子图G'(意味着G'中的点和边都只能从G中挑),其中每一个点都能通过某条路径到达另一个点,则我们说G'具备强连通性,而且是G的一个强连通子图。这里注意,单独一个点我们也认为是强连通子图,虽然单个点并没有值得研究的;&/p&&/li&&li&&p&图的&strong&强连通分量&/strong&&b&(strongly connected component)&/b&:G的一个极大的强连通子图G''(意味着再往G''加任何G中剩下的点,都会破坏其强连通性)被称为G的一个强连通分量。这里需要注意,极大并不代表很大;&/p&&/li&&/ul&&p&字好多看烦了吧,终于可以上图啦,下面分别是Net10k和Net50k的强连通分量示意图:&/p&&img src=&/b9619bacbcbde_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/b9619bacbcbde_r.png&&&img src=&/c914a4eaf1d9b5524453bcad_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/c914a4eaf1d9b5524453bcad_r.png&&其中每一个红色圆圈都代表一个强连通分量,每条线(其实是很抽象的箭头orz)代表一条路径。光看这个我们还不清楚情况,我们来看二者对应的一些指标数据:&br&&br&&img src=&/b22d8dff381e89ae43fe_b.png& data-rawwidth=&631& data-rawheight=&198& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&/b22d8dff381e89ae43fe_r.png&&&p&总结一下我们知道了什么:&/p&&ol&&li&基本上Net10k和Net50k这两个图就是强连通的,别说抱团了,这已经根本就是&b&挤成一坨&/b&(好吧,一个圈子)。&/li&&li&除了一个巨大的圈子,群体里就剩几个特立独行的高冷大V(都是只包含一个点的强连通分量),他们受到了其他大V的关注,但却没有任何回粉。在网络中,这种点也被称为&b&悬挂点(dangling nodes)&/b&;&/li&&/ol&&p&现在我们重点分析两个最大的强连通分量,连通倒是连通,但是如果A要经过100个人才能到B,那估计光凭关注关系,他们是没有缘分了。将Net10k和Net50k的最大强连通分量分别命名为&strong&Net10k-C&/strong&和&strong&Net50k-C&/strong&,以下是两者对应的指标数据:&/p&&img src=&/a42cc5ac11b049595cba_b.png& data-rawwidth=&631& data-rawheight=&201& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&/a42cc5ac11b049595cba_r.png&&&p&如果你就是Net50k-C中的一个大V,还不认识其中的另一个大V?没关系,你关注的关注的关注...总会有他,所以你们总有机会看到彼此。强连通保证了总会有一条路径,平均最短路径向你保证平均来讲这条路径很短,只有2左右。直径和半径则告诉你&strong&在最坏情况下&/strong&(你们碰巧是整个圈子里相距最远的两位),这条面基道路的长度在2到5(4)之间。What a small world,喜鹊们(雾)如是说。&/p&&br&再来对比Net10k-C和Net50k-C的平均最短路径长度和直径,后者都比前者要小,从另一个角度说明后者的关注圈子更紧密。而且注意一点,这些大V是来自各个不同的专业领域,但都紧抱在一起,这也是很有趣的现象,有进一步分析的价值。&br&&br&&br&&b&2.3 给大V排个位:网络连接分析&/b&&p&上节侧重于对知乎大V关注网络的整体进行分析,这固然很有趣;但或许更有趣的是这个整体之中的每个个体,同样是赞同数很高的大V,他们彼此之间是否能一较高下呢?他们在关注这种社交行为上是否具有差异,如何衡量这种差异?这是本节涉及的问题。&/p&&br&&p&让我们先来设想一个简单的关注网络,其中只有A、B、C三个人。A关注了B,B关注了A,A、B同时关注了C,而C谁也不关注,如下图所示:&/p&&br&&img src=&/1331fec9d34e5196ffce2ebac11bdade_b.png& data-rawwidth=&869& data-rawheight=&781& class=&origin_image zh-lightbox-thumb& width=&869& data-original=&/1331fec9d34e5196ffce2ebac11bdade_r.png&&&br&&p&那么你觉得光凭关注关系来看,A,B,C谁更“牛”?从直觉上来说当然是C,因为C在三人之中得到了最多的关注。但是否只要粉丝更多就能说明更“牛”呢?下面我们在这个网络的基础上,来考虑几种很有趣的情况:&/p&&ol&&li&多了10个自己粉丝数为0的用户,同时关注A&/li&&li&多了10个用户,他们彼此全部互相关注,除此之外都没有其他粉丝&/li&&li&多了10个自己粉丝数为1的用户,同时关注A,并且每个人还分别关注了10000个其他用户&/li&&/ol&&p&那我们能说1里的A,或者2里的10个用户比C更牛吗?前两种情况明显不合道理,可以说是较为典型的作弊行为。作弊利用了&strong&单纯粉丝数排序的漏洞:没有考虑到每个关注连接的质量差异&/strong&。第三种情况算是一种正常现象,但是你会觉得,这些用户一个是只有1个粉丝,几乎等于0,另一个是他们关注了那么多用户,那么他们关注A,真是因为A很重要吗?&/p&&br&&p&既然发现了漏洞,那么假如不考虑赞同数等其他因素,我们是否有可能通过关注网络本身来予以解决呢?从直觉上来说,我们可以想到的是,用粉丝自己的粉丝的质量来衡量这个粉丝的质量,但粉丝的粉丝的质量又需要粉丝的粉丝的粉丝的质量来衡量...那么到底最后是个什么情况?到这里我们看到了&strong&日常语言结构所能承载的思维深度之浅薄&/strong&,当一个问题到达这个复杂度,语言已然苍白无力,不得不将它托付给数学。&/p&&br&&p&&strong&PageRank算法&/strong&(其与Google的关系我就不赘述了)就是一个数学上非常优美的答案,不仅考虑到前述的连接质量问题,还解决了所有特殊情况——无论关注网络是什么样子的,都保证能得到一个满意的用户重要程度排序。&/p&&br&&p&下面是我们对Net10k和Net50k分别计算PageRank值,注意这里只考虑大V们内部的连接,此外圈子里所有大V的PageRank值相加等于1。最后得到排名前五的知乎大V用户如下:&/p&&img src=&/d935f57cee51eff0ec71cf_b.png& data-rawwidth=&629& data-rawheight=&236& class=&origin_image zh-lightbox-thumb& width=&629& data-original=&/d935f57cee51eff0ec71cf_r.png&&&img src=&/e24dbdb4b7b1_b.png& data-rawwidth=&632& data-rawheight=&235& class=&origin_image zh-lightbox-thumb& width=&632& data-original=&/e24dbdb4b7b1_r.png&&&p&这些便是站在知乎大V巅峰的大V们了,是否觉得有一定道理呢?注意比较Net10k和Net50k前五用户的PageRank值,前者比后者小,这主要是因为总和为1的PageRank资源被更多的大V们分掉了。&/p&&br&&p&下面让我们再考虑一点,所谓的“重要”,其实要看我们的目的是什么。假如我们是要看更多的好答案或者想要找人出书约稿,那么直接找到好答案的答主就好,而这些答主往往吸引了最多的关注,所以我们仅仅需要知道谁受到的关注最强(比如下图中的C)。&/p&&br&&p&但是光是通过关注,我们会漏掉那些暂时没有得到太强关注的&strong&好答主&/strong&(可能是刚刚加入知乎的大V潜力股),然而我们又不可能自己去一个一个挖掘这些好答主,如何是好?简单,假如你能找到几个类似&strong&牵线人&/strong&的用户(比如下图中的D)你相信只要是他们关注的用户,质量都不会差,都合你口味,事情就简单了。你只需要不时看看他们都关注了谁,就能发现更大的世界。这其实也算是一种用户推荐系统的可行思路,这里就不展开了。&/p&&br&&img src=&/9ec53ed583f7e6a5cab713_b.png& data-rawwidth=&825& data-rawheight=&785& class=&origin_image zh-lightbox-thumb& width=&825& data-original=&/9ec53ed583f7e6a5cab713_r.png&&&br&&p&&strong&HITS算法&/strong&便能做到只使用关注网络,通过&strong&权威度(Authority)&/strong&和&strong&枢纽度(Hub)&/strong&为我们分别挑出好的答主,和好的牵线人。&/p&&br&&p&上面的基于直觉的分析是否说得通呢?让我们看看Net10k和Net50k的权威度和枢纽度前五名:&/p&&img src=&/9f8fd43cbebfb51169a27c_b.png& data-rawwidth=&786& data-rawheight=&296& class=&origin_image zh-lightbox-thumb& width=&786& data-original=&/9f8fd43cbebfb51169a27c_r.png&&&img src=&/d86edd0f92ff19ac52370_b.png& data-rawwidth=&633& data-rawheight=&236& class=&origin_image zh-lightbox-thumb& width=&633& data-original=&/d86edd0f92ff19ac52370_r.png&&&br&&p&Auth(好答主)方面,我相信大家应该能认同这样的结果名单。值得一提的是在两个大V群体之中,&a href=&///people/f9de5a09af78bfe4d1da5& data-hash=&f9de5a09af78bfe4d1da5& class=&member_mention& data-editable=&true& data-title=&@张佳玮& data-tip=&p$b$f9de5a09af78bfe4d1da5& data-hovercard=&p$b$f9de5a09af78bfe4d1da5&&@张佳玮&/a&(顺便提一下,张佳玮张公子就是上篇中那个在各条曲线中高高在上的闪亮极点)和&a href=&///people/48ddfaada296462afb5d564b& data-hash=&48ddfaada296462afb5d564b& class=&member_mention& data-editable=&true& data-title=&@梁边妖& data-tip=&p$b$48ddfaada296462afb5d564b& data-hovercard=&p$b$48ddfaada296462afb5d564b&&@梁边妖&/a&调换了位置,很有趣。另外在Net50k中,&a href=&///people/20eb55decfbe6080aceb& data-hash=&20eb55decfbe6080aceb& class=&member_mention& data-editable=&true& data-title=&@采铜& data-tip=&p$b$20eb55decfbe6080aceb& data-hovercard=&p$b$20eb55decfbe6080aceb&&@采铜&/a& 老师一跃进入前五,&a href=&///people/f35fcb19ea59f4a12754& data-hash=&f35fcb19ea59f4a12754& class=&member_mention& data-editable=&true& data-title=&@马伯庸& data-tip=&p$b$f35fcb19ea59f4a12754& data-hovercard=&p$b$f35fcb19ea59f4a12754&&@马伯庸&/a& 马亲王(祥瑞御免)上升一名,黄继新则掉了出去。这些现象或许反映了&b&不同大V群体的一种喜好倾向的差异&/b&。&/p&&br&&p&Hub(牵线人)方面,说实话我个人只认识&a href=&///people/d18b77d8bf4a22d49fbb5b05e451fe20& data-hash=&d18b77d8bf4a22d49fbb5b05e451fe20& class=&member_mention& data-editable=&true& data-title=&@徐湘楠& data-tip=&p$b$d18b77d8bf4a22d49fbb5b05e451fe20& data-hovercard=&p$b$d18b77d8bf4a22d49fbb5b05e451fe20&&@徐湘楠&/a&一个人,其中还有一位目前处于账号停用状态,这里便不做过多分析。只有一点比较有趣,作为大V,粉丝数很大很正常,然而这些用户关注的人数也算是很多的,好几个甚至达到了几千,不可不谓之具有某种交际花属性。另外提一下,Net10k Hub的第五名,叫干脆面的用户,我已经无法知道是谁了,原来的用户ID是wang-wang-wang-08-18,现在改掉了,总觉得跟徐湘楠(ID:miaomiaomiao)之间存在着某种联系...&/p&&br&&p&综合来看,HITS和PageRank有不少相同的用户入榜,这是为什么呢?我给一个直觉上我认为对的解释,其实PageRank的值是Hub值和Authority值的一种叠加(其实感觉更像是乘的关系)后的结果,这样Hub或Auth中的一种很强,另一种也不弱时,PageRank便相应比较高,这样两种算法得到部分相同的结果便很正常了。&a href=&///people/b6fb0b7b9c680& data-hash=&b6fb0b7b9c680& class=&member_mention& data-editable=&true& data-title=&@黄继新& data-tip=&p$b$b6fb0b7b9c680& data-hovercard=&p$b$b6fb0b7b9c680&&@黄继新&/a&是一个典型的例子,他的Auth值和Hub值在Net10k和Net50k中虽然都不是最高,但都排到前20名,而他的PageRank则是第一。&b&既有内容,又能充当渠道。&/b&&/p&&br&&br&&b&2.4 不均衡中的均衡:Closeness和Betweenness中心度&/b&&p&到此先让我们总结一下,如果要衡量一个用户在关注网络中的“重要程度”,我们可以利用这几种指标:&/p&&ul&&li&该用户的粉丝数,即入度(In-degree)&/li&&li&该用户的PageRank值&/li&&li&该用户的HITS值&/li&&/ul&&p&它们在网络分析中也可被归为同一类指标:&strong&点的中心度(Centrality)&/strong&。但我们发现,其实三种指标所表达的“重要”,其含义是不完全一样的,同一个网络,同一个节点,可能不同的中心度排名会有不小的差距。接下来请允许我介绍本项目中涉及到的最后两种点的中心度:&/p&&ul&&li&&p&点的&strong&近性中心度(Closeness Centrality)&/strong&:一个点的近性中心度较高,说明该点到网络中其他各点的距离总体来说较近,反之则较远。假如一个物流仓库网络需要选某个仓库作为&strong&核心中转站&/strong&,需要它到其他仓库的距离总体来说最近,那么一种方法就是找到近性中心度最高的那个仓库。&/p&&/li&&li&&p&点的&strong&介性中心度(Betweenness Centrality)&/strong&:一个点的介性中心度较高,说明其他点之间的最短路径很多甚至全部都&strong&必须&/strong&经过它中转。假如这个点消失了,那么其他点之间的交流会变得困难,甚至可能断开(因为原来的最短路径断开了)。因此假如要&strong&hack一个网络&/strong&的话,对哪个结点下手你懂的。从另一个角度想,这些点简直就像是&strong&等在丝绸之路上必经关口的强盗&/strong&。不留下买路钱?让你无路可走,生意就别做了。&/p&&/li&&/ul&&p&这两种中心度我目前并未找到很公认的中文翻译,姑且自己翻译了。另外同PageRank和HITS一样,由于指标的计算稍显复杂,这里就不详细叙述了。但是我们都使用的是网络分析库Networkx中的算法实现,对详细算法有兴趣的读者可自行查阅其文档。&/p&&br&&p&本项目中我们分别计算了Net10k和Net10k的近性中心度和介性中心度,并画出了分布图。由于我们当时考虑欠周,算出的近性中心度是基于外连接而不是内连接的,我认为意义不大(你总是可以让自己关注更多人,从而得到更大的近性中心度),所以本文决定略过。下面主要说一下介性中心度,其于Net10k和Net50k的分布图分别如下:&/p&&img src=&/da9fe5962ece8bed5acf4f64af370ac6_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/da9fe5962ece8bed5acf4f64af370ac6_r.png&&&img src=&/2fda07b90aa4d4ef86d9b8b6acde822e_b.png& data-rawwidth=&800& data-rawheight=&595& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/2fda07b90aa4d4ef86d9b8b6acde822e_r.png&&&p&我们又得到了两条长长的尾巴。图中横坐标表示每一个特定的大V,纵坐标是大V相应的介性中心度。长长的尾巴表明大部分大V的介性中心度接近0,即使长尾以外有少数几个人远超其他人,但介性中心度的值依然很小。这说明什么?说明这些大V即使退出知乎,也几乎不会影响其他大V之间建立关注关系。没了你,我还有许多其他最短路径到达另外一个大V。这进一步说明什么?说明&strong&大V的关注网络是如此健壮&/strong&,健壮到即使失去许多结点,对整个圈子的连通几乎毫无影响。&/p&&br&&p&再横向比较一下Net50k和Net10k,可以看到这种&strong&随着圈子增大,幂律变得更强,除了少数点,大部分的人介性中心度都更趋近于0,&/strong&人数的增加进一步稀释了大多数人的“独特性”,直觉上我相信继续扩大这个圈子,到Net5k、Net1k甚至知乎全体用户,这种健壮性只会越来越强,虽然&strong&人与人相比存在指数级的差异&/strong&,但&strong&对整个网络本身而言,每个人几乎同等重要&/strong&&b&,也同等不重要&/b&。这或许可以称之为知乎关注网络所具有的一种不均衡中的均衡吧。&/p&&br&&br&&b&2.5 大V都在关注什么:热门话题分析&/b&&p&最后,我们尝试了一种获得知乎上热门话题的办法(本项目中唯一涉及内容的分析),先取得Net10k和Net50k的支配集(Dominant set,这里由于我认为实际上不用这个子集结果也不会有显著区别,所以就不解释这个概念了),然后统计集合中所有用户的回答所对应的问题标签,最后对各个话题标签按出现次数排序。以下分别是二者的前20名:&/p&&br&&p&&b&Top 20 from Net10k:&br&&/b&调查类问题 3792, 生活 3096, 历史 1713, 恋爱 1464, 心理学 1432&br&电影 1419, 人际交往 1404, 社会 1332, 互联网 1214, 情感 1197&br&政治 1028, 两性关系 994, 教育 897, 中国 823, 人生 815&br&游戏 805, 文学 772, 知乎 772, 法律 750, 音乐 738&br&爱情 699, 文化 659,创业 628, 大学 621, 程序员 619&br&心理 617, 你如何评价 X 609, 女性 604, 编程 585, X 是种怎样的体验 582&/p&&br&&p&&b&Top 20 from Net50k:&br&&/b&生活 1435, 调查类问题 1365, 政治 1285, 历史 1204, 电影 1084&br&健康 996, 社会 984, 医学 941, 恋爱 717, 中国 695&br&两性关系 688, 英语 678, 人际交往 640, 心理学 634, 互联网 595&br&法律 587, 微软(Microsoft) 555, 美国 552, 健身 538, 编程 511&/p&&br&&p&我个人认为&strong&大V们回答的问题所对应的话题,能够从一定程度上反映了知乎这个平台总体的话题领域热门程度&/strong&。另外,我觉得排在最前的一些热门话题也在一定程度上解释了为什么不同领域的大V会抱团,因为不论处于什么专业领域,&b&人们对于生活、历史、电影等人文和泛娱乐话题总是会感兴趣的&/b&,一旦都感兴趣,又都有不错的见解和分享,自然更容易惺惺相惜。&/p&&br&&p&到此,本文终于可以画上句号了,欢迎交流、讨论与点赞(最后一个才是你发自内心的呐喊吧喂)。在此还要感谢和我一起参与本项目的其他三个小伙伴,四个人一起才得以在短短时间内做到这种程度(项目report里有我们的详细分工)。感谢&a href=&///people/e10ecbd131c8ec3d6c7166820efde22f& data-hash=&e10ecbd131c8ec3d6c7166820efde22f& class=&member_mention& data-editable=&true& data-title=&@egrcc& data-tip=&p$b$e10ecbd131c8ec3d6c7166820efde22f& data-hovercard=&p$b$e10ecbd131c8ec3d6c7166820efde22f&&@egrcc&/a&的zhihu-python,帮我们省去了一部分爬虫编写的时间。&/p&&br&&p&最后再重复一遍,如果有想要和我一起,在这些工作的基础上继续做一些有趣的分析的童鞋,请一定联系我!&/p&
其实上个月就看到这个问题下有对知乎的数据分析,拿了好多赞。我虽然也想分享我们做的东西,但苦于原材料全是英文,style也比较严肃,调整起来比较烦。终于拖到现在,完成了整个内容的转述,并且加入了一些新的思考。 本项目的源起其实要感谢,当初…
&img src=&/779bfc83748fca6a685bec_b.jpg& data-rawwidth=&457& data-rawheight=&439& class=&origin_image zh-lightbox-thumb& width=&457& data-original=&/779bfc83748fca6a685bec_r.jpg&&&p&&br&&/p&&p&差不多用过几十家vps了,基本上行业内出名的我都用过。&br&既然题主关注的是“便宜”和“稳定”这两个关键词,那么我就只说一下那些性价比高又稳定的。高富帅品牌比如linode的我就不谈了。&br&每个推荐的商家我都会给出官网和我个人比较推荐的套餐&/p&&p&1.Vultr&/p&&img src=&/04b70f4ab903dd4a3605cc1fdf7cdd91_b.jpg& data-rawwidth=&1577& data-rawheight=&573& class=&origin_image zh-lightbox-thumb& width=&1577& data-original=&/04b70f4ab903dd4a3605cc1fdf7cdd91_r.jpg&&&p&&br&&/p&&p&官网:&a href=&///?target=http%3A///%3Fref%3DB& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/?&/span&&span class=&invisible&&ref=B&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&&br&&/p&&p&稳定性:五星&br&速度:四星&br&性价比:三星&br&综合评价:四星半&br&简评:&br&Vultr是一家2014年刚成立的VPS服务商,基于KVM,采用SSD硬盘,拥有大量自建机房。有日本、美国洛杉矶、Dallas、Chicago、New York、Seattle、Atlanta、英国、德国等,价格便宜,配置又高。支持Paypal、信用卡或比特币付款。&b&需要充值验证后才能开通VPS.(别tm再问我为啥vultr不给你开通vps了,你不充值有优惠也不能使用的)&/b&&br&我是从vultr刚开始运营的时候就开始用了。当时群里讨论的很火热,我于是忍不住剁手去买了个,用了一个月后果断抛弃linode转投vultr的怀抱。稳定性,速度,都非常的棒。而且后台可以自行上传iso,安装你想要的系统。&/p&&p&比较好的机房就是日本机房和洛杉矶机房,日本东京机房ping大约80,洛杉矶180左右。(2016年5月最新信息:vultr日本已经切断了电信直连线路,目前联通依旧直连,电信不行了)&/p&&img src=&/c37faffb139cc7c0b21fe2b_b.png& data-rawwidth=&640& data-rawheight=&234& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/c37faffb139cc7c0b21fe2b_r.png&&&p&&br&&/p&&p&我现在用的是它家最低配套餐,每月5刀,负载着四个站,其中一个日ip3000,稳定性非常不错。&/p&&p&2017年,vultr价格降到2.5刀了,价格战打的越来越凶残了,不过对我们消费者是个好事。目前有冲5刀送25刀的优惠,详情请点击下面的页面&/p&&p&vultr2017年全部优惠码:&a href=&/p/& class=&internal&&VULTR 2017年全部优惠码盘点(支持支付宝)&/a&&/p&&p&我的一个vultr 攻略博客:&a href=&///?target=http%3A//vultr.jiaochengwang.top/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&VULTR教程网 | vultr优惠码/vultr安装/vultr端口/vultr搭建&i class=&icon-external&&&/i&&/a&&/p&&p&&br&&/p&&p&2.搬瓦工&/p&&img src=&/6bf00d580bda130a0f726e5c8616f3ab_b.jpg& data-rawwidth=&1040& data-rawheight=&483& class=&origin_image zh-lightbox-thumb& width=&1040& data-original=&/6bf00d580bda130a0f726e5c8616f3ab_r.jpg&&&p&&br&&/p&&p&官网:&a href=&///?target=https%3A//bwh1.net/aff.php%3Faff%3D3525& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Mass VPS hosting on Enterprise equipment&i class=&icon-external&&&/i&&/a&&br&稳定性:五星&br&速度:四星&br&性价比:五星&br&综合评价:五星&/p&&p&简评:搬瓦工(bandwagonhost),隶属于加拿大IT7旗下的VPS服务品牌,主推OPENVZ架构方案,尤其是其中的4款便宜年付VPS深受广大用户的喜欢,&b&支持支付宝付款&/b&,旗下有八个机房,均支持一键切换机房位置以及一键安装各类软件等功能。&br&之前搬瓦工有3.99刀小内存vps的时候特别火爆,拿来干点坏事速度不错又便宜。可惜今年6月份全球ip枯竭,搬瓦工已经拿不到ip了,于是就暂停了低价套餐。我有个64m内存的小鸡,搭建了个静态空间练手,稳定性相当好,从来没宕机过,openvz能做到这么稳定真的很让人吃惊。&br&而且搬瓦工还有一个特色就是技术nb,能够一键切换机房的idc全世界就只有搬瓦工了,加上各种乱七八糟的一键安装各类软件等功能,特别适合菜鸟来练手。&br&目前值得推荐的套餐就是$19.99/年的套餐。(约120元rmb)512m内存,20gssd硬盘,2t流量。配置高,价格低。&br&19,99刀套餐购买地址:&a href=&///?target=https%3A//bwh1.net/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Mass VPS hosting on Enterprise equipment&i class=&icon-external&&&/i&&/a&&br&注意,洛杉矶机房ping值最低,大约180左右,但是线路只有联通直连,电信用户速度会慢一些。&/p&&p&最新消息:搬瓦工上架中国优化线路kvm架构vps,到中国大陆掉包极低,电信联通移动三直连,非常推荐!&/p&&p&512m内存 10gssd 1t流量 19.99刀
目前最值得购买的vps了。&/p&&p&测评报告:&a href=&/p/& class=&internal&&搬瓦工中国直连优化线路kvm架构测评&/a&&br&购买地址:&a href=&///?target=https%3A//bwh1.net/aff.php%3Faff%3D3525%26pid%3D53& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Bandwagon Host - Shopping Cart&i class=&icon-external&&&/i&&/a& &/p&&p&同时,电信用户推荐选用他家的cn2线路的vps,cn2就是电信自建的精品网络。价格贵了10刀,但是效果好了不止一点半点。我找了N个电信知友测试,均表示大概有三到五倍的速度提升。详情请看下面的测评报告:&a href=&/p/& class=&internal&&搬瓦工洛杉矶电信cn2(C3机房)测评报告(送福利)&/a&&/p&&p&由于搬瓦工目前套餐太多了,我专门写了一篇搬瓦工套餐对比,可以帮助你筛选你想要的套餐:&a href=&/p/& class=&internal&&搬瓦工VPS新手选购指南&/a&&/p&&p&夹个私货。我自己写的搬瓦工教程博客:&a href=&///?target=http%3A//banwagong.jiaochengwang.top/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&搬瓦工教程网 | vps/机房测试/图文教程/ipv6/端口&i class=&icon-external&&&/i&&/a&&/p&&p&&br&&/p&&p&3.DigitalOcean&/p&&img src=&/38abe876e8fc462dff27e6f39a1f3a2a_b.jpg& data-rawwidth=&1322& data-rawheight=&740& class=&origin_image zh-lightbox-thumb& width=&1322& data-original=&/38abe876e8fc462dff27e6f39a1f3a2a_r.jpg&&&p&&br&&/p&&p&&br&&/p&&p&官网:&a href=&///?target=https%3A//m.do.co/c/e20a292f0cf4& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&& &i class=&icon-external&&&/i&&/a&&/p&&p&稳定性:四星&br&速度:三星&br&性价比:四星&br&综合评价:四星&/p&&p&DigitalOcean是一家位于美国的云主机服务商,总部位于纽约,成立于2012年。由于价格低廉,高性能配置、灵活布置的优势,近些年来发展迅猛,成为中国站长圈们喜爱的品牌。该公司拥有多个数据中心:日本东京、美国 &a href=&///?target=http%3A///tag/%25E6%25B4%259B%25E6%259D%%259F%25B6& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&洛杉矶&i class=&icon-external&&&/i&&/a&、纽约、新泽西、新加坡、英国伦敦、德国富兰克林&br&我对这家原先印象不太好,一个是曾经爆出过歧视国人,乱删国人数据的事情(不过目测也是国人自己作死,但是DO从来没有解释过,因此存疑),再一个就是DO曾经出过免费100刀的优惠码,你懂得。勤劳勇敢的中国人民瞬间就把DO所有机房都挤爆了。DO所有机房全部卡成狗。&br&不过随着100刀优惠码逐渐失效,现在DO的速度又回来了。前两天看了测评报告,旧金山速度不错,ping值大概160-180之间浮动,下载速度也基本能彪满。目前来说DO唯一的缺陷就是新加坡机房和日本机房现在线路是绕道美国再到中国,因此这两个机房即使位置靠近大陆速度也是渣渣,不建议购买这两个机房。&br&顺带给个获取DO35刀优惠券的最新方法:&a href=&///?target=http%3A///915.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Digital Ocean获取35美元优惠券攻略&i class=&icon-external&&&/i&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&4.hostus&/p&&img src=&/a27a4cdf21c0eb13fa037_b.jpg& data-rawwidth=&1220& data-rawheight=&603& class=&origin_image zh-lightbox-thumb& width=&1220& data-original=&/a27a4cdf21c0eb13fa037_r.jpg&&&p&&br&&/p&&p&官网:&a href=&///?target=https%3A//my.hostus.us/aff.php%3Faff%3D364& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&HostUS - Worldwide VPS Hosting&i class=&icon-external&&&/i&&/a&&/p&&p&稳定性:两星&br&速度:三星&br&性价比;四星&br&综合评价:三星&/p&&p&简评:hostus是美国的一家vps运营商,大约有五年的历史了,说新人不是新人说老人不是老人。我手头上攥着一个他家768m内存,的vps,稳定性说的过去,用了一年了才宕机过一次。关键是便宜,一年才十刀。性价比杠杠的。除了速度慢ping值高了点没啥大缺点&br&前一阵子推出了香港机房,512m内存,一年才35刀。因为这事hostus被香港的同行ddos了半个月,因为比市价低太多了。不过这对我们消费者是好事。&br&日更新:他家多个机房都被ddos的瘫痪了,香港sl已经瘫痪一个星期多了,现在我不太推荐这家了。只能说同行猛如虎。&br&号更新:hostus的上家softlayer突然关闭了直连大陆的cn2线路!导致多个vps运营商破产。hostus虽然家大业大,到不了破产的份上,但是vps的线路质量肯定会大幅度下降,目前不建议购买香港sl机房的任何vps!还是自有机房靠谱啊······&br&2016年6月更新:目前已经支持支付宝了!同时他们推特上宣布洛杉矶KVM节点接入中国电信的cn2线路,但是我测试的下来并没有cn2的ip,ping值也没啥变化,因此这一点存疑。&/p&&p&&br&&/p&&p&美国洛杉矶一年十刀套餐(768m内存20g硬盘2t流量):&a href=&///?target=http%3A//my.hostus.us/aff.php%3Faff%3D364%26pid%3D103& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://my.hostus.us/aff.php?aff=364&pid=103&i class=&icon-external&&&/i&&/a&&br&香港一年25刀套餐(512m内存15g硬盘750g流量):&a href=&///?target=https%3A//my.hostus.us/aff.php%3Faff%3D364%26pid%3D179& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&https://my.hostus.us/aff.php?aff=364&pid=179&i class=&icon-external&&&/i&&/a&&/p&&p&&br&&/p&&p&&br&&/p&&p&&br&&/p&&p&5.host1plus&/p&&img src=&/e1977eb4bacde17a47730_b.jpg& data-rawwidth=&1015& data-rawheight=&528& class=&origin_image zh-lightbox-thumb& width=&1015& data-original=&/e1977eb4bacde17a47730_r.jpg&&&p&&br&&/p&&p&官网:&a href=&///?target=https%3A///ref/fs505ec.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&host1plus&i class=&icon-external&&&/i&&/a&&/p&&p&稳定性:四星&br&速度:四星&br&性价比;五星&br&综合评价:四星&/p&&p&老牌vps和虚拟空间经销商。成立于2008年,注册于英格兰和威尔士。他家的服务真的蛮多的,域名,vps,虚拟空间,独立服务器都有。机房分布于德国、巴西、南非、美国四个国家。网上评价很高,稳定性据说是一流的。我没用过他家的vps,但是用过他家10刀一年的虚拟主机,从来没宕机延迟过,的确对的起价格。&/p&&p&有中文面板和主页,客服24小时值

我要回帖

更多关于 tomcat oom 不宕机 的文章

 

随机推荐