如何将json数据显示到设计好的网页上?最好简介方便,技术较新的方法。本人野北海发展的路子走对了没什么机会接触正规的。

hi,我快毕业了,和你一样,我之前也对自己是这么定位的。&br&&br&根据你的情况,已经有了良好的计算机基本素质,接下来的工作会好做很多。&br&你可以先试着看&a href=&///?target=http%3A///subject/1788421/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&UNIX环境高级编程 (豆瓣)&i class=&icon-external&&&/i&&/a&和&a href=&///?target=http%3A///subject/1500149/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&UNIX网络编程 (豆瓣)&i class=&icon-external&&&/i&&/a&,通过这两本书能让你对linux 下的服务器编程有一定的了解和认知。读这两本书最好有良好的操作系统和计算机网络基础,所以再推荐两本书:&a href=&///?target=http%3A///subject/1088054/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&TCP/IP详解 卷1:协议 (豆瓣)&i class=&icon-external&&&/i&&/a&和&a href=&///?target=http%3A///subject/5333562/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&深入理解计算机系统(原书第2版) (豆瓣)&i class=&icon-external&&&/i&&/a&。&br&&br&记得,看书的过程中别只用眼睛,要去实践。&br&&br&接着,你可以去使用并看一些小巧而又精彩的开源工具的源代码,譬如 libevent 或者 memcached。这些都是开源的,而且资料也有很多。看这些东西,能让你学到很多。&br&&br&一年半还很长,希望你能够耐住寂寞,在技术上有所沉淀。
hi,我快毕业了,和你一样,我之前也对自己是这么定位的。根据你的情况,已经有了良好的计算机基本素质,接下来的工作会好做很多。你可以先试着看和,通过这两本书能让你对linux 下的服务器编程有一定的了解和认…
&ul&&li&什么是机器学习,请参考这里,&/li&&/ul&&a href=&/question/& class=&internal&&什么是机器学习?&/a&&br&----------------------------------------------------------------------------------&br&&br&&ul&&li&建议&b&视频&/b&、&b&书&/b&和&b&编程实践&/b&结合起来学习。&br&&/li&&li&&b&视频&/b&:coursera 林轩田 《&a href=&///?target=https%3A//www.coursera.org/course/ntumlone& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&機器學習基石 (Machine Learning Foundations)&i class=&icon-external&&&/i&&/a&》&br&&/li&&/ul&
网易公开课 Andrew Ng 《 &a href=&///?target=http%3A///special/opencourse/machinelearning.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&斯坦福大学公开课 :机器学习课程&i class=&icon-external&&&/i&&/a&》&br&&ul&&li&&b&书籍:&/b&李航 《&a href=&///?target=http%3A///subject//& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&统计学习方法 (豆瓣)&i class=&icon-external&&&/i&&/a&》&br&&/li&&/ul&
Christopher M. Bishop 《&a href=&///?target=http%3A///subject/2061116/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Pattern Recognition And Machine Learning (豆瓣)&i class=&icon-external&&&/i&&/a&》&br&&ul&&li&&b&编程实践&/b&:《&a class=& wrap external& href=&///?target=http%3A///search/Peter%2520Harrington& target=&_blank& rel=&nofollow noreferrer&&Peter Harrington&i class=&icon-external&&&/i&&/a&&a href=&///?target=http%3A///subject//& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习实战 (豆瓣)&i class=&icon-external&&&/i&&/a&》&br&&/li&&/ul&
《&a class=& wrap external& href=&///?target=http%3A///search/TOBY%2520SEGARAN& target=&_blank& rel=&nofollow noreferrer&&TOBY SEGARAN&i class=&icon-external&&&/i&&/a&&a href=&///?target=http%3A///subject/3288908/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&集体智慧编程 (豆瓣)&i class=&icon-external&&&/i&&/a&》&br&&br&&ul&&li&从头入门的话,可以先看李航的《&b&统计学习方法&/b&》和&b&《机器学习实战》&/b&,Coursera上有吴恩达的ML的课程,最近才开你可以去跟着看看。我其实更推荐A站&b&上的台大林老师&/b&的课,虽然第一部分结课了,但是现在还可以看,课后题认真做收获很大的。等这些都看完以后,补充点数学知识,就可以去看&b&PRML&/b&或者&b&MLAPP&/b&或者&b&ESL&/b&,然后就要看你的方向了。&br&&/li&&/ul&&br&&img src=&/e649e1433fab12c3c601b136b751286f_b.jpg& data-rawwidth=&370& data-rawheight=&229& class=&content_image& width=&370&&&br&碰到不明白的数学理论,直接谷歌百度就可以了。&br&这些消化了,机器学习基本算入门了。
什么是机器学习,请参考这里,----------------------------------------------------------------------------------建议视频、书和编程实践结合起来学习。视频:coursera 林轩田 《》 网易公…
我要翻译一把quora了,再加点我的理解,我相信会是一个好答案,链接我都放到一起了,没插入到正文中,要求其实比较高了,我觉得我自己都差很远很远~~~我尽量持续更新翻译质量以及自己理解&br&&br&&blockquote&1. &b&Python/C++/R/Java&/b& - you will probably want to learn all of these languages at some point if you want a job in machine-learning. Python's Numpy and Scipy libraries [2] are awesome because they have similar functionality to MATLAB, but can be easily integrated into a web service and also used in Hadoop (see below). C++ will be needed to speed code up. R [3] is great for statistics and plots, and Hadoop [4] is written in Java, so you may need to implement mappers and reducers in Java (although you could use a scripting language via Hadoop streaming [5])&/blockquote&首先,你要熟悉这四种语言。Python因为开源的库比较多,可以看看Numpy和Scipy这两个库,这两个都可以很好的融入网站开发以及Hadoop。C++可以让你的代码跑的更快,R则是一个很好地统计工具。而你想很好地使用Hadoop你也必须懂得java,以及如何实现map reduce&br&&br&&blockquote&2. &b&Probability and Statistics&/b&: A good portion of learning algorithms are based on this theory. Naive Bayes [6], Gaussian Mixture Models [7], Hidden Markov Models [8], to name a few. You need to have a firm understanding of Probability and Stats to understand these models. Go nuts and study measure theory [9]. Use statistics as an model evaluation metric: confusion matrices, receiver-operator curves, p-values, etc.&/blockquote&&br&我推荐统计学习方法 李航写的,这算的上我mentor的mentor了。理解一些概率的理论,比如贝叶斯,SVM,CRF,HMM,决策树,AdaBoost,逻辑斯蒂回归,然后再稍微看看怎么做evaluation 比如P R F。也可以再看看假设检验的一些东西。&br&&br&&blockquote&3. &b&Applied Math + Algorithms&/b&: For discriminate models like SVMs [10], you need to have a firm understanding of algorithm theory. Even though you will probably never need to implement an SVM from scratch, it helps to understand how the algorithm works. You will need to understand subjects like convex optimization [11], gradient decent [12], quadratic programming [13], lagrange [14], partial differential equations [15], etc. Get used to looking at summations [16].&/blockquote&机器学习毕竟是需要极强极强数学基础的。我希望开始可以深入的了解一些算法的本质,SVM是个很好的下手点。可以从此入手,看看拉格朗日,凸优化都是些什么&br&&br&&blockquote&4. &b&Distributed Computing&/b&: Most machine learning jobs require working with large data sets these days (see Data Science) [17]. You cannot process this data on a single machine, you will have to distribute it across an entire cluster. Projects like Apache Hadoop [4] and cloud services like Amazon's EC2 [18] makes this very easy and cost-effective. Although Hadoop abstracts away a lot of the hard-core, distributed computing problems, you still need to have a firm understanding of map-reduce [22], distribute-file systems [19], etc. You will most likely want to check out Apache Mahout [20] and Apache Whirr [21].&/blockquote&熟悉分布计算,机器学习当今必须是多台机器跑大数据,要不然没啥意义。请熟悉Hadoop,这对找工作有很大很大的意义。百度等公司都需要hadoop基础。&br&&br&&blockquote&5. &b&Expertise in Unix Tools&/b&: Unless you are very fortunate, you are going to need to modify the format of your data sets so they can be loaded into R,Hadoop,HBase [23],etc. You can use a scripting language like python (using re) to do this but the best approach is probably just master all of the awesome unix tools that were designed for this: cat [24], grep [25], find [26], awk [27], sed [28], sort [29], cut [30], tr [31], and many more. Since all of the processing will most likely be on linux-based machine (Hadoop doesnt run on Window I believe), you will have access to these tools. You should learn to love them and use them as much as possible. They certainly have made my life a lot easier. A great example can be found here [1].&/blockquote&熟悉Unix的Tool以及命令。百度等公司都是依靠Linux工作的,可能现在依靠Windows的Service公司已经比较少了。所以怎么也要熟悉Unix操作系统的这些指令吧。我记得有个百度的面试题就是问文件复制的事情。&br&&br&&blockquote&6. &b&Become familiar with the Hadoop sub-projects&/b&: HBase, Zookeeper [32], Hive [33], Mahout, etc. These projects can help you store/access your data, and they scale.&/blockquote&&br&机器学习终究和大数据息息相关,所以Hadoop的子项目要关注,比如HBase Zookeeper Hive等等&br&&br&&blockquote&7.&b& Learn about advanced signal processing techniques&/b&: feature extraction is one of the most important parts of machine-learning. If your features suck, no matter which algorithm you choose, your going to see horrible performance. Depending on the type of problem you are trying to solve, you may be able to utilize really cool advance signal processing algorithms like: wavelets [42], shearlets [43], curvelets [44], contourlets [45], bandlets [46]. Learn about time-frequency analysis [47], and try to apply it to your problems. If you have not read about Fourier Analysis[48] and Convolution[49], you will need to learn about this stuff too. The ladder is signal processing 101 stuff though.&/blockquote&这里主要是在讲特征的提取问题。无论是分类(classification)还是回归(regression)问题,都要解决特征选择和抽取(extraction)的问题。他给出了一些基础的特征抽取的工具如小波等,同时说需要掌握傅里叶分析和卷积等等。这部分我不大了解,大概就是说信号处理你要懂,比如傅里叶这些。。。&br&&br&&blockquote&Finally, practice and read as much as you can. In your free time, read papers like Google Map-Reduce [34], Google File System [35], Google Big Table [36], The Unreasonable Effectiveness of Data [37],etc There are great free machine learning books online and you should read those also. [38][39][40]. Here is an awesome course I found and re-posted on github [41]. Instead of using open source packages, code up your own, and compare the results. If you can code an SVM from scratch, you will understand the concept of support vectors, gamma, cost, hyperplanes, etc. It's easy to just load some data up and start training, the hard part is making sense of it all.&/blockquote&总之机器学习如果想要入门分为两方面:&br&一方面是去看算法,需要极强的数理基础(真的是极强的),从SVM入手,一点点理解。&br&另一方面是学工具,比如分布式的一些工具以及Unix~&br&&br&Good luck.&br&祝好&br&&br&[1] &a href=&///?target=http%3A///2011/04/data-hand-tools.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&/2011/04...&i class=&icon-external&&&/i&&/a&&br&&br&[2] &a href=&///?target=http%3A//numpy.scipy.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&NumPy — Numpy&i class=&icon-external&&&/i&&/a&&br&&br&[3] &a href=&///?target=http%3A//www.r-project.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&The R Project for Statistical Computing&i class=&icon-external&&&/i&&/a&&br&&br&[4] &a href=&///?target=http%3A//hadoop.apache.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Welcome to Apache(TM) Hadoop(R)!&i class=&icon-external&&&/i&&/a&&br&&br&[5] &a href=&///?target=http%3A//hadoop.apache.org/common/docs/r0.15.2/streaming.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://hadoop.apache.org/common/...&i class=&icon-external&&&/i&&/a&&br&&br&[6] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Naive_Bayes_classifier& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Nai...&i class=&icon-external&&&/i&&/a&&br&&br&[7] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Mixture_model& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Mix...&i class=&icon-external&&&/i&&/a&&br&&br&[8] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Hidden_Markov_model& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Hid...&i class=&icon-external&&&/i&&/a&&br&&br&[9] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Measure_%28mathematics%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Mea...&i class=&icon-external&&&/i&&/a&&br&&br&[10] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Support_vector_machine& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Sup...&i class=&icon-external&&&/i&&/a&&br&&br&[11] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Convex_optimization& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Con...&i class=&icon-external&&&/i&&/a&&br&&br&[12] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Gradient_descent& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Gra...&i class=&icon-external&&&/i&&/a&&br&&br&[13] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Quadratic_programming& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Qua...&i class=&icon-external&&&/i&&/a&&br&&br&[14] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Lagrange_multiplier& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Lag...&i class=&icon-external&&&/i&&/a&&br&&br&[15] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Partial_differential_equation& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Par...&i class=&icon-external&&&/i&&/a&&br&&br&[16] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Summation& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Sum...&i class=&icon-external&&&/i&&/a&&br&&br&[17] &a href=&///?target=http%3A///2010/06/what-is-data-science.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&/2010/06...&i class=&icon-external&&&/i&&/a&&br&&br&[18] &a href=&///?target=http%3A///ec2/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&AWS | Amazon Elastic Compute Cloud (EC2)&i class=&icon-external&&&/i&&/a&&br&&br&[19] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Google_File_System& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Goo...&i class=&icon-external&&&/i&&/a&&br&&br&[20] &a href=&///?target=http%3A//mahout.apache.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Apache Mahout: Scalable machine learning and data mining&i class=&icon-external&&&/i&&/a&&br&&br&[21] &a href=&///?target=http%3A//incubator.apache.org/whirr/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&incubator.apache.org/wh&/span&&span class=&invisible&&irr/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&[22] &a href=&///?target=http%3A//en.wikipedia.org/wiki/MapReduce& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Map...&i class=&icon-external&&&/i&&/a&&br&&br&[23] &a href=&///?target=http%3A//hbase.apache.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&HBase -
Apache HBase? Home&i class=&icon-external&&&/i&&/a&&br&&br&[24] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Cat_%28Unix%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Cat...&i class=&icon-external&&&/i&&/a&&br&&br&[25] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Grep& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&grep&i class=&icon-external&&&/i&&/a&&br&&br&[26] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Find& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&en.wikipedia.org/wiki/F&/span&&span class=&invisible&&ind&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&[27] &a href=&///?target=http%3A//en.wikipedia.org/wiki/AWK& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&AWK&i class=&icon-external&&&/i&&/a&&br&&br&[28] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Sed& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&sed&i class=&icon-external&&&/i&&/a&&br&&br&[29] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Sort_%28Unix%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Sor...&i class=&icon-external&&&/i&&/a&&br&&br&[30] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Cut_%28Unix%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Cut...&i class=&icon-external&&&/i&&/a&&br&&br&[31] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Tr_%28Unix%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Tr_...&i class=&icon-external&&&/i&&/a&&br&&br&[32] &a href=&///?target=http%3A//zookeeper.apache.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Apache ZooKeeper&i class=&icon-external&&&/i&&/a&&br&&br&[33] &a href=&///?target=http%3A//hive.apache.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Apache Hive TM&i class=&icon-external&&&/i&&/a&&br&&br&[34] &a href=&///?target=http%3A///external_content/untrusted_dlcp//en/us/papers/mapreduce-osdi04.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://static.googleusercontent....&i class=&icon-external&&&/i&&/a&&br&&br&[35]&a href=&///?target=http%3A///external_content/untrusted_dlcp//en/us/papers/gfs-sosp2003.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://static.googleusercontent....&i class=&icon-external&&&/i&&/a&&br&&br&[36]&a href=&///?target=http%3A///external_content/untrusted_dlcp//en/us/papers/bigtable-osdi06.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://static.googleusercontent....&i class=&icon-external&&&/i&&/a&&br&&br&[37]&a href=&///?target=http%3A///external_content/untrusted_dlcp//en/us/pubs/archive/35179.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://static.googleusercontent....&i class=&icon-external&&&/i&&/a&&br&&br&[38] &a href=&///?target=http%3A//www.ics.uci.edu/%7Ewelling/teaching/273ASpring10/IntroMLBook.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.ics.uci.edu/~welling/...&i class=&icon-external&&&/i&&/a&&br&&br&[39] &a href=&///?target=http%3A//www.stanford.edu/%7Ehastie/local.ftp/Springer/OLD//ESLII_print4.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.stanford.edu/~hastie/...&i class=&icon-external&&&/i&&/a&&br&&br&[40] &a href=&///?target=http%3A//infolab.stanford.edu/%7Eullman/mmds.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://infolab.stanford.edu/~ull...&i class=&icon-external&&&/i&&/a&&br&&br&[41] &a href=&///?target=https%3A///josephmisiti/machine-learning-module& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&/josephmisiti/...&i class=&icon-external&&&/i&&/a&&br&&br&[42] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Wavelet& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Wav...&i class=&icon-external&&&/i&&/a&&br&&br&[43] &a href=&///?target=http%3A//www.shearlet.uni-osnabrueck.de/papers/Smrus.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.shearlet.uni-osnabrue...&i class=&icon-external&&&/i&&/a&&br&&br&[44] &a href=&///?target=http%3A//math.mit.edu/icg/papers/FDCT.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://math.mit.edu/icg/papers/F...&i class=&icon-external&&&/i&&/a&&br&&br&[45] &a href=&///?target=http%3A//www.ifp.illinois.edu/%7Eminhdo/publications/contourlet.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.ifp.illinois.edu/~min...&i class=&icon-external&&&/i&&/a&&br&&br&[46] &a href=&///?target=http%3A//www.cmap.polytechnique.fr/%7Emallat/papiers/07-NumerAlgo-MallatPeyre-BandletsReview.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.cmap.polytechnique.fr...&i class=&icon-external&&&/i&&/a&&br&&br&[47 ]&a href=&///?target=http%3A//en.wikipedia.org/wiki/Time%25E2%frequency_analysis& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Tim...&i class=&icon-external&&&/i&&/a&&br&&br&[48] &a href=&///?target=http%3A//en.wikipedia.org/wiki/Fourier_analysis& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Fou...&i class=&icon-external&&&/i&&/a&&br&&br&[49 ]&a href=&///?target=http%3A//en.wikipedia.org/wiki/Convolution& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://en.wikipedia.org/wiki/Con...&i class=&icon-external&&&/i&&/a&
我要翻译一把quora了,再加点我的理解,我相信会是一个好答案,链接我都放到一起了,没插入到正文中,要求其实比较高了,我觉得我自己都差很远很远~~~我尽量持续更新翻译质量以及自己理解1. Python/C++/R/Java - you will probably want to learn all of th…
我个人的理解是数据分析只不过是传统BI的一个别称,主要面向非程序员的数据分析师,主要使用EXCEL和一些软件对于小数据进行分析。所需要掌握的技能一般是EXCEL,SQL以及一些软件。&br&&br&而数据挖掘是在大数据背景下,通过编程和算法,分布式系统以及一些专为大数据开发的技术对于海量数据进行分析。所需要掌握的技能应该是1-2种通用编程语言,数据结构和算法知识,概率统计和线性代数等数学知识,分布式计算知识(Hadoop,Spark等),数据可视化,SQL和NoSQL等技能。
我个人的理解是数据分析只不过是传统BI的一个别称,主要面向非程序员的数据分析师,主要使用EXCEL和一些软件对于小数据进行分析。所需要掌握的技能一般是EXCEL,SQL以及一些软件。而数据挖掘是在大数据背景下,通过编程和算法,分布式系统以及一些专为大数…
&p&您好,我是一名混迹天池,Kaggle和DataCastle的大数据业余爱好者(天池ID:快乐人生; 俗称:老王)。&/p&&p&对于这个问题,总体来讲,三个平台都有各自的特色吧。具体地,&/p&&p&1,从赛题本身来讲。&/p&&p&整体来讲,天池至今为止,上线的赛题提供丰富的业务场景,也就是,给你一些基础数据表且告诉你具体含义。而Kaggle和DataCastle上线的赛题不少直接给你一些匿名特征的样本。这导致,天池的赛题还需要你构建特征工程,然后才是其他后续工作。从数据量来讲,天池分离线赛数据和平台赛数据。就目前来看,天池的离线赛数据较Kaggle量小,也就是对参赛者的PC配置要求低一些,也有利于对数据的分析和理解。而天池平台赛的数据量就比较大了,一般情况下,比Kaggle和DataCastle的数据量会大一些。数据量大,某种意义上,也代表了比赛的公平性,可靠性。参加过比赛的人,尤其是天池比赛的人,都有一个体会,同一个算法的性能会受数据量的影响。&/p&&p&因此,对一些买不起(或不想买)高配置PC的选手来讲,天池这种方式相对来讲更适合。Kaggle数据量足够,但你PC可能玩不起来(虽然它也提供计算平台,但是你的代码需要PUBLIC。)。DataCastle数据量较小,公平性不能很好确保。&/p&&p&2,从赛制角度讲。&/p&&p&对每道赛题,天池分两个赛季,而Kaggle和DataCastle一般仅一个赛季(虽然3者都有数据更新一个环节)。就如第一条中说的,天池分两个赛季,目的是不同的,一赛季注重参赛者硬件上的公平性,二赛季注重赛题本身可靠性。另外,它们的线上评测方式不同,天池是每天定时统一评测一次,而另外两个是每天即时评测(限定每日最多评测次数)。各有利弊吧。定时评测,不一定符合一些人的作息,但能减小部分人的好处(一人多个账号)。即时评测方式,增加了人性化,但难免一人多号带来的不公平性。(PS:建议天池融合两者利弊,创新另一种评测方式,比如:二赛季时,每天即时评测一次。)&/p&&p&3,从激励角度讲。&/p&&p&平均来看,奖金数量,Kaggle(按汇率换算为人民币)最多,其次天池,然后DataCastle(和其他两个相差有点多)。 另外,天池的大部分赛题,每周有周星星激励(发礼品),比赛结束根据排名(有时也会搞一些活动)发放粮票(兑换礼品)。这一点目前Kaggle没有。DataCastle目前来看,至少还没有粮票激励。 另外,天池和Kaggle都有数据科学家的排行榜,而DataCastle目前还没有。这个排行榜根据参赛者的总积分来的(与参赛场数和每场的成绩(有时和队员数)有关),大体评价一个选手的整体实力吧。对未来发展,如工作方面,自然会有一些好处。&/p&&p&4,从参赛群体角度讲。&/p&&p&参赛群体,天池和DataCastle现在主要来自中国,而Kaggle很大部分是欧美等国家的选手。 整体上看,Kaggle选手的素质相对较高。自然地,目前来看,Kaggle冠军的含金量也相对较高。这可能和知名度和数据开放程度有关系吧(听说,国外选手比较喜欢数据开放)。当然,对新手或实力还未达到全球一流水平的参赛者,Kaggle就不一定那么好玩了。当然,从锻炼角度想,无论哪个平台上的赛题,都能得到一定程度的锻炼。就天池和DataCastle对比看,知名度,从玩家数量看,天池要高一些。冠军的含金量,天池也相对较高一些。&/p&&p&5,从计算资源角度讲。&/p&&p&严格来讲,这三个平台,天池是唯一算得上提供了计算平台的。体验过的人,我想都觉得速度杠杠的,尤其限制了每个队伍的计算资源后。没体验过的,有机会,去体验一把就知道了。当然,这个平台主要特色是:数据开发和算法开发。对数据开发,可以直接在平台上用HIVE SQL实现数据表操作代码,另外,如果有更丰富的逻辑需要实现还支持 UDF(User Defined Function)、MR(MapReduce)和Graph形式的线下实现,提交平台运行。从个人体验看,刚开始我比较讨厌平台赛,因为不会编写这些代码,也不会用。但是现在,会了之后,你又会有另外一番体验(这种体验类似于,你一直用MATLAB就喜欢它而不喜欢别的,一直用R,Python等等。)其实,换个角度思考,至少你特别想入职阿里巴巴,用习惯了这个平台,在面试时会给你加分吧。PS:个人感觉天池平台不难学习,尤其越来越多的手把手教程,关键是速度快。&/p&&p&PS:今年天池平台还推出了独特的新人赛(这是其他两个平台还没有的)。这个新人赛以经典赛题作为学习场景,提供详尽入门教程,手把手教你学习数据挖掘。天池希望新人赛能成为高校备受热捧的数据实战课程,帮助更多学生掌握数据技能。新人赛链接:&a href=&///?target=https%3A///getStart/index.htm%3Fspm%3D.1234.5.pldn10%26id& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Tianchi Big Data Competition-Competitions Focus on Data Algorithms&i class=&icon-external&&&/i&&/a&(新手不妨考虑从这里开始数据之旅)。 &/p&&p&祝好,HAVE FUN!!!&/p&
您好,我是一名混迹天池,Kaggle和DataCastle的大数据业余爱好者(天池ID:快乐人生; 俗称:老王)。对于这个问题,总体来讲,三个平台都有各自的特色吧。具体地,1,从赛题本身来讲。整体来讲,天池至今为止,上线的赛题提供丰富的业务场景,也就是,给你…
如果是新手的话,到没必要一上来就读论文。首先要对分布式系统的特点,尤其是它和单机系统的不同有个大致的了解。推荐看&br&&ul&&li&&a href=&///?target=http%3A//book.mixu.net/distsys/intro.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Distributed systems for fun and profit Chapter 1&i class=&icon-external&&&/i&&/a&&br&&/li&&li&&a href=&///?target=http%3A///Files/fallacies.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Fallacies of Distributed Computing
Explained&i class=&icon-external&&&/i&&/a&&/li&&li&&a href=&///?target=http%3A//citeseerx.ist.psu.edu/viewdoc/summary%3Fdoi%3D10.1.1.41.7628& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&A Note Distributed System&i class=&icon-external&&&/i&&/a&&/li&&/ul&上面几篇文章揭开了分布式系统的冰山一角,你对&i&faliure&/i&这个词的印象应该非常深刻,因为它差不多出现了好几百次。&br&&br&然后你可以花上几天,认真读一下 &a href=&///?target=http%3A//book.mixu.net/distsys/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Distributed systems for fun and profit&i class=&icon-external&&&/i&&/a& 。这本小书可读性很强,基本的东西也都覆盖差不多了。它比较好多一点是不纠结算法细节,重在梳理思路。当然它也给了reference,假如你需要的话。&br&&br&最后你可以看 &a href=&///?target=http%3A//the-paper-trail.org/blog/distributed-systems-theory-for-the-distributed-systems-engineer/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Distributed systems theory for the distributed systems engineer &i class=&icon-external&&&/i&&/a&。这篇文章除了把之前你已经看过的东西重新梳理的一边,同时也推荐了好多paper帮你更深入的了解。关于读paper,我觉得如果你没有很强的驱动力是很难啃下去的。要么工作中在用的某个系统,需要深入了解;要么自己在实现一个类似的系统。总之要综合实践才好继续深入。
如果是新手的话,到没必要一上来就读论文。首先要对分布式系统的特点,尤其是它和单机系统的不同有个大致的了解。推荐看上面几篇…
Hadoop居然成方向了………&br&擦咧&br&&br&你要说真的自成一个方向的话 &br&我觉得是软件系统,写一个这种系统级别架构,就有系统工程和软件工程的知识。&br&&br&背后支撑大数据的其实&br&分布式系统,这才是一个方向吧。&br&机器间如何交流这里涉及计算机网络,也是一个方向。&br&分布式算法也是一个方向: snapshot, wave, election, deadlock detection, termination detection, routing, etc. 分布式喔,不是单机,知道分布式的最短路径怎么玩吗,很有意思的?嘿嘿嘿&br&数据库也是一个方向吧,有基础数据库知识,再扩充到分布式版本。&br&&br&分布式的数据那么分散。&br&所以data visualization也是一个方向啊,而且绝逼好玩!个人觉得!&br&&br&大数据表面的那堆算法&br&其实是统计学,也是方向。&br&细分就是烂大街啦,机器学习,深度学习,数据挖掘,自然语言分析,文本挖掘。&br&&br&看深一些,表面都是肤浅的。&br&上面的基础知识搞定了,看哪种分布式架构或者算法都是有底且清晰的。&br&&br&Hadoop, HBase, Spark等只是实现了上面一堆问题的工具而已。&br&&br&别真的只有当码农的心。
Hadoop居然成方向了………擦咧你要说真的自成一个方向的话 我觉得是软件系统,写一个这种系统级别架构,就有系统工程和软件工程的知识。背后支撑大数据的其实分布式系统,这才是一个方向吧。机器间如何交流这里涉及计算机网络,也是一个方向。分布式算法也…
要学的太多,慢慢学吧&br&&br&&b&云计算&/b&&br&&img src=&/dcea811eacdf27a8e8b3792_b.png& data-rawwidth=&666& data-rawheight=&3284& class=&origin_image zh-lightbox-thumb& width=&666& data-original=&/dcea811eacdf27a8e8b3792_r.png&&&b&大数据&/b&&br&&img src=&/c8ff65d3af855ca49b0e77aa_b.png& data-rawwidth=&806& data-rawheight=&1565& class=&origin_image zh-lightbox-thumb& width=&806& data-original=&/c8ff65d3af855ca49b0e77aa_r.png&&
要学的太多,慢慢学吧云计算大数据
STL源码剖析偏 底 层。。&br&明明就是大致说明了STL中container的定义方法,一些算法的实现,哪来的底层!&br&好想知道你们老师对底层的定义是什么。。&br&&br&说下建议吧:&br&肖神说的没错,算导就是能看看,看不懂就跳。当然别乱跳,能大概看懂的就坚持看下去,当然斐波拉契堆这种玩意就可以稍微了解下然后跳了。&br&&br&接着可以考虑自己实现一个STL,看STL源码解析即可,每次实现一个container之前先自己查资料弄明白这货的所有接口,然后自己想办法实现一个,然后看STL源码解析里是怎么实现的。如果算法跟不上也可以先看书再实现。
STL源码剖析偏 底 层。。明明就是大致说明了STL中container的定义方法,一些算法的实现,哪来的底层!好想知道你们老师对底层的定义是什么。。说下建议吧:肖神说的没错,算导就是能看看,看不懂就跳。当然别乱跳,能大概看懂的就坚持看下去,当然斐波拉契…
大一学C++时的教材是Deitel的C++ How to Program第四版,后来看了C++ primer和Effective C++,C++ 标准程序库和C++ 编程思想都买了但还没开始看。&br&&br&下面是转载的在博客上看到的一个C++书籍阅读清单,可以参考下:&br&&strong&阶段
1&/strong&&br&&strong&《Essential
C++》&/strong&&br&这是一本内容不多但很实用的C++入门书籍,强调快速上手与理解C++编程。本书主要围绕一系列逐渐复杂的程序问题,以及用以解决这些问题的语言特性展开讲解。你不只学到C++的函数和结构,也会学习到它们的设计目的和基本原理。&br&&strong&《C++ Primer》&/strong&&br&本书对C++基本概念、技术、以及现代C++编程风格进行了全面而且权威的阐述,是C++初学者的最佳指南;本书可以帮助你编写实用的程序,而无需首先精通每个语言细节。对于中高级程序员,本书也是不可或缺的参考书。&br&&strong&阶段
2&/strong&&br&&strong&《Effective C++》和《More effective C++》&/strong&&br&作者是Scott
Meyers。你应该熟读它们,并清楚地理解每个项目。该书围绕55条准则,每一条都介绍了一个可让你写出更好的C++程序代码的方法,并以特别设计过的例子详加讨论。&br&&strong&《Exceptional
C++(C++编程剖析)》和《More exceptional
C++》&/strong&&br&这两本书中都包含了40个C++编程问题,这些问题会让你磨练自己的技能,最终成为优秀的C++程序员。这些问题是Herb
Sutter精心挑选,与ISO/ANSI C++官方标准相一致,帮助程序员在设计、架构和编码过程中保持良好的风格,从而使编写的C++软件更健壮、更高效。&br&&strong&阶段
3&/strong&&br&&strong&《Inside
the C++ object model(深度探索C++对象模型)》&/strong&&br&本书专注于C++面向对象程序设计的底层机制,包括结构式语意、临时性对象的生成、封装、继承,以及虚拟——虚拟函数和虚拟继承,帮助你理解程序的底层实现,以便写出更高效的代码。&br&&strong&《The
design and evolution of C++(C++语言的设计与演化)》&/strong&&br&本书作者也是C++语言的设计者Bjarne
Stroustrup,作者在书中综合性地介绍了C++的发展历史,C++中各种重要机制的本质意义和设计背景,这些机制的基本用途和使用方法,讨论了C++所适合的应用领域及其未来的发展前景,既没有忽略关键性的详情,又没有过多地陷入技术细节。&br&&strong&阶段
4&/strong&&br&&strong&《The
C++ standard library(C++标准程序库)》&/strong&&br&这是标准模板库字典,你可以在本书中找到STL相关的一切知识。本书焦点放在标准模板库、检查容器、迭代器、函数对象和STL算法上。每一个元素都有深刻的呈现,包括其介绍、设计、运用实例、细节解说、陷阱、意想不到的危险,以及相关类别和函数等。&br&&strong&《Effective
STL》&/strong&&br&这是Scott
Meyers的第三本C++专著,也是学习STL最权威的书籍。作者对书中的50个指导方针都作了详尽的分析,并配以示例。通过这些规则,C++开发者可以最大限度地使用STL。&br&&strong&《Generic
programming and the STL(泛型编程与STL)》&/strong&&br&本书阐述了泛型程序设计的核心理念:concepts(概念)、modeling(模型)和refinement(改善),并为你展示这些观念如何导出STL的基础概念:iterators(迭代器)、containers(容器)和function
objects(函数对象)。按照本书所述,你可以把STL想象成一个由concepts组成的library,你将学习到STL正式结构并理解其强大的优势。&br&&strong&阶段
5&/strong&&br&&strong&《Exceptional C++ style》&/strong&&br&作者为Herb
Sutter。本书同样提出了40个C++风格相关的问题,对一些至关重要的C++细节和相互关系提出了新的见解,为当今的关键C++编程技术(如泛型编程、STL、异常安全等)提供了新的策略,帮助开发者在开销与功能之间、优雅与可维护性之间、灵活性与过分灵活之间寻找完美的平衡点。&br&&strong&《C++
template》&/strong&&br&这是一本关于C++模板的完整的参考手册和教程,它强调模板的使用实践,包含了现实世界中的例子。每个C++程序员都应该好好读一读这本书。&br&&strong&《Modern
C++ design(现代C++设计)》&/strong&&br&作者Andrei
Alexandrescu为C++程序员打开了一个新的局面。本书提供了一些针对软件设计的前沿方法,如联合设计模式、泛型编程,使程序员可以编写有表现力的、灵活的、高度可重用的代码。&br&&strong&《Thinking
in C++(C++编程思想)》&/strong&&br&C++
领域权威著作,介绍了C++实用的编程技术和最佳的实践方法。
大一学C++时的教材是Deitel的C++ How to Program第四版,后来看了C++ primer和Effective C++,C++ 标准程序库和C++ 编程思想都买了但还没开始看。下面是转载的在博客上看到的一个C++书籍阅读清单,可以参考下:阶段 1《Essential C++》这是一本内容不多但很…
已有帐号?
无法登录?
社交帐号登录
282 人关注
506 人关注
8741 人关注
361 个回答
26663 人关注
347 个回答

我要回帖

更多关于 明年小本挣钱路子 的文章

 

随机推荐