威海市 大数据大数据培训一般多少钱?

【世界读书日墙裂推荐】在数据分析、挖掘方面,有哪些好书值得推荐?(下篇)
作者:Demonhunter
来源:知乎
转载自大数据应用的好朋友D神,已作者获得授权。
第二部分:其他技能(Some Other Skills)
这一部分推荐的书,是为那些想成为数据科学家中的超级赛亚人的同学所准备的23333
15. 神经网络与深度学习(Neural Network and Deep Learning)
Make Your Own Neural Network
深度学习炒得火热,但是在认真学习Deep Learning之前,各位巨巨们真的不先尝试下推推公式,然后Python从头自己造一个玩具神经网络玩一玩吗,真的很好玩的!
Deep Learning
这个还有介绍的必要吗(望天)
Deep Learning
Hands-On Machine Learning with Scikit-Learn and TensorFlow
我觉得对于DS老司机们来说,这本书的Sklearn部分可以无视,重点放在后半部分怎么用
TensorFlow玩深度学习。
16. 信息论(Information Theory)
关于信息论在数据科学上的重要性,可以看看这篇文章:
Data Science and Information Theory
Information Theory: A Tutorial Introduction
Information, Entropy, Life and the Universe: What We Know and What We Do Not Know
17. 因果推断(Causal Inference)
关于因果分析的重要性可以看看这个slides:
http://cds.nyu.edu/wp-content/uploads/2014/04/causal-and-data-science-and-BART.pdf
Causal Inference in Statistics: A Primer
Field Experiments: Design, Analysis, and Interpretation
18. 抽样(Sampling)
19. 凸优化(Convex)
Convex Optimization
斯坦福的凸优化,课程在这里:
Convex Optimization
另外这本书的网站给出了免费电子书:
Convex Optimization - Boyd and Vandenberghe
20. 增长分析(Growth Analytics)
Lean Analytics: Use Data to Build a Better Startup Faster (Lean Series)
Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity
21. 文本挖掘与自然语言处理(Text Mining And Natural Language Processing)
Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit
Python NLTK的官方指南,有在线版:
Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data
Introduction to Information Retrieval
斯坦福的信息萃取,有在线电子版
Introduction to Information Retrieval
吴军老师的数学之美。
22. 异常检测(Anomaly Detection)
Fraud Analytics Using Deive, Predictive, and Social Network Techniques: A Guide to Data Science for Fraud Detection
这本书我正在读,不难读,作为Fraud Detection的概述讲得还是挺细的。
Outlier Analysis
23. 推荐系统 (Recommender Systems)
Statistical Methods for Recommender Systems
Recommender Systems: The Textbook
24. 社交网络分析 (Social network analysis)
Network Science
大牛Barabási 今年的力作,关于网络科学的简介。有在线版本,里面的图漂亮得我是跪下了。
Network Science by Albert-László Barabási
Social and Economic Networks
斯坦福教授Matthew O. Jackson的书,在coursera上有这本书的公开课。
Social and Economic Networks: Models and Analysis - Stanford University | Coursera
Social Network Analysis for Startups: Finding connections on the social web
一本用Python做社交网络分析的书。
25. 时间序列预报(Time Series Analysis and Forecasting)
现在很多时间序列的书,重点放在描述时间序列上,所以会大量介绍ARMA和ARIMA。但是我这里想着重强调的是预报(Forecasting)。这里面有一套方法,个人感觉很少被传统统计系的时间序列课程介绍。
Practical Time Series Forecasting with R: A Hands-On Guide
Forecasting: principles and practice
这本书也是有在线版本的,和上面那本书互补。
Forecasting: principles and practice
26. 强化学习与人工智能
Reinforcement Learning: An Introduction
强化学习入门书,有在线版
http://people.inf.elte.hu/lorincz/Files/RL_2006/SuttonBook.pdf
Artificial Intelligence: A Modern Approach
Google的大佬,研究总监Peter Norvig的书
-----------------------分割线-------------------------
第三部分:休闲读物(Casual Reading)
这部分介绍的书,躺在床上看看很不错。
Soft Skills: The software developer's life manual
同软件工程师一样,数据科学家只会写代码和建模是远远不够的。软实力非常非常重要。
The Healthy Programmer: Get Fit, Feel Better, and Keep Coding
身体是革命的本钱,身体搞垮了怎么继续用数据科学改变世界呢?另外数据科学家其实和人打交道的机会通常来说要远远多于软件工程师,在这个看脸看身材的时代,你懂的。
Exposing the Magic of Design
有一个Design Mindset对数据科学家是很加分的哦 :)
Thinking, Fast and Slow
这本书被大V邹昕推荐过。
Naked Statistics: Stripping the Dread from the Data
可能是你读过最好玩的统计学读物。
Uncertainty: The Soul of Modeling, Probability & Statistics
一本在哲学层面上思考数据科学的书。
---------------------------------
大概先到这里吧,豆瓣link什么的之后再慢慢补。
最后祝大家世界读书日快乐,比心~~~
编辑:Miya_DHR
TECHNICAL WRITER/翻译志愿者
深度讨论数据应用
调研行业发展
对数据应用极为感兴趣
具备数据分析基础
具有一定BUSINESS INSIGHT
写作能力强
感兴趣的同学发送简历及writing sample到,邮件标题“申请翻译/Technical Writer”。
往期文章内容
书单 | 八位跨领域大咖荐书,愿你有精神食粮为伴,永远是少年
哪些必备因素造就了一名优秀数据科学家?
BI要死了吗?
大八卦:Cloudera血淋淋的上市路
Business Analyst 在美国IT界的就业分析
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。入门读物:
(豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。
通过案例来说事情,而且是最经典的例子。难易程度:非常易。
一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。
这本书非常棒啦,入门读起来很不错!&
数据分析:
这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。&
作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强!
很好玩的书,作者的角度很不同。
适合入门的教程:
学习数据分析、、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。难易程度:中。
用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博:王斌_ICTIR)已经翻译这本书了 。这本书本身质量就很高,王老师的翻译质量也很高。难易程度:中。我带的研究生入门必看数目之一!
虽然是英文的,但是由于写得很简单,比较理解,又有 Python 代码跟着,辅助理解。
最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。难易程度:中上。
也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。
稍微专业些的:
半监督学习必读必看的书。
微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!
李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。
这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。
这个是Jordan老爷子和他的得意门徒
在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。
NLP 经典,其实主要是讲 NLTK 这个包,但是啊,NLTK 这个包几乎涵盖了 NLP 的很多内容了啊!
机器学习教材:
这本书有对应的中文版:。书中配有R包,非常赞!可以参照着代码学习算法。
李航老师的扛鼎之作,强烈推荐。难易程度:难。
去年出版的新书,作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。
这书和上面的书不是一本!这书叫:Machine Learning: An Algorithmic Perspective 之前做过我带的研究生教材,由于配有代码,所以理解起来比较容易。
经典中的经典。
看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。
鸿篇巨制,这书谁要是读完了告诉我一声。
凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。
《Doing Data Science: Straight Talk from the Frontline》:
作者之一Rachel Schutt本科在密歇根大学学习数学,同时拥有纽约大学数学硕士学位,以及斯坦福大学工程经济系统和运筹学双硕士学位,美国哥伦比亚大学统计学博士学位,而后在谷歌研究所担任统计学专家。Johnson研究实验室的高级科学家兼创始人之一,目前在哥伦比亚大学讲授&数据科学导论&(Introduction to Data Science)课程。她提出了数据科学家的概念即&计算机科学家、软件工程师和统计学家的混合体。&另一位作者Cathy O&Neil是哈佛大学数学博士,麻省理工学院数学系博士后,目前在华尔街的德劭基金(D.E.Shaw)做quant。(总之是两个大牛XD)
本书前面几个章节大致介绍了数据分析法、一些机器学习算法、线性回归和逻辑回归、朴素贝叶斯等等。其中有一些内容需要一些数学基础才能吃透。 第六到十章节是本书的精华,详细介绍了如何利用金融及社交网络中的数据进行数据建模分析,值得反复回味。
《Agile Data Science: Building Data Analytics Applications with Hadoop》:
本书适合刚入行的数据爱好者以及有两三年工作经验数据科学家,作者立志打造一个full-stack解决方案(包括开发框架、运行环境等,有了它无需再下载别的软件)来减少前期在数据准备上必须花费的大量时间。此外书中的一些例子放在了GitHub上,建议一边看书一边DIY。
《Fast Data Processing with Spark》:
目前市面上关于Spark的书籍不多,这本120多页的薄书可以当做预热。Spark同Hadoop一样是基于Mapreduce算法实现的分布式计算,不同的是任务的中间输出结果可以保存在内存中无需读写HDFS,所以更加适合需要进行反复迭代的机器学习算法实验。作者Holden Karau曾在亚马逊数据挖掘项目组,目前是一名在谷歌工作的软件研发工程师。
《New Internet:大数据挖掘》 && 是MS的一位资深专家写的,从算法到工具,再到DM在日志分析、营销邮件、电商、移动等业务中的实际应用,内容有较全面的介绍,语言浅显易懂,作DM领域进门读物很不错。并且在每章节后都有提供本章提到的工具或数据来源,方便学习。
《数据挖掘与数据化运营实战:思路、方法、技巧与应用》&& 这是ALi的一位数据专家写的,从书名能看出这本偏运营实践,里面有很多电商方面的实践案例。当然也有几章节概述DM工具和算法,作为入门介绍。
1、 其实EXCEL在工作中还是大杀器,原因是易传承,好传播
2、 统计学肯定要了解,统计学书都可以的
3、 SPSS的内容,我是从这本书开始看的,因为这本书每个方法都有案例,可以直接看案例明白理论的作用,再加上 SPSS官方说明文档 基本上就够了
4、 ali的专家写的,看了这本书能理解很多方法的适用场景,适用场景和数据解读能力对于业务能力要求很高。
《数据仓库工具箱:维度建模的完全指南》
《Microsoft数据仓库工具箱》
《SQL Server 2008 分析服务从入门到精通》
《SQL Server 2008 报表服务从入门到精通》
另外,推荐以下链接:
本文转自链接: 进行了重新整理
阅读(...) 评论()2007人阅读
生活经验(6)
入门读物:
&这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。
&通过案例来说事情,而且是最经典的例子。难易程度:非常易。
&一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。
&这本书非常棒啦,入门读起来很不错!
数据分析:
&这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。
&作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强!
&很好玩的书,作者的角度很不同。
适合入门的教程:
&学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。难易程度:中。
&用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: 王斌_ICTIR)已经翻译这本书了&。这本书本身质量就很高,王老师的翻译质量也很高。难易程度:中。我带的研究生入门必看数目之一!
&虽然是英文的,但是由于写得很简单,比较理解,又有 Python 代码跟着,辅助理解。
&最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。难易程度:中上。
&也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。
稍微专业些的:
&半监督学习必读必看的书。
&微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!
&李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。
&这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。
&这个是Jordan老爷子和他的得意门徒&&在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。
&NLP 经典,其实主要是讲 NLTK 这个包,但是啊,NLTK 这个包几乎涵盖了 NLP 的很多内容了啊!
机器学习教材:
&这本书有对应的中文版:。书中配有R包,非常赞!可以参照着代码学习算法。
&李航老师的扛鼎之作,强烈推荐。难易程度:难。
&去年出版的新书,作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。
&这书和上面的书不是一本!这书叫:Machine Learning: An Algorithmic Perspective 之前做过我带的研究生教材,由于配有代码,所以理解起来比较容易。
&经典中的经典。
&看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。
&鸿篇巨制,这书谁要是读完了告诉我一声。
&凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:115586次
积分:1849
积分:1849
排名:千里之外
原创:58篇
转载:47篇
(3)(9)(1)(1)(2)(1)(6)(3)(2)(1)(5)(2)(3)(2)(12)(18)(6)(10)(7)(9)(1)(3)这篇博客主要总结一下数据挖掘、数据分析领域相关书籍,主要参考了知乎上的问题。
首先推荐周志华写的机器学习。我最近也在读这本书,优点是适合入门,知识大而全,缺点是每个知识点介绍的不深入(这也没办法,要是面面俱到,一本书根本写不完)。
深入浅出数据分析。这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。
啤酒与尿布。通过案例来说事情,而且是最经典的例子。难易程度:非常易。
数据之美。一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。
数学之美。吴军博士写的,作为科普读物还不错。
SciPy and NumPy。numpy和scipy很好很强大
Python for Data Analysis。
Bad Data Handbook。
数据挖掘入门书籍
集体智慧编程。经典书籍,入门必读。
机器学习实战。理论很好,代码质量一般般。优点是让你看看如何实现这些算法,缺点是书中的代码几乎用不上。
数据挖掘导论。研究生期间的教材,通俗易懂,习题很赞。
Machine Learning for Hackers。算法用R实现。
Introduction to Semi-Supervised Learning
Learning to Rank for Information Retrieval
Learning to Rank for Information Retrieval and Natural Language Processing
推荐系统实践。推荐系统入门首选
Natural Language Processing with Python。NLP 经典,其实主要是讲NLTK包
The Elements of Statistical Learning。很难,啃完不容易。
统计学习方法。李航老师的扛鼎之作,强烈推荐。
Machine Learning。作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。
Pattern Recognition And Machine Learning。PRML地位不解释。
Bayesian Reasoning and Machine Learning。Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。
Probabilistic Graphical Models。非常非常难。
Convex Optimization (豆瓣) 凸优化中最好的教材,没有之一了。
Learning from data。林轩田老师作品。
写在后面,看了肖博士的答案,确实比其他答案好不少,专业且全面,而且有针对性。除了书籍,后续我会补充一些公开课资源。
阅读(...) 评论()

我要回帖

更多关于 威海的海洋资源数据 的文章

 

随机推荐