R 和 python list用于统计学分析,哪个更好

2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位..
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
Python和R的区别
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口加载中,请稍候...
加载中,请稍候...
京 东 价:
¥60.40 [8.8折][定价:¥69.00]
温馨提示:
其它类似商品
正在加载中,请稍候...
正在加载中,请稍候...
正在加载中,请稍候...
清华管理学系列英文版教材:实用多元统计分析(第6版)
查找同类商品
  本书是学习掌握多元统计分析的各种模型和方法的一本有价值的参考书:首先,它做到了“浅入深出”,既可供初学者入门,又能使有较深基础的人受益;其次,它既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,又能在一定程度上了解“为什么”这样做;最后,它内涵丰富、全面,不仅基本包括各种在实际中常用的多元统计分析方法,而且对现代统计学的最新思想和进展有所介绍。值得一提的是,本书中有大量来自实际问题的数据实例,通过对这些实例的分析,读者可以学到如何将一个实际问题转化为恰当的统计问题,进而选择恰当的方法来进行分析。
  多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题。能否从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅需要对所研究的专业领域有很好的训练,而且要掌握必要的统计分析工具。  对研究者来说,本书是学习掌握多元统计分析的各种模型和方法的一本有价值的参考书:首先,它做到了“浅入深出”,既可供初学者入门,又能使有较深基础的人受益;其次,它既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,又能在一定程度上了解“为什么”
这样做;最后,它内涵丰富、全面,不仅基本包括各种在实际中常用的多元统计分析方法,而且对现代统计学的最新思想和进展有所介绍。值得一提的是,本书中有大量来自实际问题的数据实例,通过对这些实例的分析,读者可以学到如何将一个实际问题转化为恰当的统计问题,进而选择恰当的方法来进行分析。
多元分析概述1.1
多元方法的应用1.3
数据的组织1.4
数据的展示及图表示1.5
最终评注第2章
矩阵代数与随机向量2.1
矩阵和向量代数基础2.3
正定矩阵2.4
平方根矩阵2.5
随机向量和矩阵2.6
均值向量和协方差矩阵2.7
矩阵不等式和极大化补充2A
向量与矩阵:基本概念第3章
样本几何与随机抽样3.1
样本几何3.3
随机样本以及样本均值和协方差矩阵的期望值3.4
广义方差3.5
作为矩阵运算的样本均值、协方差与相关系数3.6
变量的线性组合的样本值第4章
多元正态分布4.1
多元正态密度及其性质4.3
从多元正态分布抽样与极大似然估计4.4
X和s的抽样分布4.5
X和S的大样本特性4.6
评估正态性假设4.7
搜寻离群值与“清洁”数据4.8
变换到接近正态性第5章
关于均值向量的推断5.1
U0作为正态总体均值的似真性5.3
霍特林r的平方与似然比检验5.4
置信域和均值分量的联合比较5.5
总体均值向量的大样本推断5.6
多元质量控制图5.7
观测值缺损时均值向量的推断5.8
多元观测中由时间相依性造成的困难补充5A
作为p维椭球投影的联合置信区间与置信椭圆第6章
多个多元均值向量的比较6.1
成对比较与重复测量设计6.3
两总体均值向量的比较6.4
多个多元总体均值向量的比较(单因子MANOVA)6.5
处理效应的联合置信区间6.6
协方差矩阵相等性的检验6.7
双因子多元方差分析6.8
轮廓分析6.9
重复测量设计和生长曲线6.10
对分析多元模型的透视和建议第7章
多元线性回归模型7.1
经典线性回归模型7.3
最小二乘估计7.4
回归模型的推断7.5
由估计的回归函数作推断7.6
模型检查及回归中的其他问题7.7
多元多重回归7.8
线性回归的概念7.9
比较回归模型的两种表述方式7.10
有时间相关误差的多重回归模型补充7A
多元多重回归模型的似然比的分布第8章
总体主成分8.3
综合主成分的样本变差8.4
主成分的图形表示8.5
大样本推断8.6
用主成分监控质量补充8A
样本主成分近似的几何意义第9章
因子分析与对协方差矩阵结构的推断9.1
正交因子模型9.3
估计方法9.4
因子旋转9.5
因子得分9.6
因子分析展望和建议补充9A
最大似然估计的某些计算细节第10章
典型相关分析10.1
典型变量和典型相关系数10.3
总体典型变量的解释10.4
样本典型变量和样本典型相关系数10.5
其他样本描述性度量10.6
大样本推断第11章
判别与分类11.1
两个总体的分离与分类11.3
两个多元正态总体的分类11.4
评估分类函数11.5
多个总体的分类11.6
对多个总体进行判别的费希尔方法11.7
Logistic回归与分类11.8
最后的评述第12章
聚类、距离方法与多维标度变换12.1
相似性量度12.3
分层聚类方法12.4
非分层聚类方法12.5
基于统计模型的聚类12.6
多维标度变换12.7
对应分析12.8
用于观察抽样单元和变量的双重信息图12.9
普罗克鲁斯特斯分析:一种比较点结构的方法附录数据索引主题索引
正在加载中,请稍候...
正在加载中,请稍候...
正在加载中,请稍候...
正在加载中,请稍候...
正在加载中,请稍候...
正在加载中,请稍候...
正在加载中,请稍候...
七日畅销榜
新书热卖榜R 和 Python 用于统计学分析,哪个更好_百度知道
R 和 Python 用于统计学分析,哪个更好
提问者采纳
不知道是不是因为大数据时代的到来,但你当然也可以用它们来分析服务器日志数据;Hive。之后一个项目要做方法比较。总的来说Python是一套比较平衡的语言;不定期的时间序列进行重采样等,还是正则表达和文字处理,默认颜色比较少,但是名字太长了~,pylot是准备好了以后一起出来,看网页非常卡~)2、对定期&#47,轻松地进行切片&#47,对系统的操作,用R几个小时也出不来,并不是没有道理的. 用python实现了一个统计方法;R不行,很多书里也都会提到这一点,现在完全不用又舍不得:Python=R+SQL&#47。因此。(但那个包还是很慢,以及比较复杂的数据挖掘算法。结合其在通用编程方面的强大实力,近年来。相比之下,数据处理。 而R是在统计方面比较突出,8G内存全部占满)。R的优势在于有包罗万象的统计函数可以调用,然后再保存为图片,只要是100M以上的数据,你可以高效处理非常大的时间序列。Python与R相比速度要快,各方面都可以。感觉还是很方便的,无论是经典还是前沿的方法都有相应的包直接使用。所以有人说;切块,类似数据库。做过几个实验。可能你已经猜到了,R是一条命令画点东西。pyplot 的legend比R 好用多了,数据抽样。pyplot的颜色选择有点尴尬,所以对于想要学以致用的人来说,也鲜有人能把单一语言挖掘运用到极致。但是,如果R矢量化编程做得好的话(有点小难度),Python都有着明显优势。Python可以直接处理上G的数据,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,Python之前在这方面贫乏不少,导致整个电脑使用不能,毕竟几十万行的条目了:1,因此R不可能直接分析行为详单,算是半自动化了,由于Python有不断改良的库(主要是pandas),R都很难胜任。pandas提供了一组标准的时间序列处理工具和数据算法,特别是在时间序列分析方面。但世上本没有最好的软件或程序,前期的数据收集. 用python pandas做了一些数据整理工作. 用python matplotlib画图,multiprocess,和数据源的连接,只能分析统计结果,一些底层用C写的算法封装在Python包里后性能非常高效(Python的数据挖掘包Orange canve 中的决策树分析50万用户10秒出结果,现在Python有了pandas,就更好不过了。3,使其成为数据处理任务的一大替代方案。于是,但是Python却基本胜任,发现一些bioconductor上的包已经默认用parallel了。Python的一个最明显的优势在于其胶水语言的特性,两三个表来回查,凡事都不绝对。但是,这点比R好用,但估计会慢点,数据建模等等这些任务。尤其是很多人早先学了R、读取,会使R的速度和程序的长度都有显著性提升,一下子把所有线程都用掉了、聚合,之后可用html的颜色。但是数据分析其实不仅仅是统计,数据聚类,这些工具中大部分都对金融和经济数据尤为有用,如果能把R和Python相结合,无论是对其他语言的调用,其中用到了ctypes,又用回R。虽然这些工作R也能做、匹配。pyplot画出来后可以自由拉升缩放。pyplot作图的方式和R差异很大,我们完全可以只使用Python这一种语言去构建以数据为中心的应用程序2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位
其他类似问题
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁| 时间排序
读过百G文件都没问题。&br&你确定下,你用的Python是不是64位版本的?
读过百G文件都没问题。你确定下,你用的Python是不是64位版本的?
怎么可能,python读过20+G到内存过。肯定代码有问题。
怎么可能,python读过20+G到内存过。肯定代码有问题。
当时遇到过,好像是python2.6的问题,python3可以,或者自己直接把接口改了吧
当时遇到过,好像是python2.6的问题,python3可以,或者自己直接把接口改了吧
代码也不贴,文本示例也没有,怎么答?&br&&br&以后可以先用 head 做一个几十行的小文件,确定自己处理起来没问题了,再处理大文件
代码也不贴,文本示例也没有,怎么答?以后可以先用 head 做一个几十行的小文件,确定自己处理起来没问题了,再处理大文件
这种情况怎么能不用pandas呢? numpy的genfromtxt基本上是残废.&br&pandas非常好,我今天刚读了一个200M+的txt数据,几秒钟吧.&br&你可以先把数据gzip了,pandas支持直接读压缩数据的.
这种情况怎么能不用pandas呢? numpy的genfromtxt基本上是残废.pandas非常好,我今天刚读了一个200M+的txt数据,几秒钟吧.你可以先把数据gzip了,pandas支持直接读压缩数据的.
作为一个开发人员,个人还是觉得Python更适合,欢迎加入pandas数据分析的交流群:
作为一个开发人员,个人还是觉得Python更适合,欢迎加入pandas数据分析的交流群:
python科学计算不错,有电子版哦
python科学计算不错,有电子版哦
其实可以一起用 &a href=&/posts/python-%E9%80%9A%E8%BF%87rpy2%E8%B0%83%E7%94%A8-r%E8%AF%AD%E8%A8%80/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python 通过rpy2调用 R语言&i class=&icon-external&&&/i&&/a&
其实可以一起用
泻药,本人学习python是为了做计算,numpy和scipy是基础。&br&学习这两个库的最好的书个人觉得是官方文档了&a href=&http://www.scipy.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&SciPy.org — SciPy.org&i class=&icon-external&&&/i&&/a&,可以使用ipython方便查看文档。&br&&br&如果是书籍的话,推荐&a href=&/subject/7175280/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python科学计算 (豆瓣)&i class=&icon-external&&&/i&&/a&,&a href=&http://sebug.net/paper/books/scipydoc/#& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&用Python做科学计算&i class=&icon-external&&&/i&&/a&,这本书写的比较多,前几章讲了一些numpy,scipy,sympy,matplotlib等用法,其中可能是专业相关原因书里信号处理的部分比较多。可以看一遍学习一下库基础的以及自己要用到哪些函数, 哪些库, 然后再去查阅相关的文档.&br&&a href=&http://emuch.net/html/1225.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&学了一段时间Python用于科学计算的感想&i class=&icon-external&&&/i&&/a&&br&&br&还有一本&a href=&/subject//& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&利用Python进行数据分析 (豆瓣)&i class=&icon-external&&&/i&&/a&,这本应该更针对数据分析,numpy,pandas,matplotlib等。&br&根据需要自己选择学习就好了,应该说是共同学习
泻药,本人学习python是为了做计算,numpy和scipy是基础。学习这两个库的最好的书个人觉得是官方文档了,可以使用ipython方便查看文档。如果是书籍的话,推荐,,这本书写的比较多,前几章讲…
&p&&a data-hash=&d1a12b3a26a0a4ce7180& href=&/people/d1a12b3a26a0a4ce7180& class=&member_mention& data-editable=&true& data-title=&@周则禹& data-tip=&p$b$d1a12b3a26a0a4ce7180&&@周则禹&/a&
Python for Data Analysis 这本书,我之前就靠这本书入门,原先是用 R 做统计分析,为了工程实现,才开始使用 python ,主要技术栈是 numpy,scipy,panda,ipython notebook!讲的比较易懂好上手,挺适合入门的!见下面封面!&br&&/p&&br&&br&这里有个线上版本 readthedocs 可以看一下&br&&a href=&http://pda.readthedocs.org/en/latest/index.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Welcome to Python For Data Analysis’s documentation!&i class=&icon-external&&&/i&&/a&&br&&br&推荐个ML的库,最近稍微研究了下&br&&a href=&http://scikit-learn.org/stable/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&scikit-learn: machine learning in Python&i class=&icon-external&&&/i&&/a&&br&&br&不过,推荐一些还可以的博客(有时间再整理):&br&&br&&p&&b&Introduction to Python for Statistical Learning&/b&&/p&&br&&a href=&/blog/introduction-to-python-for-statistical-learning/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/blog/intr&/span&&span class=&invisible&&oduction-to-python-for-statistical-learning/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&&p&&b&Up and Down the Python Data and Web Visualization Stack&/b&&/p&&br&&a href=&http://nbviewer.ipython.org/gist/wrobstory/1eb8cb704a52d18b9ee8/Up%20and%20Down%20PyData%202014.ipynb& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&nbviewer.ipython.org/gi&/span&&span class=&invisible&&st/wrobstory/1eb8cb704a52d18b9ee8/Up%20and%20Down%20PyData%202014.ipynb&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&Python - Toolz - 流式分析(Streaming Analytics)工具&br&&a href=&http://n3xtchen.github.io/n3xtchen/python//python---toolz/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python - Toolz&i class=&icon-external&&&/i&&/a&&br&&img data-rawheight=&960& data-rawwidth=&640& src=&/5e4a3e7e1f1f_b.jpg& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&/5e4a3e7e1f1f_r.jpg&&
推荐的 Python for Data Analysis 这本书,我之前就靠这本书入门,原先是用 R 做统计分析,为了工程实现,才开始使用 python ,主要技术栈是 numpy,scipy,panda,ipython notebook!讲的比较易懂好上手,挺适合入门的!见下面封面!这里有个线上…
个人发现最有用的是cookbook:&a href=&http://wiki.scipy.org/Cookbook& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Cookbook -&i class=&icon-external&&&/i&&/a&&br&其实档案写得都不错,直接上手用没什么问题,无非就是开始慢点,多用用就熟练了。&br&&br&还有本书,感觉不错,没仔细看。&br&python for data analysis by Wes McKinney。
个人发现最有用的是cookbook:其实档案写得都不错,直接上手用没什么问题,无非就是开始慢点,多用用就熟练了。还有本书,感觉不错,没仔细看。python for data analysis by Wes McKinney。
单从统计分析来看,以前R更优,但自从Python有了Pandas,有了statsmod等包后,两者在基本统计上相差不大,但如果牵扯到数据处理、清洗方面,Python更灵活,两者在互相学习进步,认真学好一个后,切换很方便,不值得纠结。
单从统计分析来看,以前R更优,但自从Python有了Pandas,有了statsmod等包后,两者在基本统计上相差不大,但如果牵扯到数据处理、清洗方面,Python更灵活,两者在互相学习进步,认真学好一个后,切换很方便,不值得纠结。
好吧,看来我还是自问自答了。&br&我用的是SymPy0.7.5版本 &a href=&http://live.sympy.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&SymPy Live&i class=&icon-external&&&/i&&/a&上面的SymPy 版本是SymPy 0.7.4.1 (Python 2.7.5),应该是版本问题。但是给Symbol r添加假设条件后便可以得到正确的积分值了。&br&&img src=&/91d51d3f0931866dac0cdb177f63ebab_b.jpg& data-rawwidth=&407& data-rawheight=&198& class=&content_image& width=&407&&&br&&br&&br&然后,在stackoverflow上面就有了下面这截图&br&&img src=&/bba0e8cafefdc_b.jpg& data-rawheight=&687& data-rawwidth=&768& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/bba0e8cafefdc_r.jpg&&_:(??`」 ∠):_
好吧,看来我还是自问自答了。我用的是SymPy0.7.5版本 上面的SymPy 版本是SymPy 0.7.4.1 (Python 2.7.5),应该是版本问题。但是给Symbol r添加假设条件后便可以得到正确的积分值了。然后,在stackoverflow上面就有了下面这截图_:(??`」 ∠):_
其实是楼上的思路。。。&br&&br&比如说二维数组,内存里面按列主序和行主序分别放两份数据,按列访问时读取列主序,按行访问时读取列主序。。这样似乎可以推到高维的情况。&br&&br&这样来做的话,修改数组的一个元素就需要更多的操作了,不过楼主只问了读取的情况。
其实是楼上的思路。。。比如说二维数组,内存里面按列主序和行主序分别放两份数据,按列访问时读取列主序,按行访问时读取列主序。。这样似乎可以推到高维的情况。这样来做的话,修改数组的一个元素就需要更多的操作了,不过楼主只问了读取的情况。
这问题可以不严格地转化为:给定二维及更高维的栅格,能不能把一根绳子放置在里面,令绳子通过每个栅格仅一次,而又能另绳子通过每对相邻的栅格。显然答案是不可以。&br&&br&但是有一些方法,可能会令相邻栅格的绳子距离平均一些,例如&br&&br&1. Tiling,常用于矩阵乘法,可增加locality,改善cache coherence。&br&&br&2. &a href=&http://en.wikipedia.org/wiki/Z-order_curve& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Z-order curve&i class=&icon-external&&&/i&&/a& (又作Morton order),广泛应用在GPU的纹理存储上(有时称为texture swizzling),提高locality。&br&&img src=&/c8d19da3c8a1cc276c0e9e_b.jpg& data-rawwidth=&542& data-rawheight=&542& class=&origin_image zh-lightbox-thumb& width=&542& data-original=&/c8d19da3c8a1cc276c0e9e_r.jpg&&&br&3. &a href=&http://en.wikipedia.org/wiki/Hilbert_curve& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Hilbert curve&i class=&icon-external&&&/i&&/a&&br&&img src=&/38cabcfb45a1_b.jpg& data-rawwidth=&1280& data-rawheight=&855& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&/38cabcfb45a1_r.jpg&&
这问题可以不严格地转化为:给定二维及更高维的栅格,能不能把一根绳子放置在里面,令绳子通过每个栅格仅一次,而又能另绳子通过每对相邻的栅格。显然答案是不可以。但是有一些方法,可能会令相邻栅格的绳子距离平均一些,例如1. Tiling,常用于矩阵乘法,…
你是说,要访问一个矩阵的某一&b&行向量&/b&或&b&列向量&/b&吗?&br&Matlab里有这两个表达式。&br&别的语言里,再不济,可以自己写这两个函数实现之。&br&&br&还有两个奇怪的思路:&br&1.转置矩阵,然后把行当作列来访问。&br&2.&b&康托尔配对函数&/b&。/*个人觉得这个是无敌的*/
你是说,要访问一个矩阵的某一行向量或列向量吗?Matlab里有这两个表达式。别的语言里,再不济,可以自己写这两个函数实现之。还有两个奇怪的思路:1.转置矩阵,然后把行当作列来访问。2.康托尔配对函数。/*个人觉得这个是无敌的*/
如果地址分段设计,比如一个完整的地址是a|b,对于行而言,ab是连续地址,对于列,a值域可视为连续。貌似二维是有可能构造寻址算法。是否可以推广至高维情况,貌似有设计空间,但可能会浪费一些内存。&br&&br&可能与题主初衷有出入。
如果地址分段设计,比如一个完整的地址是a|b,对于行而言,ab是连续地址,对于列,a值域可视为连续。貌似二维是有可能构造寻址算法。是否可以推广至高维情况,貌似有设计空间,但可能会浪费一些内存。可能与题主初衷有出入。
&p&【请问有没有办法可以实现“无论按照行或列访问都能得到连续内存地址&呢?&br&】没有&/p&&br&&p&【推广到高维,这个需求就是按照任意维度访问都得到连续内存地址,可以吗?】不可以,除非内存和cpu的cache的维度不低于你的数组的维度(主要是cache的算法,跟硬件关系不大)&/p&&br&&p&【如果不可以,请问在matlab或者numpy里面类似的操作是怎么实现的?】他们是不连续的,只是给你创建了一个view,并不一定都返回一个数组的指针。&/p&
【请问有没有办法可以实现“无论按照行或列访问都能得到连续内存地址"呢?】没有【推广到高维,这个需求就是按照任意维度访问都得到连续内存地址,可以吗?】不可以,除非内存和cpu的cache的维度不低于你的数组的维度(主要是cache的算法,跟硬件关系不大)【如…

我要回帖

更多关于 python基础教程 的文章

 

随机推荐