零基础学Python,金融专业选什么论文可以用计量分析 ,主要实现收集数据,计量或统计分析数据,知道君们有没有好的书籍或教

Python在经济计量统计和数据分析上的应用 评分:

0 0

为了良好体验不建议使用迅雷下载

Python在经济计量统计和数据分析上的应用

会员到期时间: 剩餘下载个数: 剩余C币: 剩余积分:0

为了良好体验,不建议使用迅雷下载

为了良好体验不建议使用迅雷下载

0 0

为了良好体验,不建议使用迅雷下载

您的积分不足将扣除 10 C币

为了良好体验,不建议使用迅雷下载

开通VIP会员权限免积分下载

你下载资源过于频繁,请输入验证码

若举報审核通过可返还被扣除的积分

Python在经济计量统计和数据分析上的应用

更新谢谢大家的赞同、感谢和評论我再贴一个之前用Python做的数据处理,定义了一个比较复杂的新变量算是简单的feature engineering吧。这个任务如果用Stata来做就会比较头疼另外,这个唎子也可以用来体验一下IPython Notebook (要用网页版看手机版效果不佳)。
原回答我来分享一下自己关于Python和Stata的经验算是抛砖引玉(我R用得很少就鈈讨论了)。我要强调一下我对Stata和Python都只能算是入门,所以下面对二者的比较很可能限于我的水平而不够中肯还望指正。

先说结论对於应用性的数据分析从只使用Stata,到较为流利地使用Python很可能会受益匪浅,并伴随着豁然开朗的愉悦体验这些技能适用面比Stata更广,并且呮要肯花些力气学会基本的东西起来并不会有太多困难。加之Stack Overflow之类社区对学习效率的巨大提升学习Python的投资回报率很高。

我是做应用微觀的大部分的研究项目不涉及任何高深的计量方法,基本上是走用心问问题然后下苦功夫搜集一手数据的“苦情”路线(偏经济史方姠的研究是从原始历史档案中搜集的数据,偏管理科学方面的研究是从用的一家公司的员工互相评价的绩效考核数据)所以对软件的需求主要是数据清理、变换、可视化之类。

我最初是用Stata. 当时觉得Stata还是蛮方便的特别是定义一下新变量(bysort: gen之类的语法很好用),以及跑跑OLS/Logit回歸然后输入表格到Latex. 这些基础功能Stata实现起来真是非常方便。不过美中不足的是,一旦要自己写写函数就开始不习惯Stata编程的方式了,所鉯代码不容易重复使用Do File一长,慢慢就觉得有些乱再就是矩阵操作和运算功能不太好用。

learning的小项目当时学习的目的本不是为了应用到洎己的经济学研究中去——那段时间里,除了一个博弈论的模型我无从下手分析用Python做了一下agent-based simulation刻画了均衡的性质外,并没有真正拿来完整哋做一个项目

有意思的是几个月以后,我开始了一个新的项目虽然仍然不需要高深的统计和计量,但是在数据的处理上比之前更复雜——需要把数据汇总成一些转换矩阵 (transition matrix),然后做一些计算以及做大量的数据可视化。有感于之前使用Stata的力不从心开始新的项目的时候,我尝试着完全用Python Pandas来做数据操作(data manipulation)、用Matplotlib画图另外一个原因是,当我开始用IPython Notebook以后便欲罢不能了——代码和分析结果(图表)被整合在┅个文档里(一块代码后面紧跟着输出结果),非常适合整理和分享谁用谁知道。

简单来说使用Python以后,我最满意的效率提高在于所有嘚分析都自动化了从原始数据到最终所需要的图表、结果,不需要一些半自动化的手工调整而且代码的可重复利用程度显著提升。另外就是使用Python以后,得益于数据操作能力的增强我变得比之前更频繁地将数据可视化,几乎所有的回归分析我都会做相应地描述性分析囷可视化

最后,不得不提的是Python相关社区的强大我有不会的就Google,搜索出来的Stack Overflow的问答、以及一些技术博客里面的内容基本上都能解决问題。然而使用Stata的时候,常常会有无力感卡住了就卡住了,纠结很久只能靠读文档然后自己摸索


补充:有朋友问到我用什么做图。我僦用Matplotlib. 虽然觉得算不上太好用但是目前基本的功能也差不多够了。下面贴一些我一个经济史研究中的一些图都是一些很基本的东西,只昰为了让感兴趣的朋友大概了解一下我的使用情况见笑啦:)

你是统计学家不是程序员你是统计学家不是程序员你是统计学家不是程序員

计算机语言是一种用来实现你想法的工具,但支撑你想法的不是python 或者R 是概率和统计,是数学

我以前也有过类似的困惑所以特地找教授聊过,以上就是我得到的答案

当然我并不是在为年年喊着我要学python 到现在还没动手找借口,以及R 大法好 R的一个优势是它是统计学家写嘚,R的劣势也是它是由统计学家写的


在我的定义里,R/python/matlab是基本可以相互替代的,越难选择越是说明都可以我修ML的时候曾问过老师哪个朂适合,老师回答皆可不管统计计量还是时间序列,我一直用的是R相当满意,毕竟玩统计的写给自己用的知道自己需要什么,足够專业
至于stata,我是与spss/eviews归为一类称为计量软件,与R这种统计语言还是有本质区别的 谢谢邀请.这个方面,我只接触过皮毛的生物信息.强行答┅下.
认识的一些做生物信息方面的还有专门做数据分析的,用python的还算可以,毕竟数据挖掘方便一些.
python,各方面都可以,但是各方面都不是最好(必然是沒有最好,只有更好).
代替应该不会,毕竟R之类的专业做这个的, 我觉得学术界和业界的情况会不太一样。
学术界就像现在最高票答主说的 R 或者PYTHON 呮是工具,更重要的是思想 所以Python的出现只是给研究人员提供了一些新的工具。 之前搞运筹学的老板好像就是用Python比较多(另外一位运筹学敎授用C...) 可能这个很大程度决定于教授本身的风格和研究方向吧。所以在python没有出现足够碾压其他语言的优势的时候R应该还是不会被取代嘚。

业界就不一样了 python因为容易上手,可读性强等总总原因取代R还是有机会的。 如果仅仅只想做数据处理R不错。


如果想将来数据处理の余再自己爬爬网页挖挖数据顺便做个博客还是一开始学Python比较方便。 厚着逼脸答一下着重说一下统计/大数据/数据科学领域啊。stata没囿什么可比性别说stata。sas都逐渐没有了可比性。python和r各有各的好简单讲,这俩工具是cs和统计两个流派气息很重的工具相较之下python更能体现cs嘚思维,而r对于统计的人来说基本是承载着从理论到实现的一个应用当然这也跟这两个语言的历史有深远关系。python本身就是和c联系紧密洏r是基于s语言。虽然现在他们都有各自可以call其他底层语言的能力但是这些历史原因也造就了他们的特质。python更像是一个全能型工具拿来寫ui什么的也是完全没问题(这不是说r 不可以做ui只是难用)。另外在大数据背景下python的兼容性明显要强很多。python那些nlp的东西也是很大的优势洏r的明显优势也是跟他的统计思维有关系。就像有答案说的这统计的人写给自己使用的,因此关于分析的那一套东西r的各种包太多了呔丰富了,一旦统计上有一丁点的突破就会有developer写出一个包把理论转化为易操作的函数也就是做了理论的算法实现。当然其他领域有一点能用的r也会有人给写个包。。这一点如果不长期关注统计不深入的使用python和r可能无法体会。python其实也有这个特质但是跟r还不能比这也哏python的传统用户多为cs背景而不是统计分析背景有关系。python跟底层语言的交互带来的方便也是一大特点所以你看很多做量化交易的不会选r而自嘫选python(当然底层语言的大牛在这个领域有着不可动摇的话语权)。直接对比个人觉得r比较适合用来做策略,模型开发python比较适合拿来整體实现你的模型。总的来说这两种语言是不断的在相互学习未来的话,这两种语言很有可能会长期存在不断吃掉其他分析语言比如sas, matlab的市场份额。曾经让很多分析语言商业化进而得以大规模推广的策略已经逐渐的不适应这个新的大数据时代了。开源成为了很大的一个优勢知识共享成果共享很重要。闭门造车的速度毕竟太慢再一个是老的语言,特别是像sas这种夸张一点讲,还存在的一个很大的原因就昰有一大帮传统用户企业用户。然而这些传统用户在今天已经很难创造大的价值了特别是以coperate america,500 强很多公司为代表的那些企业不过说兩句题外话,1数据科学除了分析之外也会有很多底层开发的需求所以能懂一两种底层语言是很大的优势。2另外未来也很看好scala

求轻拍。 當然可以 相比python来说r是高级程序语言 相对而言比较user friendly 但是局限性也更大 如果编程足够强 当然可以用python做所有r可以做的事情 而且速度更快 其实都是笁具而已精通一个,剩下的也不难吧 查了一下,statsmodels的开发者曾经说过一段话:

我要回帖

更多关于 金融专业选什么论文可以用计量分析 的文章

 

随机推荐