做统计计量模型的看过来,有没有用python和R两种语言的?

n
newlife2007
楼主 (北美华人网)
请教一下,谢谢!
我几年前用过both, 当时感觉是R的user written统计和计量函数比python要多很多,做这方面的计算用R要方便一些。不知道这两年,python这方面的package是不是也多一些了?
或者问个外行问题,python是不是可以call R,用R里面的函数呢?是不是python 更火一点了?
哪种语言与数据库接口更容易,就是从数据库读数据,然后返回数据存在数据库?
看了大牛们的回复,非常感谢!!还有个更具体的问题:Python里面关于计量经济学中那些time series, vector autoregressive model, error correction model的那些estimation and forecast 函数包全吗?这些R和Stata里面都已经很成熟了。
s
sqlpad
回复 1楼newlife2007的帖子
很多人都从R阵营转Python了。
Python最大的优势是可以算是一个general programming language,整个生态系统比较强。 从web,到深度学习,都有现成的一套。
如果是重新再学一门语言,绝对是应该选python。
Python的统计包也挺完善了scikit learn,numpy,scipy,统计的一些基本的包都有了。


s
sqlpad
请教一下,谢谢!
我几年前用过both, 当时感觉是R的user written统计和计量函数比python要多很多,做这方面的计算用R要方便一些。不知道这两年,python这方面的package是不是也多一些了?
或者问个外行问题,python是不是可以call R,用R里面的函数呢?是不是python 更火一点了?
哪种语言与数据库接口更容易,就是从数据库读数据,然后返回数据存在数据库?

newlife2007 发表于 2020-12-26 12:48

数据库的接口python比R容易多了。 psycopg2是一个很流行的连Postgres的库 SQLAlchemy 是python上的一个联任何数据库的库。
s
sqlpad
回复 1楼newlife2007的帖子
刚入门级的做数据相关的: 建议 Python或者R,不用两个都精通 再加上SQL,这个绕不过,业界第一语言,整理数据全靠它。
有兴趣可以来sqlpad io练练手。


b
babybaby
同意楼上的。另外再说一句,python现在deep learning,AI这一套也很强大。基本的包都有了,基本上就是go to language for data scientists。
w
wfmlover
R也就学术圈用用 工业界用得很少的
b
babybaby
R也就学术圈用用 工业界用得很少的
wfmlover 发表于 2020-12-26 13:03

R主要不能scale up。数据一大就死菜。
c
cici159
关注
R
Riverview
无论是R或者python,为嘛画出来的plot都那么难看?
C
CleverBeaver
无论是R或者python,为嘛画出来的plot都那么难看?
Riverview 发表于 2020-12-26 13:23

您用gnuplot?
s
sqlpad
无论是R或者python,为嘛画出来的plot都那么难看?
Riverview 发表于 2020-12-26 13:23

用的包不对吧,参数没有细调。
ggplot2 是R里面画图很好看的
3
3906
回复 1楼newlife2007的帖子
R里面全是bug 不过scikit learn里面也有一些。但是我觉得R就没有能算对的结果
n
newlife2007
谢谢楼上各位!python里面计量经济学的package好用吗?比如time series, vector autoregressive error correction model 这类?
w
wfmlover
谢谢楼上各位!python里面计量经济学的package好用吗?比如time series, vector autoregressive error correction model 这类?
newlife2007 发表于 2020-12-26 14:19

不好用 python里面缺的正好就是计量经济这一块
F
ForeverMiracle
我上班用R, 很多统计方面的运用很方便,但是很多api都不支持R, 太小众了。
大喜妞
博士期间一直用R,当助教也是教R的内容。工作后主要用Python,为了和码农对接。用惯之后,真是回不去R了。 如果楼主是在学术界,特别专的领域,要具体问题具体分析,看看相关包裹。 但是如果想去公司,无脑Python。请勿抬杠。大家都是做统计的,讲的是个概率。虽然也有公司用R,但是大概率还是Python。
用R得心应手的姐妹们,改学Python不难,唯手熟尔。

W
WANGWANGSTON
感觉python更流行 r统计方法更多 在python call r 应该还是有点麻烦 还是用学python回报率高些
o
okyes
无论是R或者python,为嘛画出来的plot都那么难看?
Riverview 发表于 2020-12-26 13:23

要想好看你的用其他的plot啊,话说ggplot2画出来的图还可以啊,不是很难看 我以前灌水paper的时候用过,感觉发个文章做个ppt足够了。
n
nehz
我们公司两个都用。 industry data用python,local数据用R,R的pipe处理起来数据还是好用
m
momclub17
回复 1楼newlife2007的帖子
很多人都从R阵营转Python了。
Python最大的优势是可以算是一个general programming language,整个生态系统比较强。 从web,到深度学习,都有现成的一套。
如果是重新再学一门语言,绝对是应该选python。
Python的统计包也挺完善了scikit learn,numpy,scipy,统计的一些基本的包都有了。



sqlpad 发表于 2020-12-26 12:56

我认同。但是我有一个concern,类似的语言层出不穷,会不会过几天python就不流行了,又要重新学一门语言呢? 而R类似的语言,我相信更新肯定不会像general programming language那么快。生存周期长一些。
菲菲
我在公司用R,感觉我们行业用R的比较多,new graduate招进来至少都会点R,不用我train了,就是处理大数据有点麻烦,得会work around
d
ddmmforever
存着,紫薯紫薯
c
commander
Mark mark
T
Terryasdf
python胶水啊, 可以on call 任何一种语言, 当然包括R, 也包括大规模数据库数据并行计算postgresql等等
凡是R有的, python都可以做到. 大不了自己写, R现成的比较多.
2
201120152019
我们也是Python用的比较多,觉得比较灵活些
风声边界0514
m
midusa
请教一下,谢谢!
我几年前用过both, 当时感觉是R的user written统计和计量函数比python要多很多,做这方面的计算用R要方便一些。不知道这两年,python这方面的package是不是也多一些了?
或者问个外行问题,python是不是可以call R,用R里面的函数呢?是不是python 更火一点了?
哪种语言与数据库接口更容易,就是从数据库读数据,然后返回数据存在数据库?
看了大牛们的回复,非常感谢!!还有个更具体的问题:Python里面关于计量经济学中那些time series, vector autoregressive model, error correction model的那些estimation and forecast 函数包全吗?这些R和Stata里面都已经很成熟了。
newlife2007 发表于 2020-12-26 12:48

提供一点我的看法
1.公司里面有大量用R的。尤其是bank。 2.计量模型一般不是大数据,python的这个优势不明显 3.计量模型要求可解释性. ML, AI模型等不太要求。Python很多包连一个p-value都要倒腾半天,不少包甚至连基本的OLS都不提供p-value。玩计量模型就更tricky了 4.Time series python有,不知道是不是和R一样完善。stationarity test R可以检测3钟,不清楚python。但感觉一个p-value都那么费劲,悬。 5.Time series里面,seasonality的处理,python可能和R差不多。SAS是最综合的,比R和Python都好。因为X13等是SAS环境下开发的

o
oqo
真做统计modeling的话 还是R吧 比如survival analysis Python里仅有的几个package质量很差 跟R下的package比差太远了
T
Tianailu
Python is more popular
V
Vlj
应该开一个学术版了,或者职业技能版?不过开专版后可能没几个人访问了
o
oqo
python胶水啊, 可以on call 任何一种语言, 当然包括R, 也包括大规模数据库数据并行计算postgresql等等
凡是R有的, python都可以做到. 大不了自己写, R现成的比较多.
Terryasdf 发表于 2020-12-26 15:44

自己写会吐血的 算个p-value都得折腾好一会 Python好多package是抄R的 抄的好的用的还可以 抄的差的都不敢用 现在好多用Python的 只要run个package能出个数就觉得大功告成 连结果对错都不去仔细查 ML搞的只会调参
b
bipoppy
做计量的话用Stata很方便,做machine leaning的话就上Python,两个不冲突。 我个人不喜欢R的语法,所以一直没用。
s
sqlpad
我认同。但是我有一个concern,类似的语言层出不穷,会不会过几天python就不流行了,又要重新学一门语言呢? 而R类似的语言,我相信更新肯定不会像general programming language那么快。生存周期长一些。
momclub17 发表于 2020-12-26 14:33

python现在排tiobe兵器谱第三位,生命力和生态圈非常强大, 你说哪里来的类似语言层出不穷,你是来搞笑的吧。
https://www.tiobe.com/tiobe-index/

a
abby77
这么说吧,现在招的印度vendor 都必须两种语言都会。从一个语言转到另一个语言也就是几周的时间。