【SparkData】大数据分析之三大利器 ~~~“ The more I use P

d
dido2009
楼主 (未名空间)

【 以下文字转载自 Statistics 讨论区 】
发信人: dido2009 (music fan), 信区: Statistics
标 题: 【SparkData】大数据分析之三大利器 ~~~“ The more I use Python, the more I love SAS. 从 SAS 到 Python, 感觉像再婚一样:
发信站: BBS 未名空间站 (Fri Nov 13 11:27:28 2020, 美东)

“ The more I use Python, the more I love SAS. 从 SAS 到 Python, 感觉像再
婚一样:过得越久,越思念前妻! ”

大数据行业蓬勃发展,现在有很多专业的数据分析工具。 使用最多的三大软件是:
SAS, R,Python.

根据2018年的一个用户调查, 1000 多家用户调查结果是:SAS 34%, R 33%, Python
32%. 基本上是三分天下的局面。但是在银行、电信、政府部门,SAS 的使用程度更高
, 因为 SAS是历史最久的软件,这些行业已经长期使用 SAS,具有很大的依赖性。

从价格角度来说,SAS 是商业软件,价格很高, 一个 License 每年要超过$5000 美金。R/Python 则是开源软件。不过,可靠性和处理大数据的能力,SAS是一骑绝尘,遥
遥领先。SAS 像是正规军,而 R/Pyton则是许多开源包拼拼凑凑的乌合之众。
Stephanie Glen 对这三大工具做了非常全面的比较和总结,请看下表。

接下来简单说说三个软件的特点。
https://www.sparkdata.ca/three_analytic_tools/

b
bluesky321

我印象里license是9000到1万, 额外功能另外付钱, 比如从.xlsx导入数据,一千块
, 时间序列,至少3千; 当然要是银行,药厂一次性买上千license, 价格有优惠。