为什么deep learning在R里没人开发?

m
miked
楼主 (北美华人网)
请问是什么原因,导致没有人开发deep learning 的包,为R?
伪猴王
就等你来了
b
babybaby
R的memory handling及其糟糕,对大数据尤其不友好,如果不改变其基本的architecture对DL是没戏的。
紫罗
R里可以做deep learning啊
m
miked
紫罗 发表于 2024-08-23 16:56
R里可以做deep learning啊

你用R里的哪些包做deep learning呢? 请问和python比较起来,方便吗?
紫罗
miked 发表于 2024-08-23 17:00
你用R里的哪些包做deep learning呢? 请问和python比较起来,方便吗?

我deep learning做的不多 但是torch和python的用法很类似。R也有tensorflow但是不好用
s
springbee
Memory 不行吧
c
custom
R矩阵运算不错,非常简洁,同样的问题可以问为什么Java把C干翻了,却被Python 逆袭?
m
miked
紫罗 发表于 2024-08-23 17:18
我deep learning做的不多 但是torch和python的用法很类似。R也有tensorflow但是不好用

我用R里面的torch,没一会儿就死机了。 这个torch还是调用的python的库。很慢。
m
miked
R矩阵运算不错,非常简洁,同样的问题可以问为什么Java把C干翻了,却被Python 逆袭?
custom 发表于 2024-08-23 17:42

有人用python做过logistic regression分析吗?
我想分析性别(sex)的影响。我的sex包括三类:男,女,不男不女。
但是python要求将categorical variable转换。R不需要这一步。 所以python出来的结果是sex_Male, sex_Female.
在R里,模型是 outcome ~ age + sex + salary 在python里,模型是 outcome ~ age + sex_Male + sex_Female + salary
请问大家怎么解决这个问题。如果一个变量包括10个levels。那样是不是一下子就增加9个变量?怎么解决呢?变量太多了。
m
miked
紫罗 发表于 2024-08-23 17:18
我deep learning做的不多 但是torch和python的用法很类似。R也有tensorflow但是不好用

R里面的keras, tensorflow, troch都要求python的安装。
是python里面的什么东西, R做不了,需要调用python的库来完成?
R底层不也是c吗?为何R不能开发出这些所需的库呢?而要用偷懒的方式从Python里面调用?
s
shaohuacrystal
miked 发表于 2024-08-23 18:28
R里面的keras, tensorflow, troch都要求python的安装。
是python里面的什么东西, R做不了,需要调用python的库来完成?
R底层不也是c吗?为何R不能开发出这些所需的库呢?而要用偷懒的方式从Python里面调用?

“为何R不能开发出这些所需的库呢?而要用偷懒的方式从Python里面调用?”
python做的很好的,为什么R要做重复工作?
紫罗
R里面的keras, tensorflow, troch都要求python的安装。
是python里面的什么东西, R做不了,需要调用python的库来完成?
R底层不也是c吗?为何R不能开发出这些所需的库呢?而要用偷懒的方式从Python里面调用?
miked 发表于 2024-08-23 18:28

据我所知 kera和tensorflow需要 但是torch不需要python。
f
facet
miked 发表于 2024-08-23 15:44
请问是什么原因,导致没有人开发deep learning 的包,为R?

R算不上通用语言,语法怪异,可读性极差,你要是做过R里面的面向对象编程就知道了,写出的代码极其难看
c
colab
被迫改用python,现在的系统对python友好太多了
s
sportcar
回复 10楼 miked 的帖子
可以用One hot encoding
m
miked
sportcar 发表于 2024-08-23 20:32
回复 10楼 miked 的帖子
可以用One hot encoding

假设如果数据里有很多categorical变量。这样one hot encoding之后,总变量数是不是要翻倍?
这样对系统的性能有无影响?
另外,假设一个变量var,经过one hot encoding后,得到9个dumpy variables var_1, var_2,...var_9.
怎么能用feature importance来分析出变量var的重要性呢?而不是var_1, var_9
这个是不是python的致命缺陷?
w
wfmlover
因为这世界只有80后以前的 念统计经济类的人 还在用R
m
miked
wfmlover 发表于 2024-08-24 00:03
因为这世界只有80后以前的 念统计经济类的人 还在用R

如果 你用神经网络,那么怎么得出categroical variable的feature importance呢? 神经网络只能接受数字型数据。
n
nn2000
R的核心用户群体偏向于数据分析师
灌水不要认真
facet 发表于 2024-08-23 19:40
R算不上通用语言,语法怪异,可读性极差,你要是做过R里面的面向对象编程就知道了,写出的代码极其难看

看到标题我就在想 我要不要说因为这个语言太难用了呢,看到这条赶紧点赞
紫罗
facet 发表于 2024-08-23 19:40
R算不上通用语言,语法怪异,可读性极差,你要是做过R里面的面向对象编程就知道了,写出的代码极其难看

R根本就不是面向对象的。R是统计软件,很多统计模型Python不完善或根本没有。
w
wfmlover
回复 22楼 紫罗 的帖子
因为很多刚入门人,做数据的,用了一下Python 就以为Python == R
其实R,只不过等于Python Pandas 加上它本身的一些经济模型 而这些经济模型是老一辈的人开发的还在academia
Python 除了Pandas 和ML 还有很多其他做软件开发的功能,是一个完备的语言


m
miked
wfmlover 发表于 2024-08-24 01:32
回复 22楼 紫罗 的帖子
因为很多刚入门人,做数据的,用了一下Python 就以为Python == R
其实R,只不过等于Python Pandas 加上它本身的一些经济模型 而这些经济模型是老一辈的人开发的还在academia
Python 除了Pandas 和ML 还有很多其他做软件开发的功能,是一个完备的语言



在R里面,逻辑回归模型可以简单到 Y~ age + sex + salary
但是python必须先把sex转成dummy variable。假设sex是三层:female,male, others. 那么最终模型是 Y ~ age + female + male + salary
请问从这个python的逻辑回归模型中,如何知道sex的重要性呢? R里,回答这个问题非常轻松。
s
songxm99
R是一帮研究统计的教授和学生写的,工程上的性能不足。
一生所爱
miked 发表于 2024-08-24 01:42
在R里面,逻辑回归模型可以简单到 Y~ age + sex + salary
但是python必须先把sex转成dummy variable。假设sex是三层:female,male, others. 那么最终模型是 Y ~ age + female + male + salary
请问从这个python的逻辑回归模型中,如何知道sex的重要性呢? R里,回答这个问题非常轻松。

请问不能把sex encode成 male = 2 other =1 female = 0 这样会对sex的意义带来误导吗?
t
tigerpi314
babybaby 发表于 2024-08-23 16:51
R的memory handling及其糟糕,对大数据尤其不友好,如果不改变其基本的architecture对DL是没戏的。

这是真相了
m
miked
一生所爱 发表于 2024-08-24 06:06
请问不能把sex encode成 male = 2 other =1 female = 0 这样会对sex的意义带来误导吗?

不行。