谢谢各位mm鼓励或者批评。我现在的工作是支持marketing的,已经做了10年了,没用过很多ml algorithm比如classification什么的,因为这个工作用不到。基本是各种regression, clustering, time series之类的,因为数据量没那么大,所以decision tree, random forest之类的反而不如regression结果好,而且不容易解释,也没法变成template给marketing用。所以现在突然发现所有的行业都要data science,machine learning,这样的话我以前的经验似乎都一夜之间都没用了。本来我还是想找偏技术的工作,也不是不可以学新东西,但是一下子要从底层做起,薪资大幅度降低,心里有些想不开。
谢谢各位mm鼓励或者批评。我现在的工作是支持marketing的,已经做了10年了,没用过很多ml algorithm比如classification什么的,因为这个工作用不到。基本是各种regression, clustering, time series之类的,因为数据量没那么大,所以decision tree, random forest之类的反而不如regression结果好,而且不容易解释,也没法变成template给marketing用。所以现在突然发现所有的行业都要data science,machine learning,这样的话我以前的经验似乎都一夜之间都没用了。本来我还是想找偏技术的工作,也不是不可以学新东西,但是一下子要从底层做起,薪资大幅度降低,心里有些想不开。
我知道data science现在大热,但是真的所有职位都有那么多数据,需要用到machine learning吗?一个marketing的职位,头自己都分不清两者有什么区别吧?感觉全都是跟风,有个热门词就都扑上去。
挺迷茫的,人到中年,有家有娃,再怎么努力学也不可能赶上人家data science出身的人。 更何况本来有个中层职位了,现在要换方向还要从头开始,又费劲又要降工资,这是为了哪般呢?
请问各位姐妹,现在还有哪些方向能够容得下传统数据分析的?还是说我这样的已经不换方向以后就没活路了?真的非常沮丧。。。
传统数据分析还是有人要的吧,很多都是打着data scientist旗号,做着data analytics的事情而已。
楼主,要么改变现实,要么改变自己。
“挺迷茫的,人到中年,有家有娃,再怎么努力学也不可能赶上人家data science出身的人。 更何况本来有个中层职位了,现在要换方向还要从头开始,又费劲又要降工资,这是为了哪般呢?”
为了赶上时代?逆水行舟,不进则退。
学个python不难的。。。 ---发自Huaren 官方 iOS APP
楼主是找偏技术还是偏管理的?data science不看出身。统计,cs是一大部分,
其他物理,ee也不少我还碰到过艺术和音乐出身的。
最后SAS还是不要用了。我在sas工作的朋友都抛弃sas了
为什么?SAS分析数据功能强大啊。
本行业和本组没前途,实在不想呆了
不光是语言的问题。感觉data science都是cs ee出身的人,本身受过的training就是不一样的。也许我太悲观了吧
同意这个,现在就是数据多了一些而已,分析思路并没多大的变化,deep learning 的方法也未必一定优于polynomial.
技术出身,已经做到管理层了。但不想丢掉技术,觉得那是立身之本。主要感觉现在data science鱼龙混杂,各种水平的都有,但是hiring manager们要求都是一样的,很多地方自己的数据都很有限,根本也不需要什么强大的machine learning algorithm. 难道面试必须靠吹吗?感觉很挫败
regression也是个machine learning model嘛。这样想会不会觉得还挺有经验的?
难点难道不是应该收集那些数据(定义signal), 怎么收集(频率,数据,怎么取舍),然后用什么模型分析,模型那些改动,怎么tune参数。最后怎么解释数据和结果吗?
管理层感觉还是不要硬拼技术了
我的理解:上头其实不知道ml能干啥
但是你会点ml就有可能干出点fancy的东西
ml也在evolve,会了三年前的ml知识不代表会现在uptodate的知识
但只要你一直坚持学新东西 至少比纯DA更有可能做出点啥
这不是“吹”,这是sense问题。你都做到manager了还把这些当作吹的话,我也不知道说什么好。
我学的是传统statistics,从来不觉得这些知识会过时
但是ml不能一点都不懂
statistics和ml都在发展,有一些牛人正在做两者结合的东西。我也希望自己能做一些。
不论自己做什么出身,要认清自己的优势劣势。更重要的是当前有什么问题,你会屠龙术是没有用的。别人怎样解决,自己有没有可能有更好的解决方法。别人用ml解决,你也许可以用stat+ml解决,效果比人家好(error rate 也好、interpretability也好),那么你就是牛人。
要不你读个mba?我有做da四五年的朋友,不喜欢coding,ds也转不过去,现在读mba去了,不知道出来什么状况
Check this out: https://www.datacamp.com/tracks/data-manipulation-with-python
你就是想轻轻松松做manager 不用更新技术还能享受技术出身的稳定和优势,别人不断更新技术就说别人都是吹。
统计有统计的优势,cs有他们不懂的,我很多同事连pca跟biplot都不会看....懵逼...学python挺简单的,但是要自己学学怎么写成漂亮的code,科班出身的code写得更容易懂那是真的
也请各位mm建议一下,我这种情况到底是应该开始学习DS走technical路线,还是干脆走管理路线耍嘴皮子过日子?总觉得没有技术的底子耍嘴皮子也没底气
重要的是思维,不是一种语言
logistic regression就是最简单的classification啊,其实ml入门对于stat背景的人应该很简单。
你不需要转ds跟新人拼算法/写码,你有marketing的field knowledge,为啥不发挥一下优势呢?去看看别的公司marketing的支持部门做什么呀,需要会ml就学点ml,我的感觉是他们要求candidates会ml不一定说明工作内容就是ml。很多头儿只是希望往这个上面靠,毕竟AI做出了很多fancy的东西很多人以为ml就是万灵药。ml的interpretion是一个非常大的问题,没几个人能做好的。但是学一点ml,想一想跟原来的方法有什么联系,不也是在提高自己的竞争力吗。
楼主,虽然人家说你“得过且过”是不好听,但是你也一直用 “耍嘴皮子”, “头自己都分不清两者有什么区别吧” 来形容别人做DS的领导啊。 直接就把人家的能力给否认了, 是不是也有点武断?有点冲?
如果发自肺腑的看不上这行,就不要转了,不然会很不开心的。
mm, 我今天谈的那个职位领导是纯marketing的啊。。。而且我说的耍嘴皮子不是指DS的领导,是说我们这个行业高层的现状。。。
成千上万的从业者,不可能都是“耍嘴皮子” 或者不懂这行的。
唉,其实你怎么看这行都不重要了。
不管怎样,选择你目前的最优解吧。
如果你能不学这行,也能稳中求进,保持你满意的状态,那就这样。
如果你不学这行,未来可能连现在的职位不保,那你真的不能不学啊。只能按你说的,要么学会耍嘴皮子(比如你的高层领导),要么技术过硬(比如人家努力学了数据的人),要么两者综合起来都不错。
都中层管理了,稍微分析分析就能知道怎么才能最优化自己的未来。也许自己面临的道路并不像以前那么舒服那么顺利,但是有什么办法呢?这个时代就是这样。
哦,看到你说换行业了。我印象中一些水电公司还是在用SAS 和Excel的, 待遇福利很好。
楼主加油!
理解。
以我观察,现在有‘铁饭碗’的行业,基本真的只有水电公司和政府部门了。
其他行业都要使劲儿学习。
我有一个好朋友,也有小娃娃,也有一个全职工作,依然在用业余时间学习,争取转行。
我自己业余时间也在不断的学习。
大家一起互相鼓励吧!
hahaha,好形象
我觉得你说的那些什么Tree之类的挺简单的,无论是python还是R,都有现成的package(前面说的“调包侠”就是这个意思), 你只需要理解一下什么意思就可以了。
如果有统计背景,学起来不难的。
我认识很多很多很多数据科学家,都不是cs/ee出身。而且做面向商业应用的数据科学家,的确用不上cs/ee这么高深的技术, 反而是懂得商业,有domain knowledge 更有优势。
cs/ee出身的那些都去做什么人工视觉啊,自动驾驶之类的去了。
对,lz也不太可能转第一种,而第二种,lz这种DA转起来太容易了,或者其实就是DA。而且她又有domain knowledge,优势很大。简单的ml调包学些就可以了,我一直觉得统计出身不要跟人家CS、OR专业的比算法和coding,完全扬短避长。
lz大概是看了人家需要ml就以为自己干不了。说白了还是没有对DS这行足够了解。
话说,真的诚心建议lz交几个相近行业的朋友,看看人家在做什么,跳槽的时候心里会比较有数。
铁路算不算也是铁饭碗?前阵子看到他们也招DS,而且要求还挺高。。。
其实银行业还有很多还在用SAS,其实说到底还是跟你要解决的问题实现的功能有关,以及后来deploy的框架也要考虑,SAS,R,python都只是工具而已
即便是软件开发,语言也还是tool,更关键的是思想和构架。所以我有时候并不理解目前比较普遍的open source就比SAS高大上的mentality. 我SAS python都用,若有需要R也用一下不过不经常,SAS的统计分析功能还是非常稳定强大的。
我觉得是吧,因为其实那是我们公司内部的职位,基本上几斤几两我还是清楚的。但据说那个marketing的头招了半年了就是不肯松口,看不上偏统计用sas的
mm在哪个行业介意分享么?其实marketing analytics的portability还是蛮高的,比如原本在零售业现在转去金融服务啊电商啊什么的也都是可行的,毕竟在哪儿marketing都是那些东西,看给谁push广告而已。想拼一把去consulting firm都可以。
da的这些技术都比较简单,没什么好继续深入的,一直做没有什么意思
要更技术就得涉及到ds那些,你也说了你不太会。
楼主,你是什么行业的?说出来大家帮你头脑风暴一下。
mark 回看
楼主,我把建议发给你了
做的东西是纯physical的,没有web analytics,email campaign那些。连marketing campaign和merchandising的具体data都没有,只能看个price drop.公司是非常传统的那种marketing和sales department driving的模式,对data很不重视,所以数据库里的data非常有限。
还有,mm你真是好人。
那就学一学新东西跳槽吧。你有这么多年商业经验+数据经验,已经比很多人走在前面了。 我是干这一行的,相信我。
加油!
过时了吧
大数据SAS慢死了
mm说的是对的,应该平时多积累。我是真的俩娃没老人帮忙,老公工作远管不了,每天俩娃起床,上学(两个不同学校),放学,做饭,伺候吃饭都是我。不过这些都不是借口,人要活着就得工作,就得学习。我这个人学习能力不强,以后不能懒了,每天挤一点时间用来学习
家有两娃十分辛苦,争取外包一些活吧。如果实在自己觉得没有头绪,现在有不少华人开的bootcamp也不错,花点钱投资自己,节约自己去research的时间。
re这个
谢谢mm的建议。我愿意花钱去上bootcamp,当作买时间了。如果有好的bootcamp请推荐给我,谢谢!
最重要的是人的意气被消磨了。。。这么多mm告诉lz说pick up Python / ML多么简单,lz一副不听不听害怕改变的态度。。。
lz我bootcamp另给你投信说吧。
我理解楼主,虽说活到老学到老,但不是每个人都能够精力充沛,每天把娃伺候好还有余力来学习的。
传统行业,混日子养老的是多数。只是data science这个行业门槛低,年轻人潮水般涌入,技术日新月异,想要与时俱进真是要付出蛮多代价的。
---发自Huaren 官方 iOS APP
一般人学ml最主要的部分其实是统计, hard core computing 那一块压根也不指望python 啊。楼主要有自信。
跟做machine learning完全是两码事
只不过是抛弃过去的SAS SPSS去用新的工具而已
绝大部分data scientist都是写SQL为主,偶尔写写python而已
大数据train data啊,传统的统计就是假如说有足够多次,那么概率是多少,这个回到ML就是真的有这么多的数据了,你要么无数次循环找规律,要么没有规律自己总结出规律,以前是理论,现在给你很多很多的sample你想怎么玩怎么玩。
哈哈 这才是懂得。加个微信交流交流。
这个我也很无语。errer term就非得叫cost function,variable就非要叫feature。真是矫情
本来就是为人家business服务的,当然要按照人家的习惯来说话啦
---发自Huaren 官方 iOS APP
re这个
具体说说?
我读完stat ms,上了cs的课,也是稀里糊涂的。phd期间听了好几个panel talk才终于觉得稍微懂了。首先任何对model进行training、parameter tuning的方法,都可以称作learning。但现在machine learning和statistical learning正在diverge。区别其实不在于data大小,而在于,1,二者目标根本不同;2,二者的基础也不同。
ML的目的在于准确度,hit rate/error rate;统计的目的在于interpretion。ML的基础是data,统计的基础是分布,是representative sample。
简单的ML模型层面,统计的现成模型很好用。比如logistic回归特别适合做binary classification。至于LASSO,一直都叫“statistical learning”。我觉得variable selection就是statistical learning的典型,因为,方法是training/tuning的,但目的是统计的(要更容易interpret的模型)。比如如果你只做PCA,那就算learning,只有当你试图解释这个PC代表了什么的时候,才是统计。另外time series基本不是learning。
而大热的DL,就是在ML的方向上离统计越来越远。DL的几乎所有模型都不可能被interpret,没人能够解释那么多神经元是有任何现实意义,likelihood function通常不存在,其实DL基本脱离了distribution的概念,已经很难跟统计再放在一起谈了。