Yeah, I've heard recently multiple times Scala is more efficient than python. So if lz wanna follow technical track, learning never stops at python/r/ml etc...
python不是问题,虽然我也很讨厌python,我觉得问题的关键是现在软件什么多,到底学哪个。这牵扯到你决定在哪个方面深入发展。是visualization,还是EDA,还是stat,ml。我觉得吧,把stat的本职工作放到python里去做好,系统地学一遍ml,学一点big data(只要一点是因为在欧盟GDPR下有big data的机会并不多),就差不多了。然后就是发展自己的domain knowledge了。我折腾了大半年,得出结论,千万不要勉强自己,上面那段里说的那些不擅长的活,别人怎么跟我说我都会睡着的,我也努力啦,还是coursera那个andrew ng deep learning课程的mentor呢,但是实际操作中,人家根本不问你cnn里面流程是怎么样的,就要你搭一个能识别猪脸的平台,对不起,臣妾做不来。。。
第一个其实两者不一样。比如error term是Gaussian distributed,就可以对应square loss function,但是本质上这两者是不同的,只有在某些特殊情况下得到一样的结果。
一些model只能用loss function定义,error term是没有distribution的。
妹子写的真好。我也觉得作为ds,统计和ml都得会,根据需要来决定哪种工具更适合。但是dl的应用我觉得比较局限,需要海量数据,结果也不好解释。
我老公工作是用DL的。只能说分情况讨论吧。
data science是新兴学科,至少我聊过很多搞传统统计的人,他们并不确定data science的定义。也有过统计要不要更名data science的争议。老头老太们当然一百个不乐意啦,其实我觉得也不妥。感觉真的应该单开一贴聊聊。data analyst、statistician、data scientist,其实都不一样。没有official的区分,也有很多overlap,但我是老派人,心里是有对这些title的区分的。哈哈。
再来一贴吧,想听~~
说的真好。话说已经到管理层了又要从头开始学新东西真是不容易,走管理路线, 知道些皮毛大方向,也很好。
一直分不清,MM这么一说,好像make sense呢,赞
我也会搬小板凳来听的 :)
What's the problem there? Just curious.
Would you please PM me the bootcamp info.? Thanks!
引用掉了。。。@cath226
Yeah, I've heard recently multiple times Scala is more efficient than python. So if lz wanna follow technical track, learning never stops at python/r/ml etc...
我也在考虑这方面的bootcamp, 能否麻烦给我也发个消息? 多谢!
赞!mm要是能单独开一贴具体讲讲就好了
才知道ML原来不要求对模型interpretation,不同专业之间的institutional logic差别真的好大!
麻烦跟我也说下bootcamp。谢谢
business才不要知道这些呢。这些term只有analytics自己人才用的
我就是在两者之间转行了,今天在外面开会,改天来好好写写。
mark, looking forward!
觉得没前途为什么不学新技术呢 ---发自Huaren 官方 iOS APP
求再发一点详细的说说
我想说的是bootcamp类似短期速成职业培训,多半是捋一遍知识点然后带着做两期kaggle项目,费用不便宜。我最初接触到也是面试的时候别人提起,毕竟招bootcamp出来的人比招fresh的进来好用,也比烙印咨询公司的好用,上手快,所以在大环境海招ds的情况下,bootcamp资历也逐渐被认可。在职带娃的都知道学习和转行的压力和生活之间的痛苦平衡,这毕竟是权宜之策。所以收到我信息的mm自己好好权衡一下。我自己没有真正参加过这些bootcamp,在我入这行初期,还没有这些指南,而且现在ds的面试对coding的要求已经大大降低,许多公司已经把和cs的面试分化开去。关键还是分析的思路,problem solving的能力展现以及对新事物的学习能力。这行还有太多东西在被定义中,要做好准备已经学的东西也可能会快起变化,被替代。
想跳这种!
其实没有几个人不是调包侠,那几个都在大学里和文章里,剩下的大家半斤八两,没有什么可笑的。做应用的不见得比做学术的蠢。
对对对,笑抽了,明明就是原来那个变量用的不顺手,新建一个变量,非要说feature engineering,有朝一日我招人的时候,谁写这个一概不要。。。。
这段写得超级好。
我就顺在这里写写我的经历吧。我呢出身还不如楼主mm,我是econ出身,后来混进了stat队伍,后来在巨传统巨压抑的地方做了很多年的business analyst,有一天实在受不了裸辞了,然后不知道撞到什么鬼被抓去做ds了。在ds队伍里混了大半年,我的观感是这样的,ds呢,是个professional titile,里面做什么的人都有,从高能物理到微生物学,运气好还有几个经济学的,但是在这个帽子底下,个人还是在做个人原来的事情。有些什么事情可以做呢?DL,咱这种背景就别想了,别看现在大热,各各都想往它上靠,退潮的时候,谁在裸泳还真不知道。因为绝大多数的人,都是调包侠,就是把github里的包,用到自己的情况下,稍微改改,放自己的猪头照片,面部识别了哟!而且就想上面这个说的一样,它离统计很远,你学起来也困难。还有各种搭硬件平台超级电脑的活,咱也不会,真叫你做你也未必看得上,这不就是IT support的活高级了一点么。
python不是问题,虽然我也很讨厌python,我觉得问题的关键是现在软件什么多,到底学哪个。这牵扯到你决定在哪个方面深入发展。是visualization,还是EDA,还是stat,ml。我觉得吧,把stat的本职工作放到python里去做好,系统地学一遍ml,学一点big data(只要一点是因为在欧盟GDPR下有big data的机会并不多),就差不多了。然后就是发展自己的domain knowledge了。我折腾了大半年,得出结论,千万不要勉强自己,上面那段里说的那些不擅长的活,别人怎么跟我说我都会睡着的,我也努力啦,还是coursera那个andrew ng deep learning课程的mentor呢,但是实际操作中,人家根本不问你cnn里面流程是怎么样的,就要你搭一个能识别猪脸的平台,对不起,臣妾做不来。。。
很赞同
还记得我电面的一个问题就是ML和传统的stat有什么区别。其实传统的stat比如各类回归也是ML的一部分,但处理数据的思路是不一样的。现在学了SAS, R, Python,感觉起来python还是应用最广的。在大数据的背景下,不光是python,spark和scala也需要渐渐跟上了。
楼主你好歹还有传统统计背景还会SAS。我们公司最近刚招了个SVP就读了一DS硕士学位还从来没把这些上课学的用到实践中过,然后此人立志要把公司里十几二十号毫无统计背景和编程背景(有些写SQL都吃力)的做一般analytics的人transform 成data scientist,哈哈哈,这些人很多在公司已经很多年了,一直就是用Excel和Teradata,现在突然要他们学R或者Python。此人就是靠一张嘴抛出无数fancy words忽悠CMO被招进来的。我们公司不是咨询公司,大部分这些人都是老美,平时都不怎么加班的,公司也不鼓励加班。我完全不知道他们要如何在不影响自己本职工作的情况下用上班时间从头学习统计和编程。
☆ 发自 iPhone 华人一网 1.14
感觉就是抽几个样本作survey和简单粗暴统计整个population的区别?那也不是放之四海而皆准啊,现在数据这么丰富,也没人能准确预测出一只股票的走势。而且ml不能interpret的特性,在某些行业是致命伤。。。