(帮忙内推FB)Data Scientist 跳槽经验总结帖+复习资料推荐

s
supermuyes
201 楼
想问下machine learning 考的深吗? 之前一直用SAS 和SQL 编程。没用过machine learning 的知识。谢谢
passedmemory 发表于 12/11/2017 1:31:57 PM 看样子你应该不是相关专业 的phd,所以我觉得不深。 对ms+工作经验的人来说,面的其实很水。更多是解决问题的能力吧。比如,如何design an email compaign? 但系统的上过ml的课是必须的!
s
supermuyes
202 楼
问个比较幼稚的问题,lz 觉得GPA 对于找DS 的影响大吗?对于第一份工作,和有工作经验之后跳槽,有什么不同程度的影响吗?谢谢:)
大菠萝小菠萝 发表于 12/11/2017 1:32:41 PM

私下认为,对这些没法改变的事情就不要纠结了。focus在能改变的地方,比如你做过什么项目,建过什么产品,会什么技术??
s
supermuyes
203 楼
谢谢分享,请问自学DS的需要去考个什么certifcate或者degree吗?那些degree或者certificate有用?
babybear23 发表于 12/11/2017 1:41:13 PM


我觉得有用。有个学位系统的训练肯定是块敲门砖。如果去上学不靠谱,就只能自学了,那么多online course,学起来项目做起来写到简历里去。没有实际工作经验就只能靠上课的项目经验了
s
supermuyes
204 楼

非常棒楼主!感谢分享。请问mle 接受fresh grad吗?大公司不都是统招?

BZH 发表于 12/11/2017 2:06:14 PM

据我了解mle非常prefer有经验的。fresh 竞争很激烈。我了解大公司里面L bar相对最低。其他的比如fb fair, research, google brain 组基本不是师出名门没戏。
s
supermuyes
205 楼
回复 1楼supermuyes的帖子

多谢分享. 请教一个小白的问题, 楼主说的ds是不是专门针对tech公司的ds, 为啥最后说SAS没用呢, 很多healthcare领域的公司和大银行啥的不都用SAS吗.

Lcynthia500 发表于 12/11/2017 2:51:47 PM


算是专门针对tech吧。从普适性来说,数据处理最主流的应该是python r sql。 建模的话,前2个。big data 下另说。
s
supermuyes
206 楼
mm,我想提个问题,data scientist 和 MLE的工作内容有什么不同呢?
duanran25 发表于 12/11/2017 2:53:09 PM


http://www.1point3acres.com/data-science-machine-learning-engineer-etc/
https://www.zhihu.com/question/23915600
s
supermuyes
207 楼
非常感谢lz的好帖子,我也打算明年三四月的时候开始跳槽,现在先准备着,lz的帖子实在是太及时了,我想问一下很傻的问题,lz是怎么瞒着现在的公司老板跳槽面试的呢?直接请假吗?
sijiziwayiz66 发表于 12/11/2017 5:08:37 PM


只能请假。找各种借口
*
*风之谷*
208 楼
谢谢lz的分享,我想转ds。能不能再具体说说ds一般面试会覆盖的内容?你说ds不需要刷题,那如何准备呢?你谈到了sql,除了这个以外呢?
r
roundroundyy
209 楼
太有用了!谢谢!
h
herion518
210 楼
楼主能不能再详细说说如何培养产品分享的思路?
2
2018_Lin
211 楼
感谢分享! 我跟你情况差不多,但是之前2年多的工作比你水~ tech 在之前的工作中用的比你水很多~统计master+3years working experience 
一个偶然机会,拿到一个面试(one of top 10 in bay area) ,SQL 这一轮面试过了,准备要面 Product sense/problem solving 了。在准备,能多分享一些这阶段的面经嘛? 比如很多类似的问题就是FB 页面要加一个这样的feature, what you think? 思路大概有,但是不知道如果做matrix design, 如果去evludate 这个feature 具体应该考虑到什么方向 ~

如果拿到offer, 我一定也像楼主一样,把自己(一定比你水)的申请分享给大家~~~
l
littleorange95
212 楼
来回报论坛了,说说自己近期面试data scientist 的经验。
背景:ms systems engineering + 2yr work experience in a small (not start-up) company, daily responsibility includes data analysis, modeling, machine learning, some text mining, some big data analysis. 不做任何reporting and visualization,也没有所谓的product analytics (experiment design),和flg要求的有较大差距。 Skill set (括号代表非常真实的工作时间分布): r (70%), sql(10%), python(10%), spark (specifically, pySpark, 10%). 坛里一定有很多比我牛的人啦,我只是新人一个。在这里我只想给出一个非牛人,但挺努力有目标的人会怎么准备。目标是想去湾区做ds。
先说结果: 投了40家左右 Offer: fb, google Rej: Linkedin and a startup (onsite rej) twitter (after 2 tech interview) Apple (不同组跟4个hm聊过,最终有被拒也有withdraw) Uber (failed first tech interview) Airbnb (failed on data challenge) 还有好多其他公司,有的跟hr聊聊发现不合适,有,有的默拒,有的好歹还告诉你一下被拒了。 总结下:就是太小的公司,投了也白投,直接简历悲剧。我大概投了25+小公司,只3个好歹给我电面。其他就是没消息。 所以觉得自己背景还不错的朋友,建议安排面试的时候,从不太想去的中/大公司开始,到自己最想去的大公司。找小公司成本很高, 投的时候麻烦而且又没面试。
【时间线】 17年2月,开始上JIUZHANG算法初级课,刷题,断断续续到6,7月吧。(***如果找ds,刷题没用,看后文) 期间,边玩边刷剧边复习,复习内容后面会说。 7月中,开始投简历,以小公司为主。开始断断续续的电面等等。 9月中,开始投最想去的一波公司(FLG等其他共10个左右吧)。 10月, 第一个onsite 小公司,fail。这段时间基本2周一个onsite,去了三次。 11月,确认offer,谈价钱,完事。
再说开始投简历之前的准备: 第一, 先搞明白自己到底想做什么。 最开始,在data scientist 和machine learning engineer 之间摇摆不定。MLE么,一来很火,钱多多了,还有也更偏技术点,我bf强推我走这条路。于是开始了刷题之路。 最后,没选择走mle,坚持了ds。一是虽然会编程,但是没上过正经的算法课,刷题基础不好,看题刷题很痛苦。二是,结合了自己的兴趣和能力,衡量下了之后觉得ds这种通才更适合我个人发展。个别公司给了面mle的机会,有的take了,结果发现自己水平也不够,有的就直接拒了。 关于ds 和mle的区别,每个公司定义不同,但可以参考这里:http://www.1point3acres.com/data-science-machine-learning-engineer-etc/ 小心提示下: linkedin的ds和mle不可以同时面,只能2选1。 Fb,apple可以同时面,面试结果互不影响。 第二, 列出公司列表,按自己想去不想去的程度,分出几个档次。然后倒着投。我还是建议把最想去的公司放倒最后。面试是一个学习进步的过程。前期不管是跟人聊自己的经历,proj也好,面tech聊ML的可以帮助自己找到知识点的查缺补漏等等,我觉得这对后来面大公司很有帮助。 第三, 心态调整。面试是个双向选择,互相平等选择的过程。表现在去面试的时候,要显得自信而不自傲。和面试官平等沟通。把面试当成去公司上班的一天,去和同事解决问题的一天就会轻松很多了。 【面试范围】 从简单到难,目前我观察ds面试主要有3块,一是处理数据的能力,flg都是靠考察sql能力为主;二是所谓的product analytics,这块比较虚了(很难复习),考察的内容很宽泛; 第三是统计,概率和machine learning,我复习的较少,认为基础还行吧,主要是上课学过。 根据我自己的情况,我花的时间大概是10% - 50% - 40% 吧。很多也在日常积累中。 【要不要刷题???】 我的回答,如果是面ds,真心不用。类似leetcode那种算法题,完全没考到! 如果你面的title是mle, 或者software engineer-data science/machine learning/data mining 这种的,一定一定要刷。
【Sql复习资料】 如果你连sql是啥都不知道,建议从这门课学起: https://lagunita.stanford.edu/courses/Engineering/db/2014_1/about 只看开头和relational database 两章足够。 https://community.modeanalytics.com/sql/tutorial/introduction-to-sql/
如果你已经很熟悉sql,日常工作中有用到,稍微复习下这些题目足够了: https://leetcode.com/problemset/database/
【product sense 复习资料】 1. 学习管理咨询那套解决问题的框架: 朋友推荐看的书是case in point, Case Interview Secrets (我都没看,没时间) 我推荐的是听后者作者的一个讲座,look over my shoulder,具体过8个case。每个case都有3个面试者,然后victor cheng分别点评,提出改进建议。这个我在喜马拉雅fm app上听的,免费: http://www.ximalaya.com/5269453/album/6414597/ 我一共听了3+次,开车听。 2. Product design: 我看了这个: https://classroom.udacity.com/courses/ud509
3. 一定要复习的是ab test. 我对ab test 是完全没任何工作经验的,所以从0 开始学习。我看了以下材料 (按顺序): 首先,系统学习下什么是ab test(个人完整看了3次以上,认真写了笔记,每次去onsite的飞机上都是复习这个笔记) https://classroom.udacity.com/courses/ud257 然后,我看了这个:A/B Testing for Business Analysts https://classroom.udacity.com/courses/ud979 看一次,主要理解了randomize design and paired design, 第一个课里没仔细讲的。还有这个课非常短,适合短时间看一下的。
最后上这个https://community.modeanalytics.com/sql/tutorial/sql-business-analytics-training/ 因为学习了很久,我一直的疑惑就是实际工作中到底怎么展开研究一个问题? 到底什么是正确答案?这个系列training解答了我很多疑惑,而且也结合了sql的处理,一定建议对每个图,打开右上角的view query in Mode,建立从提出问题到数据处理之间的联系。
4. 补充的资料,时间不够可以不看了的 Model building and validation: 理解所谓的QMV process, questionè model è validation. 以下这个课我是加速看的前3章。 https://classroom.udacity.com/courses/ud919
【stats, probability, machine learning 复习资料】 Stats 我复习的少,主要针对tests, hypothesis testing 看了一下这些: 1. Intro to Inferential Statistics:https://classroom.udacity.com/courses/ud201 主要看了estimate, hypo testing 这2个,其他也来不及了没看。 2. Penn state university的stats 414, 415. https://onlinecourses.science.psu.edu/stat414/ 哪里知识缺了就来补看一下。 【Probability】 我看了2个: 1. https://brilliant.org/courses/probability/ (强烈推荐) 我做了前面5个course的免费题目,看了解答。主要是Bayes rule, conditional probability, expection 这些概念的理解和灵活应用。 2. https://www.amazon.com/Practical-Guide-Quantitative-Finance-Interviews/dp/1438236662 一般是推荐给面quant的人的,我看了其中概率题的那章。忘记是哪个了。。。
【machine learning】 这部分我主动复习的很少了,在学校上过课+我bf是做这个方向的,他帮我复习了各个算法的情况,优劣势等等。具体到面试中,考察的内容比如是,提出什么问题,收集那些数据,用什么feature,哪些transformation, 如何data cleaning, 如何选模型?如何evaluate model etc。。。我自己写了个笔记,就写面到的,错过的,想到的知识点等等。要面试前会复习的。 如果对ml完全没经验,参考别人的帖子吧。。。
Overall, ds跳槽的面经推荐阅读: 这个面经写的非常好!!有很多我没cover的点,比如怎么写简历,linkedin, network,如何安排时间等等,请一定看一下~
【我是刚毕业怎么办?】 建议第一份工作也许不能是dream job ,但一定要有一些值得你去的点,是和你的dream job 相关联的。衡量工作的内容,想想以后写在简历上会不会添彩?比如你想做ds,但如果现在一份工作要求你天天用sas,真心建议别去了。如果你想做MLE, 但现在一个工作要求你用tableau 做reporting?也别去了。
最后,有问题的话麻烦回帖,大家一起来讨论。不要私信。如果你非要私信我我也不回的,请尊重我的要求。

supermuyes 发表于 12/10/2017 11:03:18 PM

超级感激楼主分享!!!!
l
luzhenshu
213 楼
++++++++++++++++++++
c
cherry-nancy
214 楼
Thanks for sharing! 正在考虑这条路
c
cc2222
215 楼
谢谢分享💪
a
akara1101
216 楼
Mark,谢谢楼主!
S
SusieMDA
217 楼
妥妥的干货啊 markmark 多谢分享
f
fashionlate
218 楼
congratulations! mark mark
i
ivy_best
219 楼
听lz的描述,是不是data scientist 偏product analytics的职位啊?
220 楼
好文,谢谢LZ
朵朵多多
221 楼
mark~~~~~~~~~~~~
c
cherry-nancy
222 楼
听lz的描述,是不是data scientist 偏product analytics的职位啊?
ivy_best 发表于 12/13/2017 2:29:27 AM

我感觉也是,好像不是普遍意义上的data scientist
l
luoyuwei
223 楼
mark mark
m
mianbaohello
224 楼
谢谢楼主MM的分享!非常有用!
w
wingofdream
225 楼
Cong! 沾沾喜气
t
timeflies2015
226 楼
一定记下
要做最坚强的泡沫
227 楼
marrrrrk~
烦恼很多
228 楼
恭喜恭喜
f
foryoursmile
229 楼
楼主好人!祝新工作顺利!
m
meshell
230 楼
从楼主写的帖子可以看出思路清晰 很不错 恭喜
w
winnizhang
231 楼
回复 1楼supermuyes的帖子

厉害,谢谢楼主分享。以楼主为榜样,加油
飞去热带岛屿游泳
232 楼
Mark, 楼主厉害!
麦穗麦
233 楼
Mark谢谢楼主
y
yemao
234 楼
谢谢mm, 很实在的信息。
蓝色柚子
235 楼
brilliant那个怎么只有第一部分是免费的了,第二节就要开始收费了 = =
f
forever88
236 楼
强贴mark!恭喜mm!超赞的总结和分享!!!
来回报论坛了,说说自己近期面试data scientist 的经验。
背景:ms systems engineering + 2yr work experience in a small (not start-up) company, daily responsibility includes data analysis, modeling, machine learning, some text mining, some big data analysis. 不做任何reporting and visualization,也没有所谓的product analytics (experiment design),和flg要求的有较大差距。 Skill set (括号代表非常真实的工作时间分布): r (70%), sql(10%), python(10%), spark (specifically, pySpark, 10%). 坛里一定有很多比我牛的人啦,我只是新人一个。在这里我只想给出一个非牛人,但挺努力有目标的人会怎么准备。目标是想去湾区做ds。
先说结果: 投了40家左右 Offer: fb, google Rej: Linkedin and a startup (onsite rej) twitter (after 2 tech interview) Apple (不同组跟4个hm聊过,最终有被拒也有withdraw) Uber (failed first tech interview) Airbnb (failed on data challenge) 还有好多其他公司,有的跟hr聊聊发现不合适,有,有的默拒,有的好歹还告诉你一下被拒了。 总结下:就是太小的公司,投了也白投,直接简历悲剧。我大概投了25+小公司,只3个好歹给我电面。其他就是没消息。 所以觉得自己背景还不错的朋友,建议安排面试的时候,从不太想去的中/大公司开始,到自己最想去的大公司。找小公司成本很高, 投的时候麻烦而且又没面试。
【时间线】 17年2月,开始上JIUZHANG算法初级课,刷题,断断续续到6,7月吧。(***如果找ds,刷题没用,看后文) 期间,边玩边刷剧边复习,复习内容后面会说。 7月中,开始投简历,以小公司为主。开始断断续续的电面等等。 9月中,开始投最想去的一波公司(FLG等其他共10个左右吧)。 10月, 第一个onsite 小公司,fail。这段时间基本2周一个onsite,去了三次。 11月,确认offer,谈价钱,完事。
再说开始投简历之前的准备: 第一, 先搞明白自己到底想做什么。 最开始,在data scientist 和machine learning engineer 之间摇摆不定。MLE么,一来很火,钱多多了,还有也更偏技术点,我bf强推我走这条路。于是开始了刷题之路。 最后,没选择走mle,坚持了ds。一是虽然会编程,但是没上过正经的算法课,刷题基础不好,看题刷题很痛苦。二是,结合了自己的兴趣和能力,衡量下了之后觉得ds这种通才更适合我个人发展。个别公司给了面mle的机会,有的take了,结果发现自己水平也不够,有的就直接拒了。 关于ds 和mle的区别,每个公司定义不同,但可以参考这里:http://www.1point3acres.com/data-science-machine-learning-engineer-etc/ 小心提示下: linkedin的ds和mle不可以同时面,只能2选1。 Fb,apple可以同时面,面试结果互不影响。 第二, 列出公司列表,按自己想去不想去的程度,分出几个档次。然后倒着投。我还是建议把最想去的公司放倒最后。面试是一个学习进步的过程。前期不管是跟人聊自己的经历,proj也好,面tech聊ML的可以帮助自己找到知识点的查缺补漏等等,我觉得这对后来面大公司很有帮助。 第三, 心态调整。面试是个双向选择,互相平等选择的过程。表现在去面试的时候,要显得自信而不自傲。和面试官平等沟通。把面试当成去公司上班的一天,去和同事解决问题的一天就会轻松很多了。 【面试范围】 从简单到难,目前我观察ds面试主要有3块,一是处理数据的能力,flg都是靠考察sql能力为主;二是所谓的product analytics,这块比较虚了(很难复习),考察的内容很宽泛; 第三是统计,概率和machine learning,我复习的较少,认为基础还行吧,主要是上课学过。 根据我自己的情况,我花的时间大概是10% - 50% - 40% 吧。很多也在日常积累中。 【要不要刷题???】 我的回答,如果是面ds,真心不用。类似leetcode那种算法题,完全没考到! 如果你面的title是mle, 或者software engineer-data science/machine learning/data mining 这种的,一定一定要刷。
【Sql复习资料】 如果你连sql是啥都不知道,建议从这门课学起: https://lagunita.stanford.edu/courses/Engineering/db/2014_1/about 只看开头和relational database 两章足够。 https://community.modeanalytics.com/sql/tutorial/introduction-to-sql/
如果你已经很熟悉sql,日常工作中有用到,稍微复习下这些题目足够了: https://leetcode.com/problemset/database/
【product sense 复习资料】 1. 学习管理咨询那套解决问题的框架: 朋友推荐看的书是case in point, Case Interview Secrets (我都没看,没时间) 我推荐的是听后者作者的一个讲座,look over my shoulder,具体过8个case。每个case都有3个面试者,然后victor cheng分别点评,提出改进建议。这个我在喜马拉雅fm app上听的,免费: http://www.ximalaya.com/5269453/album/6414597/ 我一共听了3+次,开车听。 2. Product design: 我看了这个: https://classroom.udacity.com/courses/ud509
3. 一定要复习的是ab test. 我对ab test 是完全没任何工作经验的,所以从0 开始学习。我看了以下材料 (按顺序): 首先,系统学习下什么是ab test(个人完整看了3次以上,认真写了笔记,每次去onsite的飞机上都是复习这个笔记) https://classroom.udacity.com/courses/ud257 然后,我看了这个:A/B Testing for Business Analysts https://classroom.udacity.com/courses/ud979 看一次,主要理解了randomize design and paired design, 第一个课里没仔细讲的。还有这个课非常短,适合短时间看一下的。
最后上这个https://community.modeanalytics.com/sql/tutorial/sql-business-analytics-training/ 因为学习了很久,我一直的疑惑就是实际工作中到底怎么展开研究一个问题? 到底什么是正确答案?这个系列training解答了我很多疑惑,而且也结合了sql的处理,一定建议对每个图,打开右上角的view query in Mode,建立从提出问题到数据处理之间的联系。
4. 补充的资料,时间不够可以不看了的 Model building and validation: 理解所谓的QMV process, questionè model è validation. 以下这个课我是加速看的前3章。 https://classroom.udacity.com/courses/ud919
【stats, probability, machine learning 复习资料】 Stats 我复习的少,主要针对tests, hypothesis testing 看了一下这些: 1. Intro to Inferential Statistics:https://classroom.udacity.com/courses/ud201 主要看了estimate, hypo testing 这2个,其他也来不及了没看。 2. Penn state university的stats 414, 415. https://onlinecourses.science.psu.edu/stat414/ 哪里知识缺了就来补看一下。 【Probability】 我看了2个: 1. https://brilliant.org/courses/probability/ (强烈推荐) 我做了前面5个course的免费题目,看了解答。主要是Bayes rule, conditional probability, expection 这些概念的理解和灵活应用。 2. https://www.amazon.com/Practical-Guide-Quantitative-Finance-Interviews/dp/1438236662 一般是推荐给面quant的人的,我看了其中概率题的那章。忘记是哪个了。。。
【machine learning】 这部分我主动复习的很少了,在学校上过课+我bf是做这个方向的,他帮我复习了各个算法的情况,优劣势等等。具体到面试中,考察的内容比如是,提出什么问题,收集那些数据,用什么feature,哪些transformation, 如何data cleaning, 如何选模型?如何evaluate model etc。。。我自己写了个笔记,就写面到的,错过的,想到的知识点等等。要面试前会复习的。 如果对ml完全没经验,参考别人的帖子吧。。。
Overall, ds跳槽的面经推荐阅读: 这个面经写的非常好!!有很多我没cover的点,比如怎么写简历,linkedin, network,如何安排时间等等,请一定看一下~
【我是刚毕业怎么办?】 建议第一份工作也许不能是dream job ,但一定要有一些值得你去的点,是和你的dream job 相关联的。衡量工作的内容,想想以后写在简历上会不会添彩?比如你想做ds,但如果现在一份工作要求你天天用sas,真心建议别去了。如果你想做MLE, 但现在一个工作要求你用tableau 做reporting?也别去了。
最后,有问题的话麻烦回帖,大家一起来讨论。不要私信。如果你非要私信我我也不回的,请尊重我的要求。

supermuyes 发表于 12/10/2017 11:03:18 PM
d
dongy
237 楼
多谢分享!很实用!
s
sesshou
238 楼
Mark thank you Li
c
cclmm
239 楼
Mark Mark 感谢楼主
Y
YAQINGHUO
240 楼
好贴!
s
supermuyes
241 楼
感谢分享! 我跟你情况差不多,但是之前2年多的工作比你水~ tech 在之前的工作中用的比你水很多~统计master+3years working experience 
一个偶然机会,拿到一个面试(one of top 10 in bay area) ,SQL 这一轮面试过了,准备要面 Product sense/problem solving 了。在准备,能多分享一些这阶段的面经嘛? 比如很多类似的问题就是FB 页面要加一个这样的feature, what you think? 思路大概有,但是不知道如果做matrix design, 如果去evludate 这个feature 具体应该考虑到什么方向 ~

如果拿到offer, 我一定也像楼主一样,把自己(一定比你水)的申请分享给大家~~~
2018_Lin 发表于 12/12/2017 2:22:19 PM

Product sense/problem solving 推荐的材料我也都在文中提到了啊。我也就是看那些了,还有就是一亩三分地和glassdoor上的面经,都有很多人回复讨论的,你仔细琢磨。大概回答的话,就是要有框架,比如我要查看这3个方面,1,2,3 是什么。比如1,我的假设是***,我要收集这样的数据看这个metric,如果这个metric这样走,我决定怎么做。如果那样,我怎么做。。。等等。我文里推荐的这个:
https://community.modeanalytics.com/sql/tutorial/sql-business-analytics-training/
就是回答你的问题啊!!!自己去看吧
s
supermuyes
242 楼
听lz的描述,是不是data scientist 偏product analytics的职位啊?
ivy_best 发表于 12/13/2017 2:29:27 AM

是。我也投了其他偏ml的职位,没面上。比如apple的mle, amazon的alexa ds(nlp 方向) 其他小公司我也面了几家,ds感觉面试就这3大块,还有什么漏了么?
h
hl99305
243 楼
请问楼主了解data engineer方向吗,需要刷题么
s
supermuyes
244 楼
请问楼主了解data engineer方向吗,需要刷题么
hl99305 发表于 12/26/2017 11:46:11 AM


了解一点。。我所知fb uber salesforce 这些是一定要考算法题的
L
LuckyJecci
245 楼
强mark!!
2018年好好充电!
L
LuckyJecci
246 楼
谢谢分享,请问自学DS的需要去考个什么certifcate或者degree吗?那些degree或者certificate有用?
babybear23 发表于 12/11/2017 1:41:13 PM
v
vitamincc
247 楼
mm,你还记得modeling和statistics里面会问哪些方面的问题吗?
之前看到一个帖子会问t test和z test,惊了一身汗,好细啊,现在不都是上model吗?
R
RunForrestRun
248 楼
mark!!!!!!!!!!!
J
Joziezz
249 楼
楼主,我现在就是坑爹的天天写SAS,超级想跳坑。。想问问面DS的话,R和python需要准备么,还是只要会SQL就够了?如果需要准备R和python,有什么快速上手搞定面试的建议么?
j
jiandanshenghuo
250 楼
mark mark 恭喜楼主, 收藏了
a
addie566
251 楼
坐等更新。多谢分享。
t
tomorrowlj
252 楼
楼主写得好详细,辛苦了!
T
TinaTao
253 楼
mark,赞!
2
2good2betru
254 楼
这算是基本概念吧,我觉得复习统计理论的时候这些基础的一定都要过一遍,毕竟你也不知道面试官会问什么

mm,你还记得modeling和statistics里面会问哪些方面的问题吗?
之前看到一个帖子会问t test和z test,惊了一身汗,好细啊,现在不都是上model吗?

vitamincc 发表于 1/1/2018 7:24:00 PM
l
littlecherry829
255 楼
mark mark mark
H
Happyapple123
256 楼
谢谢楼主
l
lemonxing
257 楼
好贴 一定收藏 ---发自Huaren 官方 iOS APP
S
SusieMDA
258 楼
再度回来感谢楼主推荐的资料。实在是太太太有用了。强烈推荐buiness sense里面的 udacity 和mode网站
d
daisystone
259 楼
谢谢 分享!
老猫钓鱼
260 楼
MARK一下
e
elias
261 楼
肯定要


楼主,我现在就是坑爹的天天写SAS,超级想跳坑。。想问问面DS的话,R和python需要准备么,还是只要会SQL就够了?如果需要准备R和python,有什么快速上手搞定面试的建议么?

Joziezz 发表于 1/3/2018 11:58:00 AM
l
laura3231
262 楼
mark thanks mm
胖妞
263 楼
牛牛牛!!!
耳又易物
264 楼
谢谢楼主分享,

面试的三块总结的超级好。
M
McDullna
265 楼
mark 谢谢分享~
j
jessie329958
266 楼
赞一个!
c
cloverhome
267 楼
谢谢楼主分享!
y
yswang9024
268 楼
恭喜mm!超赞的总结和分享!
幸福家园
269 楼
Markmark 祝贺mm
h
hwamama
270 楼
Mark mark
r
runningcindy
271 楼
楼主大概是多久有消息呢?今天也面了FB。。感觉题目不是很难,但是白板写code没适应,有点没答好。。。
s
sholo
272 楼
强贴留名
感谢mm分享
L
LittleSnowBall
273 楼
总结很到位!和我棒朋友prepare的过程很相似!
A
AprilBlue
274 楼
mark
l
laizhe
275 楼
thank mark
f
fairy.xj
276 楼
Mark!
赤橙黄绿
277 楼
回复 1楼supermuyes的帖子

谢谢妹妹分享,我也收到 这几个公司interview 了, 刚刚过了第一轮。我不像妹妹系统的学过, 就是上了一个Boot Camp, 之后就做reporting的工作了, 对SQL和Python比较熟练。 Machine learning 在 Boot Camp快速的学了一些, 也做了几个project,我想问问妹妹有没有什么学习资料, 可以总结各个算法的情况,优劣势等等,如何选模型?如何evaluate model etc。。。我基本上了解各种算法和优缺点,参数的调整。 但还是觉得多看看别人的总结, 可以快速加强一下。
还有妹妹面试时需要白板coding吗? 尤其是 Google 和Facebook 家?用Python吗?
最后一个问题,关于Hadoop, Scala 或是Spark, G 和 F 家要求这些技能吗? 我粗略的看了一下, 但没有用过。
小野猫
278 楼
感谢楼主
s
supermuyes
279 楼
回复 1楼supermuyes的帖子

谢谢妹妹分享,我也收到 这几个公司interview 了, 刚刚过了第一轮。我不像妹妹系统的学过, 就是上了一个Boot Camp, 之后就做reporting的工作了, 对SQL和Python比较熟练。 Machine learning 在 Boot Camp快速的学了一些, 也做了几个project,我想问问妹妹有没有什么学习资料, 可以总结各个算法的情况,优劣势等等,如何选模型?如何evaluate model etc。。。我基本上了解各种算法和优缺点,参数的调整。 但还是觉得多看看别人的总结, 可以快速加强一下。
还有妹妹面试时需要白板coding吗? 尤其是 Google 和Facebook 家?用Python吗?
最后一个问题,关于Hadoop, Scala 或是Spark, G 和 F 家要求这些技能吗? 我粗略的看了一下, 但没有用过。
赤橙黄绿 发表于 2/22/2018 3:22:00 AM


ml 我自己总结过但是是笔记没法share了。
白板coding flg都有,但主要是sql类的数据处理,你用r 的dplyr plyr 包里的方程写, 或者python pandas里的语法写应该也都可以。都不是码农面的算法题。
至于hadoop spark scala 这些,flg三家ds完全不care
s
supermuyes
280 楼
楼主大概是多久有消息呢?今天也面了FB。。感觉题目不是很难,但是白板写code没适应,有点没答好。。。
runningcindy 发表于 1/30/2018 8:37:57 PM


一周左右
m
michelle09
281 楼
谢谢mm分享。写得真好
赤橙黄绿
282 楼
回复 279楼supermuyes的帖子

谢谢妹妹回复, 太赞了。 我是转行的,之前Google也给了interview, 我过了一轮后就不敢面了,主动说还没ready, ready了再接着面, 觉得自己是半吊子, 能找个工作就行了,太难的我肯定过不去, 还得刷题啥的。 看了妹妹的分享, 感觉如果按照妹妹的方略去准备,还是有可能的。 我骑驴找马一圈后, 发现越是Google 和Facebook这样的顶尖公司, 就更容易给人面试机会, 我们村的Data Scientist opening 只要有好多年工作经验的, 没经验的简历看都不看, 这才激励我好好准备, 直接去面更好的公司。
W
Whitechalk
283 楼
感谢分享
我不知起什么名
284 楼
谢谢楼主的分享,太宝贵了!

目前正在找工作,想找DATA ANALYST,本人背景跟大家比可能太水了,国内本科硕士都是英语专业,来美在一州立大学读了engineering management 的master,无美工作经验,在国内当过老师,在线上教育创业公司待过一年多。
去年刚刚Master毕业,自学了点SQL,和udacity上的data analysis nano degree的课程(这个课有两个term,刚学完第一个term,有SQL, Python),在学校里学了一点R

看了楼主的经验分享,觉得自己要学的东西太多太多了
想请教一下,
1 如果准备DA的话,lz提到的product analytics方面也需要准备吗?
2 有的JD里也有提到data modeling,想问一下,一些最基本的数据模型是哪些?对于DA来说,建模掌握到哪个深度就可以了?
3 DA刷题有用吗?有没有可推荐的刷题网站
4 针对于我的背景,欢迎拍砖(建议):D
e
eling820
285 楼
强烈mark,谢谢lz
想不出用户名
286 楼
谢谢楼主!
e
eling820
287 楼
'这个面经写的非常好!!有很多我没cover的点,比如怎么写简历,linkedin, network,如何安排时间等等,请一定看一下'

这个面经点进后打不开,麻烦楼主可以贴一下帖子标题吗?谢谢!
C
Cwang14
288 楼
赞!写得很实在
d
divajia
289 楼
感谢mm。最近打算转行data scientist。太有用了!
Z
ZHUZI
290 楼
mark mark
x
xiaofengxian
291 楼
谢谢楼主!
艾薇兰琪
292 楼
Mark!
k
kiwi777
293 楼
先mark了
y
yogacat
294 楼
谢谢楼主分享!一直在找Business Analytics方向,头绪很乱,打算从楼主推荐的学习资料里整体学习起来!
我不知起什么名
295 楼
谢谢楼主分享!一直在找Business Analytics方向,头绪很乱,打算从楼主推荐的学习资料里整体学习起来!
yogacat 发表于 3/14/2018 7:06:23 PM


我也在这找BA方向的,一起学习呀?
z
zyhbwh
296 楼
Thanks for sharing!
z
zylxsj
297 楼
恭喜
z
zylxsj
298 楼
膜拜一下
d
domon59
299 楼
mark, 赞lz干货分享
C
Clitysheer
300 楼
非常励志!谢谢楼主分享!!!