回馈论坛,分享下自己2个月内找到DS工作的经验和资料

匿名
楼主 (北美微论坛)
本帖最后由 匿名 于 2019-9-19 22:48 编辑

分享下楼主2个月内全职在家找到DS工作的一些经验总结,工作日的时候平均每天花7个小时在准备,周末带娃没怎么复习了。希望能让大家少走弯路,节省时间,有个清晰的准备方向和提供些有用的资料。介绍下背景:2年多的DS工作经验,主要做的analytics。 现在正在FLAG中的某家team match,攒人品求一切顺利,求H1B名额能顺利转走并激活。找工作期间受到很多素不相识的同胞的帮助,希望大家团结起来,互相帮助。论坛不能上传资料,有兴趣的自己去一亩三分地下哈,不需要大米。 [url=https://www.1point3acres.com/bbs/forum.php?mod=viewthread&tid=551582&page=1&extra=#pid8082039]https://www.1point3acres.com/bbs/forum.php?mod=viewthread&tid=551582&page=1&extra=#pid8082039[/url]
这次找工作主要准备了下面5个方向:
product sense SQL/python stats & probability AB test & hypo testing machine learning
第一轮复习: Product sense: 这部分需要很清楚各大公司的goal和盈利模式,他们看重的一些KPI,比如FB/Google主要靠广告收入,credit karma靠成功推荐信用卡,游戏公司根据是平台还是自主开发游戏关注的点又不一样了。熟悉各种metrics,对于一些问题能根据business goal提出最能衡量它的指标。 这类问题的套路一般就是问各种clarification question,不要自己assume(也有例外的公司,我有个onsite就问了面试官各种问题,被面试官说你要会自己assume呀,我们工作中不可能有人给你各种建议提示),然后明白business goal -> metrics -> hypothesis, like it will improve blah blah -> collecting data -> analysis data -> conclusion/suggestion
书:cracking the pm interview 书:A Collection of Data Science Take-Home Challenges 里的 product questions部分 一亩三分地的数据科学Analytics面试精选24题
SQL/Python: 主要复习了SQL一些语法和常用的window function,然后在leetcode做了几道题, Python主要就是复习了pandas这个包,把一些常用的函数自己琢磨了遍。自己写了个文件,涵盖了我面试过程中遇到的所有问题了。都无偿分享给大家,攒人品中。 还刷了Leetcode easy 和medium的算法题,主要是array, string部分。这个帖子也很有帮助。
[url=https://medium.com/jbennetcodes/how-to-rewrite-your-sql-queries-in-pandas-and-more-149d341fc53e]https://medium.com/jbennetcodes/how-to-rewrite-your-sql-queries-in-pandas-and-more-149d341fc53e[/url]
Stats & probability 主要是把以前上的课拿出来复习了下,这部分主要考贝叶斯和全概率公式,有些公司会考正态分布二项分布,举个例子:比如投硬币,硬币次数投多了就根据大数定理正态分布啦,然后会问你下投的次数越多正态分布曲线怎么变化?还有投骰子。不会直接问你些概念性的东西,但是基本功要牢,问的时候能明白面试官想要考你什么。推荐个可汗学院的统计课,自己觉得挺不错的。还有个做题网站。 [url=http://open.163.com/special/Khan/khstatistics.html]http://open.163.com/special/Khan/khstatistics.html[/url] [url=https://brilliant.org/]https://brilliant.org/[/url]
AB test & hypo testing 主要看了udacity这个,但是只能说这个是入门级的AB test,很基础但是也很重要,一定要看明白,不明白重复看直到明白了,然后就可以进入第二重境界啦,看高深的AB test。onsite面试过程中AB test环节会问的很深入,基本不会出现udaciy那么简单的问题。 AB test 一般的套路就是 understand business goal -> define metrics -> hypo -> design test plans, sample size? Duration? Regions for AB testing? -> launch experiment -> sanity check and analyze result -> conclusion/suggestion
[url=https://classroom.udacity.com/courses/ud257]https://classroom.udacity.com/courses/ud257[/url] Notes:[url=http://rpubs.com/superseer/ab_testing]http://rpubs.com/superseer/ab_testing[/url]
machine learning 我平时不做模型,所以花了大部分时间在准备这块内容上。建议从linear regression开始准备,基本功一定要打牢,linear regression是最简单的machine learning模型,把这个看懂了后面的其他模型或者一些术语就会融会贯通。面试过程中会问些LR的assumption,logistic regression的loss function,maximum likelyhood function,overfiting怎么办,不会直接问你regularization,但是会隐藏在其他问题里。
强烈推荐这个课,老师讲的非常的清楚非常的好。 [url=https://www.coursera.org/learn/ml-regression/home/welcome]https://www.coursera.org/learn/ml-regression/home/welcome[/url] 上完后可以上Andrew Ng的machine learning,推荐cousera的这个,YouTube那个不大推荐,太花时间。建议认真看完这两个。 [url=https://www.coursera.org/learn/machine-learning/home/welcome]https://www.coursera.org/learn/machine-learning/home/welcome[/url]
第二轮复习: product sense:主要就是看地里的面经和一些博客。还有自己开大开下脑洞。。。
AB test & hypo testing:也是看博客了,你会发现AB test真的是水很深,比如control和test的samples size是90% 和10% 分布,同时测10个metric而不是一个,又要改什么?AB 测试需要注意的事项和assumption是什么? novelty effect是隐藏在这部分很重要的考点,怎么消除?违反了什么assumption?等等。加几个我平时看AB test的网站: [url=https://towardsdatascience.com]https://towardsdatascience.com[/url] [url=https://medium.com]https://medium.com[/url] [url=https://www.optimizely.com]https://www.optimizely.com[/url] 这个帖子不错~ [url=https://towardsdatascience.com/a-summary-of-udacity-a-b-testing-course-9ecc32dedbb1]https://towardsdatascience.com/a-summary-of-udacity-a-b-testing-course-9ecc32dedbb1[/url] machine learning 主要就是看面经了。自己也总结了些问题,希望能帮到大家,都无偿分享给大家了,攒人品。 [url=https://rpubs.com/JDAHAN/172473]https://rpubs.com/JDAHAN/172473[/url]
最后就是建议大家python的pandas和leetcode得练习下,有些公司的技术面就是全程考leetcode算法(没要求bug free和最优解法,有时候会给你些follow up question让你不断优化),或者让我用python把SQL的解法写一遍,完全就是技术的,这个环节真正花在考AB test和product sense的时间不多。我5个onsite 有2个公司面了我算法,3个公司面到了用python把SQL写一遍,有些公司不会提前跟你说考什么。想要比别人做得更好,那只能是要多付出,做最好的准备。还有回答问题一定要有条理,一步一步说,解释清楚,不要思维跳跃太快,你自己知道所有的细节,跳过了没觉得有什么问题,但是别人不知道,面试官跟不上会觉得你很难交流沟通,我挂掉的面试几乎都是同一个毛病,communication!一定不要忽略这些soft skills。
找工作的过程中,最重要的是心态一定要及时的摆正。这个过程非常的痛苦,道路是未知的,我自己也经常受不了的大哭,觉得自己怎么这么差劲,要找不到工作了,一直压力很大,不断怀疑自己。还有你投了很多的简历,却没有面试,有了面试,明明面的不错却没有onsite或者技术面被拒了,onsite也不错却被拒,或者onsite太晚了连备胎机会都没有。这并不代表你不行你不优秀,只能说运气不好。一般公司的DS坑很少,他们想要招有相关经验的人,有strong communication的candidate。还有你每轮面试其实都是备胎而已或者连备胎机会都没有,很多面着面着就收到position closed或者没有然后了之类的。心态一点要好,尽人事听天命。
S
SssssQ
2 楼
谢谢楼主分享
M
Miss小贝壳
3 楼
多谢楼主分享!
匿名
4 楼
太牛了太牛了太牛了太牛了
m
mpan4
5 楼
牛批啊哈哈哈
姬太祖
6 楼
牛牛牛牛牛
吃坚果大王
7 楼
请问楼主读的数据分析的研究生嘛
l
lyangkelly
8 楼
谢谢楼主分享
W
Winnie王吖吖
9 楼
学习学习学习
o
oliva
10 楼
本帖最后由 oliva 于 2019-9-19 21:13 编辑

楼主太棒了
J
JULLLLY
11 楼
多谢楼主分享
o
oliva
12 楼
楼主怎么筛选leetcode里的 array和string的题呢
o
oliva
13 楼
楼主怎么筛选leetcode里的 array和string的题呢
匿名
14 楼

请问楼主读的数据分析的研究生嘛

数据分析一般做不了ds,ds一般是cs或者stat,math,需要很强的数学建模各统计能力,数据分析一般不做预测模型,做做数据清洗,简单的manipulation给BA准备数据源这样,ds和ba应该是da的上游
F
Faye0809
15 楼
牛牛牛牛牛
小仓鼠
16 楼
牛牛牛牛牛
吃坚果大王
17 楼

数据分析一般做不了ds,ds一般是cs或者stat,math,需要很强的数学建模各统计能力,数据分析一般不做预测模 ...

感谢回复字数
k
katrina_ss
18 楼
感谢楼主分享!!!!!求好运!!
开心姐
19 楼
楼主太棒了!!
匿名
20 楼

请问楼主读的数据分析的研究生嘛

我是统计硕士
匿名
21 楼

楼主怎么筛选leetcode里的 array和string的题呢

有tag可以点
匿名
22 楼

数据分析一般做不了ds,ds一般是cs或者stat,math,需要很强的数学建模各统计能力,数据分析一般不做预测模 ...

这个不一定哈,现在的DS其实分很多track的,我是analytics方向,也有做model研究的,也有做算法放进production的。
糖糖1109
23 楼
虽然找到工作了,但是可以留着以后换工作用,666
匿名
24 楼

虽然找到工作了,但是可以留着以后换工作用,666

是的是的,我那些资料以后换工作的话再更新
喵喵唔
25 楼
赞,超级厉害的楼主
小宝
26 楼
赞赞赞赞赞赞
窗外有风吹过
27 楼
真是好有毅力!赞一个!
冰淇淋做的云May
28 楼
Amazon
d
ddddddddeng
29 楼
太感谢了 正在读DS的硕士,留着以后找工作刷
心有月亮
30 楼
666666666
无可厚非
31 楼
prerequisites ?
O
Oasis_Tangs
32 楼
感谢分享!!好厉害!
匿名
33 楼
想请教这种工作年薪多少呀
匿名
34 楼
原来Andrew这么有名的吗?很多人都在推荐他的课. 早知道以前跟他吃饭的时候就先要个签名了!
大草莓
35 楼
牛牛牛牛牛
k
kabishou
36 楼
赞赞赞!非常有帮助,谢谢楼主~
K
Kim坷垃
37 楼
感谢lz,最近也是在不停的找工作,感觉自己很废柴
l
lemony
38 楼
棒!!!!
K
Kellybaby86
39 楼
赞赞赞赞赞
l
lemonyujia
40 楼
谢谢分享~ds确实坑少而且近来对经验的要求也越来越高,希望生完娃之后也可以像楼主一样快快找到工作!祝工作顺利!
匿名
41 楼
楼主太厉害了!牛牛
y
yyy345
42 楼
.
璐璐UMD
43 楼
/
匿名
44 楼

prerequisites ?

我有2年工作经验,统计硕士。本科非统计的
匿名
45 楼

想请教这种工作年薪多少呀

base 10几万,还有股票,具体多少根据谈判本事了
匿名
46 楼

原来Andrew这么有名的吗?很多人都在推荐他的课. 早知道以前跟他吃饭的时候就先要个签名了! ...

哈哈,他的课讲的好。其他方面做的咋样就不清楚了
晓晓轩
47 楼
不是我专业看不太懂,还是觉得lz很棒!
Y
YukiHana
48 楼
楼主,想请教一下,如果找DA方面的entry level的工作,有哪些DS的技能不是很需要呢?感谢感谢
葫芦娃123
49 楼
楼主真棒!希望自己也有这样的好运
哗啦啦wush
50 楼
lz太牛了!!
o
oliva
51 楼

有tag可以点

谢谢楼主,祝新工作顺利
w
wli58
52 楼
厉害了 恭喜!
匿名
53 楼

楼主,想请教一下,如果找DA方面的entry level的工作,有哪些DS的技能不是很需要呢?感谢感谢 ...

这个不好说,看行业和具体公司。非互联网的话不需要ab test, python算法,互联网也看具体公司,因为DA在有些公司title是DS,做的其实一样的活。我有2个DA的技术面考算法哦,也有那种DS面试就全是问简历,一些case study。你也不知道你会投什么样的公司,还是多做准备吧,不要偷懒哦!有备才能无患。
长了眼袋的黄桃
54 楼
wo wo qo qo wo wo w
i
iamreneehuang
55 楼
本科读会计还可以学DS吗,好奇
匿名
56 楼

本科读会计还可以学DS吗,好奇

当然可以了,只要有那些skill sets,很多生物的转DS呢。
e
elizabeth1121
57 楼
Q
Q_kiiii
58 楼
感谢楼主分享啊!最近也想转行做BA/DA 发现要准备的东西好乱好杂,lz是怎么做到一个一个清清楚楚的把该学的skill都给学好了呢
m
mayzh
59 楼
机会总会眷顾有准备的人。谢谢分享很棒
匿名
60 楼

感谢楼主分享啊!最近也想转行做BA/DA 发现要准备的东西好乱好杂,lz是怎么做到一个一个清清楚楚的把该学的 ...

楼主有2年工作经验大概知道考什么
x
xiiiiii
61 楼
太感谢啦!!收藏了!!
慢慢看!
长了眼袋的黄桃
62 楼
Wowowoowow
长了眼袋的黄桃
63 楼
OI wowoowoww
强哥g
64 楼
赞赞赞赞赞
长了眼袋的黄桃
65 楼
Wowoowowowo
I
Ifdream
66 楼
非常感谢分享!祝工作顺利
t
todayforlin
67 楼
牛逼 五个字
鹅鹅鹅EEE
68 楼
牛!思路真清楚!
匿名
69 楼
楼主拿到offer了?我两轮面试通过,team match也成功了,最后也没拿到offer
w
wendymm
70 楼
赞楼主分享
o
oliva
71 楼
楼主可以分享下怎么刷leetcode的算法题吗?要先上算法课吗?我刷leetcode easy题一题要一小时 感觉很费劲
匿名
72 楼

楼主拿到offer了?我两轮面试通过,team match也成功了,最后也没拿到offer ...

为啥没offer?别吓唬我
匿名
73 楼

楼主可以分享下怎么刷leetcode的算法题吗?要先上算法课吗?我刷leetcode easy题一题要一小时 感觉很费劲 ...

先复习一下数据结构。
匿名
74 楼

为啥没offer?别吓唬我

HQ那关没过
匿名
75 楼

HQ那关没过

没有坑吗?我有个室友没有坑等到下一年入职的
o
oliva
76 楼

先复习一下数据结构。

有数据结构的资料推荐吗?谢谢楼主
匿名
77 楼

没有坑吗?我有个室友没有坑等到下一年入职的

不是,没有原因,team match都通过了
匿名
78 楼

有数据结构的资料推荐吗?谢谢楼主

网上一搜一大把,udemy搜下python的数据结构。我2年前看的
匿名
79 楼

不是,没有原因,team match都通过了

那很奇怪哦,都会说原因的,通过hiring committee后问题都不大了。你这个不像是大厂的作风
匿名
80 楼

那很奇怪哦,都会说原因的,通过hiring committee后问题都不大了。你这个不像是大厂的作风 ...

Google recruiter说明年再面一次就没问题了
匿名
81 楼

Google recruiter说明年再面一次就没问题了

我室友也是谷歌的,多等了一年才入职。现在秋招开始放出很多坑了