分享文科博士华丽转身Data Scientist经验的总结,希望给大家帮

a
abceamanda
楼主 (未名空间)


我朋友Hua在线分享了她从文科(社会学)博士转行为Comcast数据科学家的成功经验。分享会历时1个小时30分钟,Hua就学习、面试、时间分配等内容和大家进行了热烈的讨论。

分享会文字版内容整理如下,供同学们参考、学习。
H: Hua

Q: 学员提问

T: 主持人

T: Hua是我们1对1的学员,她以前是社会学的本硕博。毕业后一直从事社会学的工作,现在转到Comocast做Data Scientist。你之前做的是社会学的什么方向?

H:我的方向是研究移民。社会学是研究一些社会现象、社会问题,分为定量研究或者
定性研究,我是做定量研究的。

T:定量研究应该和数据科学比较相关。文科领域这种定量研究多吗?

H:在美国这类研究还是挺多的。学位科学至少在美国,定量是传统,定性相对来说少
一些。比如哲学心理学这一类学科,也有类似的区分。哲学不是特别清楚,但是心理学强调定量研究的程度,比社会学还要高些。

T:讲讲对于转行前找工作的体会?

H:我毕业后是在当地学区做数据分析,大概有10年。08年毕业,当时工作也不好找,
有专业相关的工作就过去了。当时没有想太多,因为身份的问题,而且对找工作也没太明确的想法,主要在本专业之内找。但其实从我工作以后,到转行之前一直都有不间断地投一些简历,但大部分职位结果都是石沉大海,也有过几个电话面试,基本上聊过以后就没下文了。

T:当时为什么想从政府工作转入工业界呢?

H:在政府部门工作做的跟大家想象的其实差不多,就是做得不深入,压力也不是很大
。但是相应的,个人没有什么上升空间,在薪金方面肯定也远不能和工业界相比。我是觉得自己还有精力,想再奋斗一下。

T:当时转的时候有没有明确要转去哪个方向?

H:没有,转行前对自己找什么样工作其实也不是特别清楚。跟朋友谈了一下,感觉计
算机机会比较多。我听从了他的建议,上了一个CS硕士项目。刚上第一学期选的课,就觉得跟我想以后做的相差得很多,而且因为没有相关的背景,所以学起来也不轻松。我最终中途放弃了,而是觉得对于就业的帮助太小。当时很困惑,还在网上发了一堆求助的帖子,然后联系到了你。

T:能不能具体说说为什么你觉得之前CS master的课程你觉得不适合自己呢?

H:主要可能跟个人背景有关。对我来说,这是一个要读完至少是两年或者是一年半,
是一个相对很长的过程。我本身没有CS的基础,如果只有一个CS的研究生,CV里写的也并不是我自身的强项。自己毕竟有一定定量分析的背景,希望能去做一些尽量可以利用自己以前的工作经历的工作。所以综合考虑,我觉得读CS的研究生课程,对我来说不是一个最优的选择。跟你聊了后发现,其实还有Techlent这样的项目,跟我背景可以结合
得更好一点,而且花的时间也会比完全读一个CS的硕士要短很多,所以决定尝试一下这个方向。

T:现在回过头想想,最初投的那些工作没有下文的原因,你觉得是哪些呢?

H:总结起来,应该是对自己的定位不准。自身会一些定量分析,会做一些模型,会统
计,就觉得只要是跟这些相关的都想去试一下。但是因为从学校毕业后就在政府部门工作,没有工业界的背景,在专业性和工作内容匹配上可能就不占有优势。只找社会学定量分析,选择面就非常狭窄。偶尔有一些数据分析相关工作面试机会,也是不太顺利。电话面试时一般就问之前做的内容就没有后续进展了。

T:后来加入我们的项目后,你有什么感受?

H:当时找工作时也看过有关数据科学的一些要求,也会做一些Regression(回归),
比如linear regression或是logistic regression,我以前都做过,但是等真开始学后才发现,其实原来做的还是比较浅显的,其实整个数据科学还有很大一块,虽然并不是完全是新的东西,但是学之前真的是不知道。

之后学习了SQL课程,当时学的还挺开心的。平时其实也是用SQL的,但是用的很少。系统学习后,填补了一些空白,而且感觉学完后可以很自信的说“我会SQL,而且我SQL还挺好的”。更多的是给你自己的一种知识储备。

Q: 你的机器学习知识,是在培训之后学到的吗?

H: 我以前知道一些,大部分东西都是在上这个课以后才学到的。之前你要问我什么实
用案例,我可能根本就不知道,最多可以跟你说一下什么是回归分析。而Teclent是帮
我建立起来机器学习的知识框架。

T: 对。既然大家问到,我就顺便介绍一下,在Teclent我们不是向你介绍基本知识,而是模拟处理面试和工作中碰到的实际问题。

H:对,我觉得基本上做General DS的那些东西全部都cover了。

T:这个也是别的学员的反馈,面试一般情况下不会超出我们划的那个范围。

T:加入项目后,你花了多长时间学习,到找工作花了多少时间?

H:我大概是5月份开始学的,是因为Part time学,所以总共学了4个月,8个星期
MachineLearning和8个星期的SQL。我是从9月差不多第2个星期开始正式投简历的,其
实那时候投简历已经有点晚了。然后我是在1月份拿到offer,面试是在圣诞节假期前,他们跟我说节假日过程当中所有的东西处理起来都会比较慢一点。总共是大概三四个月的样子。

T:因为你之前解决了身份问题,这对找工作帮助大吗?

H:是的,从我面试的经验来看,很多时候你如果有绿卡或者有身份会有很大的帮助,
但不是决定性的,确实有一些公司可能是会看这个,但越是大的公司对这个要求可能越小一点。所以我觉得大家其实可以早点试一试,即便你现在没有身份。我在这里工作这么长时间,有一个很大的原因也是因为担心没有身份,但是现在回想一下,如果当时就开始准备的话,会更好一点。因为转行要学的东西还是挺多的。要尽早做准备,不要等到你觉得什么都ready了,才开始着手做,可能那个时候已经比较晚了,至少我自己是
挺后悔浪费了很多时间的。

T:在美国的确大部分同学都有一个身份的问题。很多人有这种想法,先把身份解决了
,再来准备找工作。不仅我的朋友,包括我自己当年申请绿卡的时候也是这样。其实你无论学习也好,还是找工作也好,它有个过程。而且这个过程并不短,并不是说你一投马上就有面试的。所以说它们都可以同时进行。我们有些正在跟我们学习的同学跟我说,绿卡可能还要等几个月,是不是稍微等一下。我觉得不能等,应该现在就开始找。哪怕你找到工作后,不能马上去工作,也可以跟公司商量一下,比如说再等两三个月,一般公司也是愿意的。所以像Hua刚才说的这点非常重要,首先找工作本身有过程,其次
公司可以等,没必要说一切都ready以后再去找。那样其实是额外的延长了自己找工作
时间。H:从准备到找到工作是需要时间的。而且即便找到了工作不能去,这些努力肯
定不是白费的。因为找工作是攒经验的过程。我找工作面试失败了很多次,但每一次都会觉得自己又多了一点经验,对下面找工作肯定是有帮助的。

Q: 你做Kaggle吗?

H: 我没有做Kaggle。这是Techlent的一个特点,没有让你花很长的时间去做Kaggle,
基本上Techlent做的是比较浓缩和综合的,更强调的是在里面学到一个知识框架。

你个人可以学得非常的细非常的深。那就看你自己的基础和经历了,但对我来说没有那么好的基础,也不是学这方面出身,所以我在掌握这个知识框架以后,可以针对面试有良好的表现就可以了,最关键的还是你付出的时间需要能得到一个结果。

T: 这其实是我经常强调的:第一,kaggle是个非常好的学习的地方,里面很多高手。
但第二,着急转行的话,真的没必要去做Kaggle。

我个人做了6个还是7个Kaggle比赛,有两块铜牌。非常花时间,一个比赛下来两三个月,基本上别的什么都不能干,就只做它,还不一定能刷到前面。但是在Teclent两三个
月我们的保offer camp都已经结束一大半了。

Q:面试会问python相关内容吗?

H:考python考的挺多的,data challenge基本上都是python。

Q: 是一开始知道自己focus相关的职位,还是不断调整自己的目标?

H: 因为我是转行,之前做的工作和工业界相差挺多,所以没有很清晰的定位,只要说
是general DS的职位我都会去投。

Q: 面试是否问到了统计和概率相关的东西?

H: 是的,还有一些公司会问一些AB testing,里边就会包含一些统计和概率的问题。

T: 这些就稍微偏分析一点了,在teclent这是两个不同的track。

Q:面试一般几轮?

H:至少都是三轮,刚开始是HR.然后是Team Lead或Teammember给你的电话面试,然后
Take Home Challenge,过了的话会有一个On Site.

Q: Business相关的题目多吗?H:不同的公司强调的不一样。举个例子,有个公司问,
有一组关于听歌的统计数据说每个时段有多少人在收听你的电台,要根据这个数据来建立一个模型,预测什么时候应该放什么样的歌。面试官也没有正确答案,因为当时他们公司做这个项目的时候也失败了。所以说你拿到这个问题,应该怎么去入手?更多的是考验一个思维的过程。

T:是的,很多时候面试的问题并不是有答案的,面试官可能正在做,也做不出来。然后看你是不是能够提供一个比较新的概念给他。更多时候是互相启发的一个过程,如果面试官觉得跟你聊得特别有意思,能聊出一点火花来,就会比较好。而不是他有个正确答案了,等你去回答。

Q:在找工作过程中,最困难的地方是什么?

H:对我来说都挺难的,比如说Business这些问题,因为我背景知识比较欠缺,我就觉得很难。我个人的经验可能就是有些东西就是不会,那就只能发挥你擅长的东西。

如果别人问我问题,我当时不会,我可能会想着办法再问回去,这个方法非常好。比如说刚才那个问题,他问我后,我就说这个是你让我一个人解决,还是我们俩可以商量?他说我们俩可以讨论。

我只是举个例子,经常会收到拒信。这是个很常见的事情,即使收了这么多拒信,每收一次也还是会有影响。因为有的时候你会知道下一步怎么调整,但也有一些时候你不知道该怎么调整。这一点我觉得因为我觉得Techlent给我的帮助还是挺大,还有之前的学员,所以我想说我还挺喜欢TechlentCommunity的。你会觉得你不是一个人在战斗,可
能你走过的路,你前面的学员也都走过,他们会给你一些经验,给你一些支持。对我来说还是挺有帮助的。

T: Hua说的Community是这么回事,我们还没有Camp的时候都是1对1。同学们学完了,
我们会组织在一起,形成一个一同找工作的小组。

H: 一开始加入一个三个人的,然后我又加入了另外一个小组,大概8、9个人。面试问
到问题,有些东西实在不知道怎么做,还会在群里会问一下,还是有挺及时的反馈。

T:对,我们的学员反馈确实是这样,在找工作过程中大家一起找,效果非常不错。所以这就是为什么我们决定做个Camp,然后大家officially一起找工作。因为DS本身在变,
整个市场也在变。学员和我们互相提建议,不断的去把一些我们觉得有用的内容加进去,有些觉得没必要给删掉。目前看来反应非常不错,同时也能继续保持改进。

T:Hua,从咱们第一次打电话开始到现在你找工作,差不多正好一整年时间。如果你能穿越回去的话,假如你现在刚拿到绿卡,你会给当时的自己做怎么样的规划?

H:我觉得等拿到绿卡开始规划,已经有点晚了。当时我拿到绿卡后困惑了一段时间,问了一圈,然后决定去上CS,上了一半,觉得不太对;又问了一圈,最后才找了你们,中间还是走了挺多的弯路的。如果穿越回去的话,我可能在拿到绿卡之前,至少一年之前,就会开始准备。

如果你现在工作还是学有余力,还有一点精力,也挺想折腾的,现在就可以开始准备。学的东西在你之后肯定都会有帮助。个人经验就是越早准备越好。

T:时间怎么规划呢?

H:简历方面,我觉得等全部学完了,再开始改简历、投简历,就已经晚了。从一开始一边学,就可以开始改简历。现在我看你们新的一期Camp,一开始就让学员就开始改简历
,这个很好。

T:对,这也是之前总结的经验教训,大家发现学完再开始找,等积攒一定面试经验的时候,已经到了招聘高峰期的后期了。现在我们一上来就开始准备简历,然后反复的改,在Camp结束之前就开始投了。而且不用担心说我没有准备好,投简历会不会浪费机会。如果真有这方面担心的话,刚开始可以投一些不是特别理想的开始练手。面试要多练,有练习的机会不要放过。我们的口号就是在战斗中成长,你在靶场怎么去练枪法,上了战场,感觉完全不一样。越早去越好。H:我们经常会有碰到,其实问题都会,但面试的时候就是想不起来。

其实第一因为我是转行,我平时在工作当中并没有很多的运用这方面的东西。

第二,因为经验太少,面试的经验也少。一直面试的话,面试的技巧也也会越来越好。

T:你的心理素质在我们学员中算不错的。你在面的过程中有没有感觉自己开始面了几个以后,会开始慢慢适应面试心理状态的过程?

H:我不知道大家是怎么感觉,我真的也不是特别紧张。

但是我就觉得面试还是要多面,然后攒经验了。你经历的多了,可能应对的就会更自如一点。有的时候相同的问题回答的多了闭着眼睛也能说出来。

另外一点很重要的就是可以利用反问来搞清楚面试官到底想要什么样的答案。他提问的目的是什么。

T: 是的,面试不是回答问题,是一个交流、是个对话。想办法问清楚面试官想要了解
的信息,然后把这个信息明确的给他,他就觉得很舒服。如果他说的你没有听明白,或者说没有弄清楚他想要什么,你只管瞎回答的话,反而他是不满意的。H:面试其实有很多东西,我学的也还是挺认真的,但当时听了以后并没有把它内化成自己的知识,只是大概记住了有这么一个东西。等我面试回来以后才更深刻的体会到原来是这样一回事。还是要多练。

Q:大概经历多少次面试拿到offer?

H:这个没有数,要多投多面,有机会就不要错过,看得差不多了就应该去投,你可以去套词,也可以去跟人家有有目标的去联系,反馈率会比较高一点。

海投也是必要的,我的经验是海投了一段时间以后才会开始有比较密集的电话面试,最多的时候一周有15、16个面试,非常的密集。在这个过程中你就会找到自己的方向,逐步避开不擅长的领域。比如我就会避开非常重Coding的职位。

Q: Camp多少人数?

H: 我们第一期19个人报名,入选了10个人。因为Camp节奏和目标比较统一,并不是所
有人都适合。几个没有入选的同学选择了我们的1对1的课程,因为他们要么时间比较紧凑,要么是背景不适合General DS的Track。

Q: 学员是不是都在湾区?

T: 我们是Online的学习。导师基本上在湾区。学员哪里都有,Hua在中西部,东西部都有很多同学,德州有好几个同学,甚至有几个同学还在国内。

欢迎大家找我讨论数据科学方面的转行找工作经验。
a
abceamanda

有什么问题欢迎大家在评论区留言讨论