说说Facebook的Data Scientists职位

s
songkun
楼主 (未名空间)

Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或者Google Research那种profile. 另一种是product data scientist. 我下面主要针对第二种说.

先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/
Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
engineering, pm, analysts (data scientist), product designers. 所以整个
Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
scientist, 是general hiring pool, 不分组的, 进来以后再allocate. 这点上和
engineers, PMs 什么的都相同. 之所以要这样, 是为了让analytics保持独立性, 更好的为产品提供insights,而不完全受product的制约, 换句话说, 你的老板是analytics head, 而不是你工作的那个product的head. 再有就是这样会形成analytics community, 容易share resources, best practices, 等等.

再说data scientists的日常工作组成, 基本分四项
(1) data pipelines, 这包括各种ETL, 处理数据, reporting, dashboard 等等
(2) product operation, 包括监测和产品的走向, own key metrics, 和各种ad hoc的product support. 这种可以简单概括成被动分析, 就是有人问你关于产品问题, 你得
回答.
(3) strategic analysis, 各种exploratory的分析, 提供insight来帮助产品set
roadmaps. 这种可以简单概括成主动分析, 就是没人问你问题, 你自己要问你合适的问题, 并且回答, 主动为产品提供发展方向.
(4) cross functional influencing. 有了insights, 要和另外几大pillars打交道(
eng, pm等等), 所以influencing必不可少.
可以想想, 每个产品的analysts, 都是和那个产品的团队坐在一起的, 而不是和你老板坐在一起. 同一个analytics team里的人, 往往是分散坐在不同的楼里, 而你老板可能是坐在他最involve的一个产品那个组里. Analytics team有weekly meeting, 但是你
更多的时候是meet同一product team里的人.

再说data scientists面试的要点.
(1) 有"一定"的技术能力, Python + big data (比如Hive/SQL). R也可以, 但是很多
面试题用R来做恐怕有些困难, 会Python是很有帮助的. 不需要啃算法书, CS面试那种
算法题不会考. 我们只需要知道你有独立handle data的能力, 遇上事情能有技术能力
unblock你自己. 光会SQL是不行的.
(2) 有"极好"的分析能力, 这是analysts的本质, 也是面试的重点. 给你一个问题(
open ended), 看能不能 think analytically and structurally. 随便举个例子: 怎
么用FB数据分析日本核电站爆炸的影响. 这里要自己formalize这个问题, 提出假设,
思考可以用哪些数据, 怎么分析, 没有某些数据怎么替代 等等一系列步骤.
(3) 有"极好"的product sense. 因为实际工作中, 很多时候没人问你问题, 你要自己
问问题, 问正确的问题, 需要对产品有很好的理解. 这里也举个例子: 假如印度的某个城市停电三天, 你觉得对FB会有哪些影响, 这些影响对Twitter会如何? 回答这个问题, 先得对行业和产品有一定了解, 否则根本无从下手.
当然一些其他的东西, 比如对数字的敏感度, 交流的能力等等很重要, 但是哪些都表现在上面这些回答当中.

很大程度上, FB的data scientists需要的是通才, 而不是专才, 从上面这些问题就能
看的出来. 这也是为什么我们招进来的人什么背景的都有. 背景可以千差万别, 但是上面三条都一定满足. 对于学统计的人, 尤其是对互联网行业比较陌生的, 可能在
product sense方面会有些challenge. 我们也面试过很多统计PhD, 有些人回答很好,
有些人就一塌糊涂, 最后的差别并不在于统计, 而是分析头脑和product sense. 这里
要说一点, 大多数中国人都比较适合回答close-ended questions(这个和咱们的教育背景有关), 纠结于"怎么分析". 很多时候遇上"分析什么" 这种 open-ended questions 反而不知如何下手.

最后明确一下, FB现有大量的data scientists空缺, 刚兴趣的请自己申请, 也可以找
FB的朋友推荐. 因为我个人也是hiring manager之一, 也是interviewers之一, 所以我不负责推荐.https://www.facebook.com/careers/department?req=a0IA000000CyDjDMAV

最后说点题外话. 这个版上稍微老点的人恐怕都知道我, 我来FB之前在Google工作了7
年半. Google是个给钱多还不累的地方. FB可完全不是, FB比Google忙的多的多的多的多, 整个公司都是这个文化. 对于mediocre performer, Google更tolerant, 而FB很多就直接fire了. 所以追求work life balance的, 基本就不要考虑FB了.
Google是很好的公司, 也有很多牛人, 但也有很多不干活的人在公司的各个角落. FB可以说基本没有, 至少整个analytics org一百多人, 我还没发现任何一个人有任何一点"混"的迹象. Analytics从director到
manager到IC, 都是要做IC活的. 光管人耍嘴皮子, 在FB是吃不开的. 我老板director, 基本每天也就睡4,5个小时, 剩下时间全在工作, 又management, 又自己分析东西. 很大程度上, FB这么大的公司, 能保持这种模式, 也算是奇迹了. 以前我在Google的时
候, 基本天天泡在这个版, 可是现在可能一两个月都不来一次了, 实在是没时间, 有时一天忙到最后都渴的不行饿得不行了, 才发现自己一天忙得都没喝口水的时间.

 

🔥 最新回帖

t
taiqiangle
136 楼

人比你老多了,不知道就不要吹牛逼
【 在 lzheng8 (LZ) 的大作中提到: 】
: lz还年轻吧,人肉电池当得这么甘之如饴。。。还谈什么眼界。。。
: ps:lz如果是奔着当fb ceo去的,当我没说,祝好运

d
deBuck
135 楼

Re
l
lzheng8
134 楼

lz还年轻吧,人肉电池当得这么甘之如饴。。。还谈什么眼界。。。

ps:lz如果是奔着当fb ceo去的,当我没说,祝好运

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

l
lzheng8
133 楼


【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

t
taiqiangle
132 楼

吹牛逼
【 在 magiceagle (ptc) 的大作中提到: 】
: 怎么可能这么低
: 估计200万+

 

🛋️ 沙发板凳

h
huaifans
满足这些条件的,基本上都有不少应用经验而且可以 lead project 了。
大公司里十个 analyst 出一两个就不错。 就现在录取几率的确很难招满,更别提
LinkedIn Google 也在抢人。

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................
c
catforfish

好有营养的帖子!谢谢楼主。
这么看了fb的ds不太适合fresh,学生在学校里见的数据都是response, covariates很
明确的,在analytic和product方面几乎都一片空白。统计背景优势也不太大。
d
daybreak

好多干货,非常感谢楼主分享!!!
k
kirklanda

多些songkun大牛分享!
y
yangcs

35岁以下,这么干还行。35岁以上,有家有孩子的这么干就不好了。

人生不只是事业,到了一定年龄,家庭,孩子,健康等等更重要。要享受生活,而不是到了60岁回首,自己只是干了多少有挑战性的projects,很少有时间陪伴家庭。

当然,LZ是大牛,好好好膜拜一下

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

D
DaShagen

song大侠这是劝退吧。。。。真是不是一般人可以干的活。

【 在 yangcs (Fly) 的大作中提到: 】
: 35岁以下,这么干还行。35岁以上,有家有孩子的这么干就不好了。
: 人生不只是事业,到了一定年龄,家庭,孩子,健康等等更重要。要享受生活,而不是
: 到了60岁回首,自己只是干了多少有挑战性的projects,很少有时间陪伴家庭。
: 当然,LZ是大牛,好好好膜拜一下

s
songkun

其实面试FB的DS, experienced未必比fresh有优势. 事实上我们招的人绝大部分都是
fresh grads.
experienced只是在product sense方面可能有点优势, 前提还得是在相关领域, 但是对于analytical thinking, 经常有负面影响. 工业界大多数的analysts, 工作基本都是
routine work, 时间长了只熟悉自己用的那点东西, 未必就比fresh有更好的
analytical breadth and depth. Fresh没有太多的思维禁锢, 经常反而更能独立思考.

我个人觉得, 相比业内其他公司和岗位, FB的DS面试, fresh一般更有优势. 本质上
experienced的优势是简历, 而这种面试不看简历, 不管你25岁还是52岁, 来了一套面
试流程, 主要考核的现场思考的能力.

学统计的, 的确没有天生的优势, 因为就像上面说的, 统计基本上是有固定的x, y, 考虑"怎么分析更好"的学科; 而不是有个问题, 没有x,y, 要首先考虑"分析什么更好"的
学科. 但是即使如此, 懂统计也不是没有任何帮助. 往往统计背景的人, 在确定了分析什么以后, 能更好的formalize分析, 比如比较什么metric, 什么分布, 什么test, 怎
么检验什么的, 这个肯定是有帮助的. 我们面试的人里面一直有不少是stat ms/phd,
也有不少人面试很成功, 也有中国人, 所以说这个不能一概而论.

s
songkun

应该说这个工作不是适合所有的人.

如果希望多学一些东西, work with awesome people, learn from everyone, 挑战自
己积累经历, FB的确是很好的地方.
如果个人背景很牛, 也希望和牛人工作, 但是又比较希望work life balance, Google
的某些组是更好的选择.
如果不在乎挣钱少点, 但是想有机会发财, 并且愿意take risk, 显然应该去startup.
如果work life balance是第一考量, 恐怕应该去微软这类总司.

【 在 DaShagen (Unbearable lightness) 的大作中提到: 】
: song大侠这是劝退吧。。。。真是不是一般人可以干的活。

s
sweetworm

是啊,data scientist 刚去不过15-20万吧,干几年 potential 2,30 万?这样卖命可能很多人会宁可少赚一点,去混一点的公司也少不了多少。
以前投行也这样不要命,但是 potential 是 million 级别的,拼几年可以退了,当然身体也毁了。

【 在 DaShagen (Unbearable lightness) 的大作中提到: 】
: song大侠这是劝退吧。。。。真是不是一般人可以干的活。

s
songkun

"这样卖命可能很多人会宁可少赚一点,去混一点的公司也少不了多少。"

从挣钱的角度讲的确是这样, 挣钱多本来也不是FB的卖点. 这样想法的人, 本来也不应该去FB, 也不是FB要招的对象, 这个就属于不match的例子. 可是放宽来讲, 去混一点
的公司, 不只是少赚一点, 还少学很多东西, 少历练自己, 少和其他聪明的人交流等等, 这个价值多少就见仁见智了.

要是从这个角度出发, 我肯定选择留在Google. 我那些年在Google可以说是顺风顺水, career非常smooth, 挣钱不少干活还不累. 我跳FB, 挣钱可能增加10%, 但是至少有三
倍这么忙. 可是另一方面, 在FB半年学到的东西比在Google 4,5年都要多, 这里包括眼界,思维方式,等等很多东西. 意识到很多以前都不意识的事情.

【 在 sweetworm (粘粘动动虫) 的大作中提到: 】
: 是啊,data scientist 刚去不过15-20万吧,干几年 potential 2,30 万?这样卖命可
: 能很多人会宁可少赚一点,去混一点的公司也少不了多少。
: 以前投行也这样不要命,但是 potential 是 million 级别的,拼几年可以退了,当然
: 身体也毁了。

c
chuck1212

感谢大牛!受教了!
对于Fresh来说,分析一下大牛说的三点能力具体该怎么提高。

(1) 有"一定"的技术能力, Python + big data (比如Hive/SQL). R也可以。
这一点是可以通过练习Python,SQL,HIVE来实现的。

(2) 有"极好"的分析能力, 这是analysts的本质, 也是面试的重点. 给你一个问题(
open ended), 看能不能 think analytically and structurally.

这一点对Fresh 来说,有一定可能可能提高,比如参加Kaggle,自己做Porject,实习
等等。但是question很可能还是不够open ended,很多情况,数据都是给你的,也不需要自己去定义问题。那Fresh应该怎么样提高自己分析的能力呢,是应该做一些类似MBA的case study吗,还是自己多读一些report,看看facebook怎么分析数据的?有没有推荐的参考书/blog呢?

(3) 有"极好"的product sense. 因为实际工作中, 很多时候没人问你问题, 你要自己
问问题, 问正确的问题, 需要对产品有很好的理解。

product sense恐怕对fresh更难,一是不一定了解产品,第二是即使自己觉得了解,说出来的答案也未必合理,而且没有经验丰富的Data scientist给予指导,很可能只是自己乱分析,这点实在不知该如何提高?多和已经入职的Data scientist交流,听他们讲日常工作?

s
songkun

其实没必要把东西很复杂化.

像product sense,你用过FB, Twitter, gmail, iphone什么的, 就应该有些感觉, 你为什么用他们, 做什么, 那些地方好, 那些地方不好. 你的观点可能片面, 但是这个没关系. 面试的时候, 你的回答也未必就有对错之分, 只要能make sense就行.

这种open ended question, 不是要寻求一个正确答案, 而是看一个candidate能不能
think.
面试挂了的, 极少是因为回答的不对, 而是没能convince人家自己有独立思考的能力.

举个例子, 给你个题目和一些数据, 可能一个不难的SQL query就是正确答案, 这个很
多人都可以. 可是后面会有追加问题, 比如说你觉得哪些地方可以改进. 有些人会从数据的收集入手, 说说收集哪些数据能更好的回答一些隐含问题, 如何存储处理这些数据. 有些人会从query efficiency入手, 说说如果要写大的pipeline, 怎么能让query更
efficient, 如果安排staging data, 如何back up, 如何防止出错. 有些人会从题目本身入手, 讨论本质的问题是什么, 什么题目更适合回答这个本质的问题. 这些都可以, 怎么回答都无所谓, 但是在回答的过程中, 体现了一个人的思考能力, 思维的逻辑性, 深度和广度. 这个才是面试真正来evaluate的.

归根结底, analysts最重要的不是math, 也不是stat, 也不是query, 更不是model什么的. 而是能够critical thinking, 有analytical mindset. 有了后者, 前面的都是可
以学的, 而且都不难. 反之, 光有技术能力, 不能独立思考, 最终只能在别人指导下做些具体工作, 很难在这个career上走得很远.

【 在 chuck1212 (chuck1212) 的大作中提到: 】
: 感谢大牛!受教了!
: 对于Fresh来说,分析一下大牛说的三点能力具体该怎么提高。
: (1) 有"一定"的技术能力, Python + big data (比如Hive/SQL). R也可以。
: 这一点是可以通过练习Python,SQL,HIVE来实现的。
: (2) 有"极好"的分析能力, 这是analysts的本质, 也是面试的重点. 给你一个问题(
: open ended), 看能不能 think analytically and structurally.
: 这一点对Fresh 来说,有一定可能可能提高,比如参加Kaggle,自己做Porject,实习
: 等等。但是question很可能还是不够open ended,很多情况,数据都是给你的,也不需
: 要自己去定义问题。那Fresh应该怎么样提高自己分析的能力呢,是应该做一些类似
MBA
: 的case study吗,还是自己多读一些report,看看facebook怎么分析数据的?有没有推
: ...................

h
hezhi

songkun 兄真是字字珠玑啊。

【 在 songkun (告别棒球场) 的大作中提到: 】
: 其实没必要把东西很复杂化.
: 像product sense,你用过FB, Twitter, gmail, iphone什么的, 就应该有些感觉, 你为
: 什么用他们, 做什么, 那些地方好, 那些地方不好. 你的观点可能片面, 但是这个没关
: 系. 面试的时候, 你的回答也未必就有对错之分, 只要能make sense就行.
: 这种open ended question, 不是要寻求一个正确答案, 而是看一个candidate能不能: think.
: 面试挂了的, 极少是因为回答的不对, 而是没能convince人家自己有独立思考的能力.
: 举个例子, 给你个题目和一些数据, 可能一个不难的SQL query就是正确答案, 这个很
: 多人都可以. 可是后面会有追加问题, 比如说你觉得哪些地方可以改进. 有些人会从数
: 据的收集入手, 说说收集哪些数据能更好的回答一些隐含问题, 如何存储处理这些数据
: ...................

m
matrowang

干货,不错啊。

z
zz2010

说的好 狂顶
A
Actuaries

很有道理
在职场上见得人多了
觉得楼主说的critical thinking
还有一些人说的strategic thinking比具体的技术要重要的多
【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

l
lana1972

瞎逛进来的路人甲发言:
你老板你自己打算做几年?这是玩命的节奏,以后自己做老板还是退休?就你们这种突击工作方法还搞持久战,不是给资本家榨干吗,别忘了人到中年老小都眼巴巴瞅着你这个顶梁柱呢。FB很出名,钱给你再多,也没人知道你,你的存在感还是来自于一家老小的饭后相聚,保重身体要紧。
n
niubee

既然这么想学东西,又不在乎钱和忙碌,干嘛不去多读几个博士,数学物理法律金融经济考古梵文,还不行一个学期修个100门课够了吧。学到的东西比在Google 40,50年都
要多, 这里包括眼界,思维方式,等等很多东西. 意识到很多以前都不意识的事情

【 在 songkun (告别棒球场) 的大作中提到: 】
: 倍这么忙. 可是另一方面, 在FB半年学到的东西比在Google 4,5年都要多, 这里包括眼
: 界,思维方式,等等很多东西. 意识到很多以前都不意识的事情.

n
niubee

没必要这么装逼吧。把python学好点,就足够找到无数的比DS好的多的多的多的职业发展机会。

【 在 chuck1212 (chuck1212) 的大作中提到: 】
: 感谢大牛!受教了!
: 对于Fresh来说,分析一下大牛说的三点能力具体该怎么提高。
: (1) 有"一定"的技术能力, Python + big data (比如Hive/SQL). R也可以。
: 这一点是可以通过练习Python,SQL,HIVE来实现的。
: (2) 有"极好"的分析能力, 这是analysts的本质, 也是面试的重点. 给你一个问题(
: open ended), 看能不能 think analytically and structurally.
: 这一点对Fresh 来说,有一定可能可能提高,比如参加Kaggle,自己做Porject,实习
: 等等。但是question很可能还是不够open ended,很多情况,数据都是给你的,也不需
: 要自己去定义问题。那Fresh应该怎么样提高自己分析的能力呢,是应该做一些类似
MBA
: 的case study吗,还是自己多读一些report,看看facebook怎么分析数据的?有没有推
: ...................

h
hezhi

有道理,可惜这些人不感兴趣,你感兴趣可以学嘛

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 既然这么想学东西,又不在乎钱和忙碌,干嘛不去多读几个博士,数学物理法律金融经
: 济考古梵文,还不行一个学期修个100门课够了吧。学到的东西比在Google 40,50年都
: 要多, 这里包括眼界,思维方式,等等很多东西. 意识到很多以前都不意识的事情

H
HUSTcsY61985

很赞这个神回复,
不过我觉得大部分老中面试官的缺陷就是喜欢问一些事先就有绝对对错的答案。
当然这也是一流公司和三流公司的差别。

【 在 songkun (告别棒球场) 的大作中提到: 】
: 其实没必要把东西很复杂化.
: 像product sense,你用过FB, Twitter, gmail, iphone什么的, 就应该有些感觉, 你为
: 什么用他们, 做什么, 那些地方好, 那些地方不好. 你的观点可能片面, 但是这个没关
: 系. 面试的时候, 你的回答也未必就有对错之分, 只要能make sense就行.
: 这种open ended question, 不是要寻求一个正确答案, 而是看一个candidate能不能: think.
: 面试挂了的, 极少是因为回答的不对, 而是没能convince人家自己有独立思考的能力.
: 举个例子, 给你个题目和一些数据, 可能一个不难的SQL query就是正确答案, 这个很
: 多人都可以. 可是后面会有追加问题, 比如说你觉得哪些地方可以改进. 有些人会从数
: 据的收集入手, 说说收集哪些数据能更好的回答一些隐含问题, 如何存储处理这些数据
: ...................

y
yangcs

顶这个!这确实是玩命的节奏,为啥要这么挥霍自己的健康?以为自己的身体真的很好么?说真的,等到真感觉不太好的时候,已经透支很多很多了。

对一般有孩成家的人,生活不带这么玩的,多注重身体,平时工作比较努力,保持份比较稳定的工作,多花时间陪老婆小孩,游山玩水,享受生活,这样的日子才有意义。

当然,我非常敬佩LZ。各人路不一样,看法不一样而已。

【 在 lana1972 (lana) 的大作中提到: 】
: 瞎逛进来的路人甲发言:
: 你老板你自己打算做几年?这是玩命的节奏,以后自己做老板还是退休?就你们这种突
: 击工作方法还搞持久战,不是给资本家榨干吗,别忘了人到中年老小都眼巴巴瞅着你这
: 个顶梁柱呢。FB很出名,钱给你再多,也没人知道你,你的存在感还是来自于一家老小
: 的饭后相聚,保重身体要紧。

s
salmonoil

如果从来不用fackbook的,申请有劣势么?

【 在 songkun (告别棒球场) 的大作中提到: 】
: 其实没必要把东西很复杂化.
: 像product sense,你用过FB, Twitter, gmail, iphone什么的, 就应该有些感觉, 你为
: 什么用他们, 做什么, 那些地方好, 那些地方不好. 你的观点可能片面, 但是这个没关
: 系. 面试的时候, 你的回答也未必就有对错之分, 只要能make sense就行.
: 这种open ended question, 不是要寻求一个正确答案, 而是看一个candidate能不能: think.
: 面试挂了的, 极少是因为回答的不对, 而是没能convince人家自己有独立思考的能力.
: 举个例子, 给你个题目和一些数据, 可能一个不难的SQL query就是正确答案, 这个很
: 多人都可以. 可是后面会有追加问题, 比如说你觉得哪些地方可以改进. 有些人会从数
: 据的收集入手, 说说收集哪些数据能更好的回答一些隐含问题, 如何存储处理这些数据
: ...................

a
adelsadek

谢谢分享
h
heli007

每天只睡三个小时?
给我一百万我也不干,人活着身体最要紧
我如果有自己的startup我也不会这么干,更不会说为了资本家
每天只睡三个小时除非我能为人类做出什么拿得上台面的贡献,而不是什么社交网站

至于说学习,Goog FB里人多得不得了,门槛并不高。没必要为了什么学习为目的。
做生意在那里学不到,做实业不如自己开公司,实现人生价值?估计自己都笑了

g
glancer2315

萝卜白菜
p
pc27149

mark
s
songkun

这个可以很肯定的回答, 绝对有劣势, 而且有不小的劣势.

这种劣势表现在两个方面, 一方面是熟悉这个公司的产品, 会让很多conversation容易很多, 有关product相关的问题也比较容易有概念.

但是更重要的, 是熟悉一个公司的产品, 而且是忠实用户, 你会不经意的流露出对这个公司或者产品的passion, 而这是公司考量申请者的重要方面. 从自己的方面, 如果你
对一个公司的产品都不感兴趣, 你根本不应该去申请这份工作, 即使申请到了, 也很难想象会恩热爱这份工作.

其实找工作最主要的是要自己喜欢这个行业, 这个公司, 这份工作.

【 在 salmonoil (salmonoil) 的大作中提到: 】
: 如果从来不用fackbook的,申请有劣势么?

m
manyway

看来FB的DS比SWE要求还高呀

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

s
sweetworm

一开始都是这样的,因为 candidate 多,非9分10分不看。过个一年半年,市场上像点样子的都被据过一遍了,
去了差一点的公司了,再过过连6分 candidate 都被别的公司招完了,就开始招阿狗阿猫了。

虽然公司很好,但是bar 也要设的合理。市场总共就这么多人,想招人的公司又很多。早一点降低标准还能7,8 分的填上,晚了像点样子的都没了。 除非这位置就是个虚职,填不填上没所谓。

【 在 manyway (每天爱你多一些) 的大作中提到: 】
: 看来FB的DS比SWE要求还高呀

z
zhaoce

每天睡4-5个小时实在是太苦逼了
这样做,活不到60就挂了
b
bamboox

如果有家庭, 还能说出进来就别期待 work-life balanced 的, 绝对给
洗脑了。 每天都需要超时工作无非就3个原因:
1)自己能力不够
2)公司抠门, 把多个人的工作量放在一个人身上
3)以为这个职位没了自己就不行, 不肯放手, 让东西跟程序走

t
temphan

不知道facebook是怎么retain people的。是不是就整天给你们洗脑啊?说什么多学点
东西啥的。学东西的话去startup更靠谱,包你马上end to end啥都会了,因为根本就
没人support你。在facebook这种大公司想end to end还是很难的。一天睡4,5个小时
?这是要榨干人的节奏吗?脑子有病吧这是。
m
manyway

facebook不需要retain people,原则上想走不拦着不开counter offer。你一个牛人走了,找2-3个年轻拼命猛男还顶不上来么?

【 在 temphan (temphan) 的大作中提到: 】
: 不知道facebook是怎么retain people的。是不是就整天给你们洗脑啊?说什么多学点
: 东西啥的。学东西的话去startup更靠谱,包你马上end to end啥都会了,因为根本就
: 没人support你。在facebook这种大公司想end to end还是很难的。一天睡4,5个小时
: ?这是要榨干人的节奏吗?脑子有病吧这是。

s
songkun

FB的确是这个逻辑, 这点上和Google很大不同.
在Google, 稍微重要点的员工, 辞职的时候公司很可能会给counter offer. 在FB听说
是没这个传统.

不过FB比较适合年轻人, 这个倒是真的. 从Google跳到FB, 一开始还真挺不适应的. 到处都是拼命猛男, 跟他们在一起工作, 的确需要一阵子适应.

【 在 manyway (每天爱你多一些) 的大作中提到: 】
: facebook不需要retain people,原则上想走不拦着不开counter offer。你一个牛人走
: 了,找2-3个年轻拼命猛男还顶不上来么?

r
redmeat

主页点进来看的。
对编程不懂,但是很喜欢用各式各样的网络产品。
facebook 10年了,完全不知道他除了显摆贴照片还能有什么其它的用。

真心不知道你们这些大牛天天在上班都忙啥。
能不能说几个如雷贯耳的产品来听听?

我知道失败的有,
除了facebook 主app之外的所有移动app;
facebook rom
facebook android launcher
facebook messenger
facebook snapchat copycat

这样的公司员工,咋与生俱来的自豪感?
h
heli007

FB是泡沫
这个是common sense

【 在 redmeat (jumper) 的大作中提到: 】
: 主页点进来看的。
: 对编程不懂,但是很喜欢用各式各样的网络产品。
: facebook 10年了,完全不知道他除了显摆贴照片还能有什么其它的用。
: 真心不知道你们这些大牛天天在上班都忙啥。
: 能不能说几个如雷贯耳的产品来听听?
: 我知道失败的有,
: 除了facebook 主app之外的所有移动app;
: facebook rom
: facebook android launcher
: facebook messenger
: ...................

p
powerpower

薪酬大概是个什么范围?
h
honeywell

Mark. Thanks for sharing.
c
catforfish

想问下楼主,为什么会觉得什么model,技术可以在analytical thinking和product
sense之后学习?
是因为fb用的model什么的都比较简单吗?我不敢说的太绝对,但是大部分工作以后再
学习的东西,尤其是偏理论的,都是学学皮毛。举个例子,统计版上的人都知道,一个简单的线性模型就能学一个学期。这东西看着简单,但是assumption, underlying
meanings多的很,不好好理解,很可能用的都是错的。
楼主能不能大概说说fb的ds都用点什么model啊?还是sql之后,算算均值,percentage,画画图就完了?
h
hezhi

要玩model其实去银行和保险比fb要玩的多的多。

【 在 catforfish (catforfish) 的大作中提到: 】
: 想问下楼主,为什么会觉得什么model,技术可以在analytical thinking和product : sense之后学习?
: 是因为fb用的model什么的都比较简单吗?我不敢说的太绝对,但是大部分工作以后再
: 学习的东西,尤其是偏理论的,都是学学皮毛。举个例子,统计版上的人都知道,一个
: 简单的线性模型就能学一个学期。这东西看着简单,但是assumption, underlying
: meanings多的很,不好好理解,很可能用的都是错的。
: 楼主能不能大概说说fb的ds都用点什么model啊?还是sql之后,算算均值,
percentage
: ,画画图就完了?

s
songkun

对. 还是我之前说的那个问题, 本质上analysts有两个职能, 分析什么 和 怎么分析.

在很多传统领域(比如说银行,保险,药厂等等), 各个公司的商业模型是类似的, 要分
析的问题都是很明确的, 好与坏的区别在于分析得好不好, 所以很多人就是在前人的
基础上, 让分析变得更好一些, 更精确一点, 更无偏一点等等, 区别只是做的好于
不好的问题. 这才是model要做的. 这个是解决"怎么分析"的问题, 也是各种统计领
域针对的.

而像IT这种新兴行业, 数据增长远远快于analysts能分析的速度, 而且各种新兴的
商业模型层出不穷. Google, FB, LinkedIn, Pinterest, Uber, Airbnb, 他们的商业
模型都互不相同. 所以要分析的问题都不是确定的, 好于怀的分别在于分析正确的
问题, 而不是分析的更准确一些. 所以除了一些特别的部门, 大部分analysts不会用到很复杂的model, 用也是偶尔用. 大多数时候, 就是像你说的SQL, 算算百分比, 画画图. 但是重要的是要formalize一个正确的问题, 做一个合适的分析, 并且articulate你的
观点, 并且influence product 的 roadmap.

同样是百分比, 保险公司关心的可能是某小概率事件的odd到底是 3.0% 还是 3.1%.,
今天分析完了, 明天想办法更精确一些, 是 3.0% 还是 3.05%. IT公司关心的用户使用某feature的可能到底是3% 还是30%. 今天分析完了, 就move on分析别的新问题去
了, 原来这个问题可能一年半年都不会再分析了.

还有像你说的"错误分析", 至少我在Google和FB见过太多太多了, 而且从我面试别人
的经历, 也可以保证其他公司也差不多是这样. 比如说对于不正态的样本就直接t test,
不独立的样本就直接regression, 不管什么分布一律用正态假设算p value 等等数不
胜数. 因为很多分析都不是统计背景的人做出来的, 他们并不懂这些, 所以统计背景的人可以帮助每个公司改善这些不完善的地方. 但是即使如此, 那些所谓"错误"的分析依然提供了很多价值, 为产品的发展提供了很多insights.

No models are correct, but some are useful.

【 在 catforfish (catforfish) 的大作中提到: 】
: 想问下楼主,为什么会觉得什么model,技术可以在analytical thinking和product : sense之后学习?
: 是因为fb用的model什么的都比较简单吗?我不敢说的太绝对,但是大部分工作以后再
: 学习的东西,尤其是偏理论的,都是学学皮毛。举个例子,统计版上的人都知道,一个
: 简单的线性模型就能学一个学期。这东西看着简单,但是assumption, underlying
: meanings多的很,不好好理解,很可能用的都是错的。
: 楼主能不能大概说说fb的ds都用点什么model啊?还是sql之后,算算均值,
percentage
: ,画画图就完了?

n
niubee

太意思流了。能具体说说这些跟自己有几毛钱关系呢。

【 在 songkun (告别棒球场) 的大作中提到: 】
: 对. 还是我之前说的那个问题, 本质上analysts有两个职能, 分析什么 和 怎么分析.
: 在很多传统领域(比如说银行,保险,药厂等等), 各个公司的商业模型是类似的, 要分: 析的问题都是很明确的, 好与坏的区别在于分析得好不好, 所以很多人就是在前人的: 基础上, 让分析变得更好一些, 更精确一点, 更无偏一点等等, 区别只是做的好于
: 不好的问题. 这才是model要做的. 这个是解决"怎么分析"的问题, 也是各种统计领
: 域针对的.
: 而像IT这种新兴行业, 数据增长远远快于analysts能分析的速度, 而且各种新兴的
: 商业模型层出不穷. Google, FB, LinkedIn, Pinterest, Uber, Airbnb, 他们的商业
: 模型都互不相同. 所以要分析的问题都不是确定的, 好于怀的分别在于分析正确的
: 问题, 而不是分析的更准确一些. 所以除了一些特别的部门, 大部分analysts不会用到
: ...................

c
catforfish

嗯,谢谢大牛的回复!正是我想知道的!

【 在 songkun (告别棒球场) 的大作中提到: 】
: 对. 还是我之前说的那个问题, 本质上analysts有两个职能, 分析什么 和 怎么分析.
: 在很多传统领域(比如说银行,保险,药厂等等), 各个公司的商业模型是类似的, 要分: 析的问题都是很明确的, 好与坏的区别在于分析得好不好, 所以很多人就是在前人的: 基础上, 让分析变得更好一些, 更精确一点, 更无偏一点等等, 区别只是做的好于
: 不好的问题. 这才是model要做的. 这个是解决"怎么分析"的问题, 也是各种统计领
: 域针对的.
: 而像IT这种新兴行业, 数据增长远远快于analysts能分析的速度, 而且各种新兴的
: 商业模型层出不穷. Google, FB, LinkedIn, Pinterest, Uber, Airbnb, 他们的商业
: 模型都互不相同. 所以要分析的问题都不是确定的, 好于怀的分别在于分析正确的
: 问题, 而不是分析的更准确一些. 所以除了一些特别的部门, 大部分analysts不会用到
: ...................

s
sweetworm

没那么悬乎。就是你搞的东西能不能赚钱的问题。弄个简单能用的,比搞高级理论不能用要重要的多。建模的确大部分精力花在没商业价值的东西上面。

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 太意思流了。能具体说说这些跟自己有几毛钱关系呢。

S
StatsGuy

赞强帖
感谢楼主分享!

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

T
TTU

re

lz是牛人。

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

n
niubee

: 整个Facebook一共有一百多个data scientists

一句话就表明了这是一份没有发展前途的工作。

【 在 mrmaja (夏日炎炎) 的大作中提到: 】
: 就是打份工,还以为自己有什么career。

c
chopinor

这帖子多大的面子居然把你从quant版吹过来,人家好歹提供点干货,你每天除了说些
negative的话有过啥具体建议么
【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 一句话就表明了这是一份没有发展前途的工作。

n
niubee

不是说了吗,学好python足够找到比DS好的多的多的多的工作。学多了反而不如swe,
何必呢。

【 在 chopinor (bear) 的大作中提到: 】
: 这帖子多大的面子居然把你从quant版吹过来,人家好歹提供点干货,你每天除了说些
: negative的话有过啥具体建议么

h
huaifans
什么样的工作,工资多少?

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 不是说了吗,学好python足够找到比DS好的多的多的多的工作。学多了反而不如swe,
: 何必呢。
n
niubee

各大公司里面ds都比swe工资低很多,还别说职位数量至少有10倍的差距.

别加上个scientist就以为高大上以为是业务核心。只有中国人这么想吧。其实地位在
swe之后,属于辅助部门。

【 在 huaifans (坏粉丝) 的大作中提到: 】
: 什么样的工作,工资多少?

r
rrented

谢谢lz非常有价值的帖子!Bow```
有一点疑惑:
fb员工努力程度应该被夸张了吧???怎么看都不sustainable啊。。总让我想起修铁
路的事。。

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

r
rrented

一直很喜欢niubee哥强烈的个人风格,paranoid

如同很多其他职位,我相信好的ds在未来三五年内能distinguish themselves. 每个人都有机会。

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 各大公司里面ds都比swe工资低很多,还别说职位数量至少有10倍的差距.
: 别加上个scientist就以为高大上以为是业务核心。只有中国人这么想吧。其实地位在
: swe之后,属于辅助部门。

s
songkun

的确是不sustainable, 所以work-life balance问题一直是management讨论的话题.
不过整体上, FB和Google一样, 还是比较empathetic, care员工wellness的公司. 大家很努力倒是真的, 至少我感觉比Google要push的多. 这个和年轻人多有很大关系.

我个人觉得, 这个也和FB的成长过程相关. FB一直成长在Google的威胁下, 所以一直是夹缝中求生存而成功的心态, 所以有这种keep lean, move fast的传统, 也形成相关
的文化和价值取向. 相比之下, Google的成长一直顺风顺水, 没什么大的威胁, 所以
Google的公司风格很大气. 不同的公司都是依自己的价值而存在, 所以这个也很好理解.

有n多Google的同事都考虑跳来FB问我建议, 我一般都是先说清楚我之前说的那些.
然后建议他们想好了自己到底要什么, 否则不要轻易来FB.

【 在 rrented (rrented) 的大作中提到: 】
: 谢谢lz非常有价值的帖子!Bow```
: 有一点疑惑:
: fb员工努力程度应该被夸张了吧???怎么看都不sustainable啊。。总让我想起修铁
: 路的事。。

r
rrented

谢谢!我想我能感受到你说的周围的人都很优秀,相互学习的氛围。

【 在 songkun (告别棒球场) 的大作中提到: 】
: 的确是不sustainable, 所以work-life balance问题一直是management讨论的话题. : 不过整体上, FB和Google一样, 还是比较empathetic, care员工wellness的公司. 大家
: 很努力倒是真的, 至少我感觉比Google要push的多. 这个和年轻人多有很大关系.

c
citan

zan! I am in a similar role for my job. I totally agree your opinion.

【 在 songkun (告别棒球场) 的大作中提到: 】
: 对. 还是我之前说的那个问题, 本质上analysts有两个职能, 分析什么 和 怎么分析.
: 在很多传统领域(比如说银行,保险,药厂等等), 各个公司的商业模型是类似的, 要分: 析的问题都是很明确的, 好与坏的区别在于分析得好不好, 所以很多人就是在前人的: 基础上, 让分析变得更好一些, 更精确一点, 更无偏一点等等, 区别只是做的好于
: 不好的问题. 这才是model要做的. 这个是解决"怎么分析"的问题, 也是各种统计领
: 域针对的.
: 而像IT这种新兴行业, 数据增长远远快于analysts能分析的速度, 而且各种新兴的
: 商业模型层出不穷. Google, FB, LinkedIn, Pinterest, Uber, Airbnb, 他们的商业
: 模型都互不相同. 所以要分析的问题都不是确定的, 好于怀的分别在于分析正确的
: 问题, 而不是分析的更准确一些. 所以除了一些特别的部门, 大部分analysts不会用到
: ...................

I
Iniesta

顶大牛

e
edison2012

niubee哥总是语出惊人!哈哈。

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 各大公司里面ds都比swe工资低很多,还别说职位数量至少有10倍的差距.
: 别加上个scientist就以为高大上以为是业务核心。只有中国人这么想吧。其实地位在
: swe之后,属于辅助部门。

b
byedream

我觉得facebook的DS地位不是太高,成天搞得有的没的东西,有点像PM。
在我看来DS不算ENGINEERING。
【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

m
manyway

公司的基因不同,G是靠斯坦福博士生的核心算法和技术大牛的实现发家的;F是靠Zuck的创意商业头脑和猛男们猛搞快试发家的。F的核心竞争力是用户粘度,而不是具体某
一个技术,所以不用留特定技术大牛。

【 在 songkun (告别棒球场) 的大作中提到: 】
: FB的确是这个逻辑, 这点上和Google很大不同.
: 在Google, 稍微重要点的员工, 辞职的时候公司很可能会给counter offer. 在FB听说
: 是没这个传统.
: 不过FB比较适合年轻人, 这个倒是真的. 从Google跳到FB, 一开始还真挺不适应的. 到
: 处都是拼命猛男, 跟他们在一起工作, 的确需要一阵子适应.

n
niubee

2014年facebook h1b申请数量

ds: 36人
swe: 760人

不要告诉我facebook ds只要有身份的啊。

2014 google h1b

ds: 1人 base salary $77250
swe: 3025人

大家都学统计的,都知道决策基于统计数据。

【 在 edison2012 (jimmy) 的大作中提到: 】
: niubee哥总是语出惊人!哈哈。

A
ALmost

IT公司里面data scientist人数比software engineer少,那是肯定的。
不过在google一般把做数据分析的人叫做quantitative analyst

h
hezhi

G的QA 几百号人有的吧。不过ds赚的比swe少是这么回事情,但是学个破python就可以
做swe这也够奇葩的。
python这种东西就可以秒ds,你还不如说c++可行性高些。

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 2014年facebook h1b申请数量
: ds: 36人
: swe: 760人
: 不要告诉我facebook ds只要有身份的啊。
: 2014 google h1b
: ds: 1人 base salary $77250
: swe: 3025人
: 大家都学统计的,都知道决策基于统计数据。

s
sweetworm

这牛逼哥搞得好像马工就应该是唯一的职业似的。
就马工那体力脑力强度,有几个女的干得了?男的过了40都吃力。经验不管用,年纪一把还是很累。
Analyst 或 DS 很多地方大部分女的,靠经验吃饭,年级没太大歧视, 甚至越老越舒服。
综合来讲我从来觉得马工不如统计。

【 在 hezhi (aeron) 的大作中提到: 】
: G的QA 几百号人有的吧。不过ds赚的比swe少是这么回事情,但是学个破python就可以
: 做swe这也够奇葩的。
: python这种东西就可以秒ds,你还不如说c++可行性高些。

I
Iniesta

牛逼哥你不如写篇长文,分析DS的优劣,SWE的优劣,和楼主一样。或者提供些内部信
息。

楼主的文章和回文至少提供了很多非常有用的FB外面的人不知道的信息,你的回文除了冷嘲热讽没什么建设性的东西。

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 2014年facebook h1b申请数量
: ds: 36人
: swe: 760人
: 不要告诉我facebook ds只要有身份的啊。
: 2014 google h1b
: ds: 1人 base salary $77250
: swe: 3025人
: 大家都学统计的,都知道决策基于统计数据。

s
silverhawk

看看这篇文章http://zhuanlan.zhihu.com/iamcaoz/19765448

楼主说得DS是不是做类似的事情?那其实对统计要求普通理工科研究生足够了,关键要有PM的思维?
【 在 songkun (告别棒球场) 的大作中提到: 】
: 对. 还是我之前说的那个问题, 本质上analysts有两个职能, 分析什么 和 怎么分析.
: 在很多传统领域(比如说银行,保险,药厂等等), 各个公司的商业模型是类似的, 要分: 析的问题都是很明确的, 好与坏的区别在于分析得好不好, 所以很多人就是在前人的: 基础上, 让分析变得更好一些, 更精确一点, 更无偏一点等等, 区别只是做的好于
: 不好的问题. 这才是model要做的. 这个是解决"怎么分析"的问题, 也是各种统计领
: 域针对的.
: 而像IT这种新兴行业, 数据增长远远快于analysts能分析的速度, 而且各种新兴的
: 商业模型层出不穷. Google, FB, LinkedIn, Pinterest, Uber, Airbnb, 他们的商业
: 模型都互不相同. 所以要分析的问题都不是确定的, 好于怀的分别在于分析正确的
: 问题, 而不是分析的更准确一些. 所以除了一些特别的部门, 大部分analysts不会用到
: ...................

n
niubee

楼主装逼太过了,搞得好像一定要是十项全能才能做他那份高端工作似的。

我告诉大家,只要有那十分之一的努力,就能找到更好的工作。选择远比努力重要。

【 在 Iniesta (小二白结婚) 的大作中提到: 】
: 牛逼哥你不如写篇长文,分析DS的优劣,SWE的优劣,和楼主一样。或者提供些内部信
: 息。
: 楼主的文章和回文至少提供了很多非常有用的FB外面的人不知道的信息,你的回文除了
: 冷嘲热讽没什么建设性的东西。

n
niubee

学统计的不知道去找统计数据,而是靠自己拍脑瓜,这统计算是白学了。你们学校能退学费嘛?

在monster上面查找San Francisco, CA的C++工作,一共有97个,python工作201个。
Data Scientist 13个。

【 在 hezhi (aeron) 的大作中提到: 】
: G的QA 几百号人有的吧。不过ds赚的比swe少是这么回事情,但是学个破python就可以
: 做swe这也够奇葩的。
: python这种东西就可以秒ds,你还不如说c++可行性高些。

l
luckyjet

你不说面swe的有多少人,面ds的有多少人,拿到offer的概率有多大,这才是统计白学了吧, 或许更本没学过?

更何况, one man's meat is another man's poison, 不是所有人都觉得swe比ds更适
合自己的
【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 学统计的不知道去找统计数据,而是靠自己拍脑瓜,这统计算是白学了。你们学校能退
: 学费嘛?
: 在monster上面查找San Francisco, CA的C++工作,一共有97个,python工作201个。: Data Scientist 13个。

h
hezhi

奇葩啊,和你讨论能拍拍脑袋算是想的deep了

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 学统计的不知道去找统计数据,而是靠自己拍脑瓜,这统计算是白学了。你们学校能退
: 学费嘛?
: 在monster上面查找San Francisco, CA的C++工作,一共有97个,python工作201个。: Data Scientist 13个。

n
niubee

你这样说还不如去竞选总统呢,candidate也就两三个而已,拿到offer的概率大。

【 在 luckyjet (tejykcul) 的大作中提到: 】
: 你不说面swe的有多少人,面ds的有多少人,拿到offer的概率有多大,这才是统计白学
: 了吧, 或许更本没学过?
: 更何况, one man's meat is another man's poison, 不是所有人都觉得swe比ds更适
: 合自己的

h
hezhi

实话,小于10%

【 在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到: 】
: 你这样说还不如去竞选总统呢,candidate也就两三个而已,拿到offer的概率大。

g
greens

lz这么实在,居然被说装。。
h
hezhi

可能 ds = BA + 马工的一些技能。

【 在 silverhawk (silverhawk) 的大作中提到: 】
: 看看这篇文章http://zhuanlan.zhihu.com/iamcaoz/19765448
: 楼主说得DS是不是做类似的事情?那其实对统计要求普通理工科研究生足够了,关键要
: 有PM的思维?

D
DaShagen

其实这篇文章里面的问题,在生物里面好像有类似的问题,有人做过。
所以song大侠才说什么人都招一点是对的,难不准在哪个领域被做过了。

【 在 silverhawk (silverhawk) 的大作中提到: 】
: 看看这篇文章http://zhuanlan.zhihu.com/iamcaoz/19765448
: 楼主说得DS是不是做类似的事情?那其实对统计要求普通理工科研究生足够了,关键要
: 有PM的思维?

l
lingandcs

有几个问题,希望lz回答:

1. lz说说作为DS,如何向产品组推销你的分析结果进而影响产品的roadmap。
这个工作是DS自己来做,还是有专门的BA来做?

2. 如何找project?需要DS自己去联系各个部门?还是有公司统一分配给DS?

3. performance review问题:是不是DS部门的头去向和你共事过的project lead收集
feed back,然后给你打分?这样的话,作为DS,其实你需要伺候好你HR的manager和
project的manager。
s
songkun

1. DS自己做, 这个就是我说的DS工作四个主要内容之一 influencing.
2. 不用联系, DS是分配给各个team确定的, 不是浮动的.
3. 这个是个很好的问题, 可能有必要多说几句.

Perf分成两个部分, feedback和rating. Feedback是帮助一个人develop, 而rating是
为了决定compensation(比如bonus).

Feedback是self review, peer review和manager review构成的, 所以在一定程度上, 你的cross functional team会提供意见供你的manager参考. 然后你的manager会给你
feedback说你哪里做的好, 哪里做的不好, 以后要work on哪些方面等等等等. peer
reviewers是自己找的, 所以你要尽量找能给你提供critical feedback的人, 这样才能知道自己那些地方做的不好, 以后怎么改进.

但是这些和打分没什么关系. 决定rating的基准是impact, 决定rating的过程是
calibration. 所以说一个人的rating高低, 是看这个人相比其他同level同职位的人
impact如何. org里面有严格的guideline说明如何evaluate impact, 那些算impact,
哪些不算. Feedback是不影响rating的, 因为有些人比较critical, 有些人比较好好先生, 如果feedback影响rating, 那么所有人都找nice人去给评价, 那么整个process就
失去了意义.

【 在 lingandcs (lingandcs) 的大作中提到: 】
: 有几个问题,希望lz回答:
: 1. lz说说作为DS,如何向产品组推销你的分析结果进而影响产品的roadmap。
: 这个工作是DS自己来做,还是有专门的BA来做?
: 2. 如何找project?需要DS自己去联系各个部门?还是有公司统一分配给DS?
: 3. performance review问题:是不是DS部门的头去向和你共事过的project lead收集
: feed back,然后给你打分?这样的话,作为DS,其实你需要伺候好你HR的manager和: project的manager。

j
jasonadward

至精至好且不奢
却是旅人凄屑甚
贵从一一传胸臆
何况新生又是儿
天高地平千万里
误嫁长安游侠儿

d
dsdse

mark

版主怎么不m一下啊,对后来人太有建设意义了

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

r
rrented

数据科学版也有讨论。不过这里楼高,就发在这里好了。

作为一枚只有一些知识与技能没有干货的phd, 确实很迷茫。。

南极-北极对比,下面这个就是一个典型略夸张的有干货的phdhttp://www.mitbbs.com/article_t/JobHunting/31581911.html

不知道如何才能生存啊

d
drburnie

你咋看出这个有干货的?
【 在 rrented (rrented) 的大作中提到: 】
: 标 题: Re: 说说Facebook的Data Scientists职位
: 发信站: BBS 未名空间站 (Mon Dec 1 13:47:23 2014, 美东)
:
: 数据科学版也有讨论。不过这里楼高,就发在这里好了。
:
: 作为一枚只有一些知识与技能没有干货的phd, 确实很迷茫。。
:
: 南极-北极对比,下面这个就是一个典型略夸张的有干货的phd
: http://www.mitbbs.com/article_t/JobHunting/31581911.html
:
: 不知道如何才能生存啊
:
:
: --
T
Thoreau

牛人主要是体力牛。

【 在 lana1972 (lana) 的大作中提到: 】
: 瞎逛进来的路人甲发言:
: 你老板你自己打算做几年?这是玩命的节奏,以后自己做老板还是退休?就你们这种突
: 击工作方法还搞持久战,不是给资本家榨干吗,别忘了人到中年老小都眼巴巴瞅着你这
: 个顶梁柱呢。FB很出名,钱给你再多,也没人知道你,你的存在感还是来自于一家老小
: 的饭后相聚,保重身体要紧。

r
rrented

不明显吗?摘抄如下:
“我是computer engineering的博士生,博士念了六年中间作了4个实习,基本上都是
行业顶尖的四家公司的研究实验室,有一些专利和文章。”
“我的第一个电话面试刚开始,对方就说我认识你的导师以及跟你合作过的其他老师。你的导师很不错,你应该也很不错。...后来问他是谁,没想到竟然是我们学校CS系的
前系主任,退休后被Google挖去作一个部门的research head了。...又要我正在review尚未发表的文章。我给了,他说想用。我说那得等到文章发出来
以后才能给你用。”
“然后剩下的三个面试全是我专业的东西。有一个论文讨论。几乎每个面试官都对我的东西很感兴趣。”

这个大牛没有转行。彻底转行的,找到第一份工作仅仅喘一口气,又要面对生活了。。

【 在 drburnie (专门爆料) 的大作中提到: 】
: 你咋看出这个有干货的?

g
gaetano

这不废话么... cs的博士, 数学懂, 写代码会

【 在 rrented (rrented) 的大作中提到: 】
: 不明显吗?摘抄如下:
: “我是computer engineering的博士生,博士念了六年中间作了4个实习,基本上都是
: 行业顶尖的四家公司的研究实验室,有一些专利和文章。”
: “我的第一个电话面试刚开始,对方就说我认识你的导师以及跟你合作过的其他老师。
: 你的导师很不错,你应该也很不错。...后来问他是谁,没想到竟然是我们学校CS系的
: 前系主任,退休后被Google挖去作一个部门的research head了。...又要我正在
review
: 尚未发表的文章。我给了,他说想用。我说那得等到文章发出来
: 以后才能给你用。”
: “然后剩下的三个面试全是我专业的东西。有一个论文讨论。几乎每个面试官都对我的
: 东西很感兴趣。”
: ...................

s
sweetworm

哈哈。

话说DS 这个方向,申请的都是半路出家的,看上去好像要求不高,实际上竞争者都是
物理数学工程经济PHD什么的, 又牛叉钱又要的不多。光是拿个统计的MS跟人COMPETE 就象小孩跟巨人斗似的。

【 在 gaetano (pazzo) 的大作中提到: 】
: 这不废话么... cs的博士, 数学懂, 写代码会
: review

r
rrented

数学懂写代码会属于技能,,跟考证基本在一个层次上。。仅此一点远不足以啊。。

【 在 gaetano (pazzo) 的大作中提到: 】
: 这不废话么... cs的博士, 数学懂, 写代码会
: review

r
rrented

整体上看是一回事,具体到个人又是另一回事。
这里的variation among individuals比variation among groups大得多。

【 在 sweetworm (粘粘动动虫) 的大作中提到: 】
: 哈哈。
: 话说DS 这个方向,申请的都是半路出家的,看上去好像要求不高,实际上竞争者都是
: 物理数学工程经济PHD什么的, 又牛叉钱又要的不多。光是拿个统计的MS跟人
COMPETE
: 就象小孩跟巨人斗似的。

d
diego2013

Very insightful post. Thanks a lot. This agrees with what our professor
mentioned in class--as a statistician, if you don't know programming, you
are no longer very hirable.
h
heli007

不对 非dba或者bi的ds就比swe工资高 亲身经历从swe跳成Ds

[在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
:各大公司里面ds都比swe工资低很多,还别说职位数量至少有10倍的差距.

:...........

h
hezhi

DS 的定义够广的。其实大多数所谓的DS就是纯analyst,不需要那么多coding.
类似楼主所说的那种职位。

可能有人觉得只是需要很多coding skills 且
干的活需要用一堆ML 或者predictive modeling的position才叫DS。
这种多数都是找的是CS的ML background 或者有很强的engineering
background的人,这在G也是SWE.

【 在 heli007 (随大流) 的大作中提到: 】
: 不对 非dba或者bi的ds就比swe工资高 亲身经历从swe跳成Ds
: [在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
: :各大公司里面ds都比swe工资低很多,还别说职位数量至少有10倍的差距.
: :
: :...........

r
rrented

话说现在ds是一个非常非常social的community.. 这一点我非常非常喜欢!
h
heli007

agree

DS is a term that is abused... where is the science?
data engineering is also an abused term...

I am not sure how to call my position now...
but anyhow DS (with strong ML and coding) will be more valuable than bug-
fixing back-end SWE in the future. Not sure about app writer and front-end
guys

【 在 hezhi (aeron) 的大作中提到: 】
: DS 的定义够广的。其实大多数所谓的DS就是纯analyst,不需要那么多coding.
: 类似楼主所说的那种职位。
: 可能有人觉得只是需要很多coding skills 且
: 干的活需要用一堆ML 或者predictive modeling的position才叫DS。
: 这种多数都是找的是CS的ML background 或者有很强的engineering
: background的人,这在G也是SWE.

l
lingandcs

多谢回答。
关于第三点,其实又回到了第一点,就是如何去influence整个team以及产品。
作为产品team,人家干得好好的,DS去做报告搞presentation,总有种外来的指手画脚的感觉。相信influence会很有挑战性。但这恰恰是体现DS价值的地方,再好的model和分析结果,如果不用在产品上,也是白搭,那么这就对DS的soft skill要求很高。
lz能不能就这个谈谈体会。谢谢。

【 在 songkun (告别棒球场) 的大作中提到: 】
: 1. DS自己做, 这个就是我说的DS工作四个主要内容之一 influencing.
: 2. 不用联系, DS是分配给各个team确定的, 不是浮动的.
: 3. 这个是个很好的问题, 可能有必要多说几句.
: Perf分成两个部分, feedback和rating. Feedback是帮助一个人develop, 而rating是
: 为了决定compensation(比如bonus).
: Feedback是self review, peer review和manager review构成的, 所以在一定程度上,
: 你的cross functional team会提供意见供你的manager参考. 然后你的manager会给你
: feedback说你哪里做的好, 哪里做的不好, 以后要work on哪些方面等等等等. peer : reviewers是自己找的, 所以你要尽量找能给你提供critical feedback的人, 这样才能
: 知道自己那些地方做的不好, 以后怎么改进.
: ...................

c
charming

唉,一个社交网站而已!真不明白哪有那么多东西值得学习的。现在是华尔街吹捧着,我看两三年内这股风就过气了。

有个非死不可帐号,几年前上面的人都很活跃,现在只有那么几个天天发照片,都是小孩子,不少人已经关了帐号。这种产生不了什么真正社会甚至商业价值的纯网站产品走不长远的,逃退不了myspace的命运。
g
gaetano

人都有社交需求
不过我觉得现在最in的交流方式是twitter和instagram
不明白fb为什么整天鄙视推特,顺带bs微博
【 在 charming (这位姑娘,请留步!) 的大作中提到: 】
: 唉,一个社交网站而已!真不明白哪有那么多东西值得学习的。现在是华尔街吹捧着,
: 我看两三年内这股风就过气了。
: 有个非死不可帐号,几年前上面的人都很活跃,现在只有那么几个天天发照片,都是小
: 孩子,不少人已经关了帐号。这种产生不了什么真正社会甚至商业价值的纯网站产品走
: 不长远的,逃退不了myspace的命运。

e
eternity

软技能真没什么好多说的,这个东西不是学来的,只能自己体会
同样的意思,和什么人说,什么场合说,怎么说是大学问,比coding那些难多了

【 在 lingandcs (lingandcs) 的大作中提到: 】
: 多谢回答。
: 关于第三点,其实又回到了第一点,就是如何去influence整个team以及产品。
: 作为产品team,人家干得好好的,DS去做报告搞presentation,总有种外来的指手画脚
: 的感觉。相信influence会很有挑战性。但这恰恰是体现DS价值的地方,再好的model和
: 分析结果,如果不用在产品上,也是白搭,那么这就对DS的soft skill要求很高。
: lz能不能就这个谈谈体会。谢谢。
: ,