说说Facebook的Data Scientists职位

l
lingandcs

我觉得软技能恰恰可以是学来的 多跟周围那些比较强的人学 总会有提高
像目前我就常跟一些之前做consulting的人共事,从他们身上还是能学到不少soft
skill

【 在 eternity (Stranger in a Strange land) 的大作中提到: 】
: 软技能真没什么好多说的,这个东西不是学来的,只能自己体会
: 同样的意思,和什么人说,什么场合说,怎么说是大学问,比coding那些难多了

j
james824

fb是好地方啊。。。
m
mtkrc

由此想到去年的一个面试(statistician position)(曾经被问到一个类似问题);
开始时大家寒暄一番,大家相互简单介绍了一下自己的背景,然后进入正题,第一个问
题怎么才能知道google广告是被有效点击还是无效点击? 我回答是查IP地址,考官说还
有其他的办法吗?我说查看点击频率,地点和时间段;面试官继续问还有吗?考虑几十 秒之后,说应该有,但我一时半会想不出来了。于是面试就停止了,知道现在也没弄明
白啥原因,是不是就是所谓的情商低下?
p
powerpower

bounce rate

【 在 mtkrc (飞越) 的大作中提到: 】
: 由此想到去年的一个面试(statistician position)(曾经被问到一个类似问题);
: 开始时大家寒暄一番,大家相互简单介绍了一下自己的背景,然后进入正题,第一
个问
: 题怎么才能知道google广告是被有效点击还是无效点击? 我回答是查IP地址,考官
说还
: 有其他的办法吗?我说查看点击频率,地点和时间段;面试官继续问还有吗?考虑几十
: 秒之后,说应该有,但我一时半会想不出来了。于是面试就停止了,知道现在也没
弄明
: 白啥原因,是不是就是所谓的情商低下?

p
pegasusii

楼主说的相当靠谱啊~ 来帮顶一个~
h
hezhi

面试官继续问还有吗?
直接问点的人

【 在 mtkrc (飞越) 的大作中提到: 】
: 由此想到去年的一个面试(statistician position)(曾经被问到一个类似问题);
: 开始时大家寒暄一番,大家相互简单介绍了一下自己的背景,然后进入正题,第一
个问
: 题怎么才能知道google广告是被有效点击还是无效点击? 我回答是查IP地址,考官
说还
: 有其他的办法吗?我说查看点击频率,地点和时间段;面试官继续问还有吗?考虑几十
: 秒之后,说应该有,但我一时半会想不出来了。于是面试就停止了,知道现在也没
弄明
: 白啥原因,是不是就是所谓的情商低下?

z
zero0779

有关data scientist的日常工作组成,
楼主可不可以问你,什么是(1) data pipelines, 和(2), (3)有什么区别?我仿佛感
觉(1)包含了(2)和(3)呢?
十分感谢!期待回复!

【 在 songkun (告别棒球场) 的大作中提到: 】
再说data scientists的日常工作组成, 基本分四项
(1) data pipelines, 这包括各种ETL, 处理数据, reporting, dashboard 等等
(2) product operation, 包括监测和产品的走向, own key metrics, 和各种ad hoc的product support. 这种可以简单概括成被动分析, 就是有人问你关于产品问题, 你得
回答.
(3) strategic analysis, 各种exploratory的分析, 提供insight来帮助产品set
roadmaps. 这种可以简单概括成主动分析, 就是没人问你问题, 你自己要问你合适的问题, 并且回答, 主动为产品提供发展方向.
(4) cross functional influencing. 有了insights, 要和另外几大pillars打交道(
eng, pm等等), 所以influencing必不可少.

k
kuancity

这个不mark等什么呢
s
simpleday

正在看FB的intern职位,有人推荐LZ的帖子,获益匪浅,感谢。
作为一个非统计非CS专业master(engineering专业),进学校第一学期末就开始找教
授做data mining的project,选的课上也做过一些project,用的主要是R、matlab,也在学Python。
但确实感觉在学校里做的project跟公司里实际DS的工作内容差别还是很大的,的确如
LZ所说,学校里的project多是老师提idea,学生去验证或者延伸,很少会有真正open-ended的问题,更不要说product sense。
这种情况下,是不是就没有机会了呢?或者,能否麻烦前辈给指点一些努力的方向?个人非常想到公司里学习做一些实际的business相关的DS工作的。

另外,在学校里做project可能因为数据量小,基本上都是excel或者txt格式的数据,
不知道对于intern这类职位来说,SQL的要求到底有多高?就是会用query语句提取
metrics就可以么?还是需要更深入的knowledge和experience?

非常感谢。
s
simpleday

对于DS是属于统一的行业部门,然后分配到各个项目组的形式我倒是很熟悉,因为以前在国内做Quallity Engineer也是类似的形式,以相对独立的身份进入项目组,帮助他
们做过程数据分析预测和改进。
这种形式对于DS的职业发展很好,上升渠道也很清楚。
a
angelsun

几个月后,回过头来看宋总的一番话,又有新的认识。
确实,FB的ds要的是通才,而且特别讲求influence。要自己主动去想,怎么样可以提
高产品,然后用怎么样的数据分析去支持这样的提案。我给自己科普了不少产品方面的知识。我做video的,得熟悉什么bitrate, h264, vp9, iOS/Android主流播放器的特点...感觉ds得把自己当作PM来看待这个产品。

coding方面,由于产品的关系,我只需要做quick analysis,所以基本上只用到sql/
hql。唯一一次写点python,还是因为要build一个data pipeline... 但有些组需要做
一些深入分析的话,就需要用R/python写点code了。

另外,公司的饮料选择太多,我他妈又更胖了。55555

好了不多说了我继续干活去了 -_-b

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

l
lockdown


最大的阻力是什么

product的software engineer听你的么?

你提出的东西,他们自己不会做么?何况很多FB的software engineer就是ML的PHD

no offense,就是想了解一下FB这种“data scientist”职位的工作性质,我觉得找个product team里面资深点的software engineer来兼职干点PM的活最合适

还是FB这种模式有什么engineer做不了的?

【 在 angelsun (代订酒店·详见说明档) 的大作中提到: 】
: 几个月后,回过头来看宋总的一番话,又有新的认识。
: 确实,FB的ds要的是通才,而且特别讲求influence。要自己主动去想,怎么样可以提
: 高产品,然后用怎么样的数据分析去支持这样的提案。我给自己科普了不少产品方面的
: 知识。我做video的,得熟悉什么bitrate, h264, vp9, iOS/Android主流播放器的特点
: ...感觉ds得把自己当作PM来看待这个产品。
: coding方面,由于产品的关系,我只需要做quick analysis,所以基本上只用到sql/: hql。唯一一次写点python,还是因为要build一个data pipeline... 但有些组需要做
: 一些深入分析的话,就需要用R/python写点code了。
: 另外,公司的饮料选择太多,我他妈又更胖了。55555
: 好了不多说了我继续干活去了 -_-b
: ...................

s
summer98

请问用Facebook data有哪些成功的business cases? 最好每个领域都说说让我们开开
眼界。

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

s
summer98

貌似Facebook不像twitter那样提供很多free data,是privacy concern还是Facebook
想自己分析数据卖商业用途?

l
lockdown

应该是both

【 在 summer98 (summer is not over) 的大作中提到: 】
: 貌似Facebook不像twitter那样提供很多free data,是privacy concern还是
Facebook
: 想自己分析数据卖商业用途?

f
flybaby

现在回头一看,这脸打的啪啪响
【 在 charming (这位姑娘,请留步!) 的大作中提到: 】
: 唉,一个社交网站而已!真不明白哪有那么多东西值得学习的。现在是华尔街吹捧着,
: 我看两三年内这股风就过气了。
: 有个非死不可帐号,几年前上面的人都很活跃,现在只有那么几个天天发照片,都是小
: 孩子,不少人已经关了帐号。这种产生不了什么真正社会甚至商业价值的纯网站产品走
: 不长远的,逃退不了myspace的命运。

g
gaetano

其实最不理解的是为什么fb会鄙视twitter

【 在 flybaby (yegu) 的大作中提到: 】
: 现在回头一看,这脸打的啪啪响

j
jimchang

多些songkun大牛分享!
m
mtgobest

少见的干货牛贴
j
jobgirl

mark
g
grandzeng

赞!
h
hezhi

FB这种模式有什么engineer做不了的?
实话,如果一个team有engineer跑过来抢analysis的活,那基本那个team没前途了。
所以,engineer做的活都是更有visiblility的活

【 在 lockdown (Orz) 的大作中提到: 】
: 最大的阻力是什么
: product的software engineer听你的么?
: 你提出的东西,他们自己不会做么?何况很多FB的software engineer就是ML的PHD
: no offense,就是想了解一下FB这种“data scientist”职位的工作性质,我觉得找个
: product team里面资深点的software engineer来兼职干点PM的活最合适
: 还是FB这种模式有什么engineer做不了的?

p
papertigra

为啥老有人挖坟
n
nywst

“我老板director,
基本每天也就睡4,5个小时, 剩下时间全在工作”

nuff said
s
sophialiu1

干货。 Mark
f
fight2016

mark.干货。R
l
liulin0809
http://www.storkapp.me/?ref=liulincn,文献追踪的小插件,可以及时的了解相关领域的最新文章。你们可以尝试一下,free的
【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

m
margosa

这个帖子有用了。
M
Mark6

你不觉得你这回复也是绝对的吗? 问有绝对对错的的问题就是有缺陷?还是老中这样
问有缺陷?有绝对对错的至少可以按统一标准筛选人。这可能也是有高考的原因,因为至少公平。

当然这也是喜欢拿老中说事的一流和三流的差别。

【 在 HUSTcsY61985 (ForrestYan1985) 的大作中提到: 】
: 很赞这个神回复,
: 不过我觉得大部分老中面试官的缺陷就是喜欢问一些事先就有绝对对错的答案。
: 当然这也是一流公司和三流公司的差别。

d
dimorphism

发现我一个生物千老,技术上完全胜任FB的DS
n
nodistance

好奇DS睡三四个小时的director 能拿多少钱?50万保底?40万?30万? 这么辛苦,而且都是有家有口的年龄,一般人做不了的

w
water77

睡这么少,再多钱也没命花,过几年挂了,老婆给别人睡,孩子给别人打。

【 在 nodistance (nodistance) 的大作中提到: 】
: 好奇DS睡三四个小时的director 能拿多少钱?50万保底?40万?30万? 这么辛苦,而
: 且都是有家有口的年龄,一般人做不了的

m
magiceagle

怎么可能这么低
估计200万+

【 在 nodistance (nodistance) 的大作中提到: 】
: 好奇DS睡三四个小时的director 能拿多少钱?50万保底?40万?30万? 这么辛苦,而
: 且都是有家有口的年龄,一般人做不了的

t
taiqiangle

吹牛逼
【 在 magiceagle (ptc) 的大作中提到: 】
: 怎么可能这么低
: 估计200万+

l
lzheng8


【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

l
lzheng8

lz还年轻吧,人肉电池当得这么甘之如饴。。。还谈什么眼界。。。

ps:lz如果是奔着当fb ceo去的,当我没说,祝好运

【 在 songkun (告别棒球场) 的大作中提到: 】
: Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
: 者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
: 第二种说.
: 先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
: Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/: Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
: 分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
: engineering, pm, analysts (data scientist), product designers. 所以整个
: Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
: reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
: ...................

d
deBuck

Re
t
taiqiangle

人比你老多了,不知道就不要吹牛逼
【 在 lzheng8 (LZ) 的大作中提到: 】
: lz还年轻吧,人肉电池当得这么甘之如饴。。。还谈什么眼界。。。
: ps:lz如果是奔着当fb ceo去的,当我没说,祝好运