tiktok不卖algorithm难道它的算法北美工程师们做不出来吗

小塔
楼主 (北美华人网)
说tiktok的algo是它的secret recipe, dang ma不让卖,以我对ML非常浅薄的认知,modeling应该不难吧, 就是花时间攒数据 train model, 能想象出来的TT algo已有的优势
1) 用户量巨大 data量巨大 能更有效的training model - 那美国公司买了他的用户数据做出算法就是时间问题吧 2) 北美工程师比较贵,也许同样的价格北美能雇一个工程师 国内能雇N个来build algo 国内工程师质量也许并不比北美弱 3) 或许TT真的有什么不可被知的隐私插件 提高运算准确率
ML这行北美现在还是最强的吗
p
phlin
说tiktok的algo是它的secret recipe, dang ma不让卖,以我对ML非常浅薄的认知,modeling应该不难吧, 就是花时间攒数据 train model, 能想象出来的TT algo已有的优势
1) 用户量巨大 data量巨大 能更有效的training model - 那美国公司买了他的用户数据做出算法就是时间问题吧 2) 北美工程师比较贵,也许同样的价格北美能雇一个工程师 国内能雇N个来build algo 国内工程师质量也许并不比北美弱 3) 或许TT真的有什么不可被知的插件偷窥隐私
ML这行北美现在还是最强的吗
小塔 发表于 2020-09-14 15:43

09/15快到了
就禁了吧
中國跌倒 世界吃飽
m
minqidev
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
p
phlin
既然不难,为什么要买tiktok,干脆自己做个好了。
minqidev 发表于 2020-09-14 15:49

這個要從邪惡的 資本市場來看 tiktok 東西不值五億美元 但炒作的本夢比有幾百億美元 現在要是把夢直接戳破
有幾百億美元直接蒸發
其中有一堆華爾街的錢跟紅二代的錢
f
feifeiduan
不卖就是有猫腻?这什么逻辑?
按这个推断别双标 ,美国不卖芯片一定也是有猫腻了?听着感觉荒唐吗?



车到山前
可能有隐私问题使工程师没法得到足够的数据量来测试模型,这在中国不是问题。
小塔
回复 3楼minqidev的帖子
单一种族的问题make sense 既然只在单一种族的地区效果比较好 那到美国这么多元化的地区不work 为什么还觉得是secret recipe呢 这样的model到头来不会是overfitting的问题么
m
minqidev
回复 3楼minqidev的帖子
单一种族的问题make sense 既然只在单一种族的地区效果比较好 那到美国这么多元化的地区不work 为什么还觉得是secret recipe呢 这样的model到头来不会是overfitting的问题么
小塔 发表于 2020-09-14 16:17

你没发现,喜欢tiktok的,也是单一人群吗?
20岁以下的女孩,喜欢短裤,短衣,若影若现; 20多岁男孩,头盔,迷彩服; 或者唱歌,搞笑
这基本上是中,美年轻人都喜欢的东西。
d
ddz1332
字母自己又没说不能卖,习包子又被忽悠了 以为有什么高科技 不得了的,想报复美国一把,以前的几任吧 偷偷摸摸占了便宜还是知道自己不对的,抓到了就让一点点,美国就算了。。现在总加速师在,你不让我占便宜就是针对中国人民,我中国人民站起来了 要反对列强, 那就等着对等吧。。看看你怎么占便宜。 抖音本来就不公平, 可以垄断中国市场赚钱 再开发海外, 又有数据 又有中国的利润撑着,当然对别的公司不公平了
b
bluesunrise
主要价值不在算法, 而是积累的用户
l
lokiii
1/3数据1/3算法1/3产品设计, 总体上还是有区别的, FB抄了这么久了也没抄出个所以然, 中国那么多公司也没抄出来. 快手因为算法这块还是有差距就只能堆多个窗口降低对accuracy要求. tiktok还是有点东西的.
O
Olympian
主要是数据吧。tiktok数据很大,受到的限制也比较少,也已经有一段时间了,就肯定比其他类似的好吧。
p
piggydudu
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
minqidev 发表于 9/14/2020 3:49:11 PM
可是如果这样的话,抖音用国人数据train出来的model不一定适用于美国用户呀 ---发自Huaren官方Android app
p
psyentistc
bytedance对大众最成功的洗脑就是自己的算法是最强竞争力 lol
tiktok最重要的asset是用户和运营。网红运营这块,尤其是带货一条龙,国内比美国公司领先一个身位。
e
ecko
算法应该没啥特别的,主要还是data和运营
T
Tbbh
土工不让卖的算法,根本就不是大家讨论的对用户端的推送算法。 算法就是障眼的帽子。 土工担心的是内容审查部分的算法, 包括如何更新敏感词词库, 如何更新被监控人物的账户ID, 如何筛选要屏蔽的文章和作者,如何反馈信息给监管部门。如果这些信息都暴露了,其实也就暴露了几乎所有国产的信息平台和应用APP的后门,这些在国外运行的平台和应用都会受的大规模的集体诉讼,必然导致团灭,全部下架。
s
shoon_yee
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
minqidev 发表于 9/14/2020 3:49:11 PM
可是如果这样的话,抖音用国人数据train出来的model不一定适用于美国用户呀 ---发自Huaren官方Android app
piggydudu 发表于 2020-09-14 17:16

Tiktok就是美国用户的数据。还有国内年轻人的数据也还是很有用的。
n
nicho
bytedance对大众最成功的洗脑就是自己的算法是最强竞争力 lol
tiktok最重要的asset是用户和运营。网红运营这块,尤其是带货一条龙,国内比美国公司领先一个身位。
psyentistc 发表于 2020-09-14 17:49

我也觉得他最强的是运营还有用户规模,培训网红有一套,说算法强真的感觉是来忽悠外行的……整得好像是个跟光刻机一样的高科技似的
M
Mcdonald
没用过这些
不知道说啥
f
fino819
装了一个tiktok, 没觉得它的推荐有啥好的。
小塔
不卖就是有猫腻?这什么逻辑?
按这个推断别双标 ,美国不卖芯片一定也是有猫腻了?听着感觉荒唐吗?




feifeiduan 发表于 2020-09-14 15:52

咋的就说它有猫腻了??讨论tiktok究竟有啥优势不是么?? 这么冲什么劲儿 戳着啥了
f
facet
主要价值不在算法, 而是积累的用户
bluesunrise 发表于 2020-09-14 16:52

成功的产品,任何一个环节都是相当有价值的,尤其像tiktok这种以绝对优势碾压对手的产品
l
lavenderfan
还是那句话,50B买的是user base。不要听中文网的忽悠。大外宣在行动
a
anye
你没发现,喜欢tiktok的,也是单一人群吗?
20岁以下的女孩,喜欢短裤,短衣,若影若现; 20多岁男孩,头盔,迷彩服; 或者唱歌,搞笑
这基本上是中,美年轻人都喜欢的东西。

minqidev 发表于 2020-09-14 16:24

That's what TikTok's AI feeds you, or what you like, lol.
v
vikpie
1/3数据1/3算法1/3产品设计, 总体上还是有区别的, FB抄了这么久了也没抄出个所以然, 中国那么多公司也没抄出来. 快手因为算法这块还是有差距就只能堆多个窗口降低对accuracy要求. tiktok还是有点东西的.
lokiii 发表于 2020-09-14 16:56

据一个fb ml 组的人说tiktok有些技术是比fb领先的
t
tidewater
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
minqidev 发表于 2020-09-14 15:49

这种其实长期而言祸福胭脂 。。。 纯 ML 而言,短期而言狂砸大数据总是有优势,但如果太狠到过犹不及的话,这种白菜玩法的 benefits 会最终 diminish 。。。 而 reinforced learning / self-supervied learning 等等目前虽然问题多多,但最终可能胜出。
这不是说不要玩白菜,或者说直接跨时代玩超时代高大上 。。。 而是说把白菜玩到极致的不能极致,这也不是个长远之计的折中。
s
space_invader
据一个fb ml 组的人说tiktok有些技术是比fb领先的
vikpie 发表于 2020-09-15 14:47

个人经验instagram reels推的video都很sb ... 跟我喜好基本无关 不管什么algorithm都需要训练,同样算法十倍大的数据库训练出来的应该更优化。 除非开发出来十倍学习效率的算法, 不然超越比较困难。
s
space_invader
》可是如果这样的话,抖音用国人数据train出来的model不一定适用于美国用户呀 中国用户群跟美国用户群整体差异没那么大,流行文化大同小异, 还不如个体差异大,推荐根据个别用户喜好稍微及时优化一下就好了。
》美国公司买了他的用户数据做出算法就是时间问题吧 不会让卖中国用户群的数据吧, 光美国用户群的数据不够大。