tiktok不卖algorithm难道它的算法北美工程师们做不出来吗

小塔
楼主 (北美华人网)
说tiktok的algo是它的secret recipe, dang ma不让卖,以我对ML非常浅薄的认知,modeling应该不难吧, 就是花时间攒数据 train model, 能想象出来的TT algo已有的优势
1) 用户量巨大 data量巨大 能更有效的training model - 那美国公司买了他的用户数据做出算法就是时间问题吧 2) 北美工程师比较贵,也许同样的价格北美能雇一个工程师 国内能雇N个来build algo 国内工程师质量也许并不比北美弱 3) 或许TT真的有什么不可被知的隐私插件 提高运算准确率
ML这行北美现在还是最强的吗
phlin
说tiktok的algo是它的secret recipe, dang ma不让卖,以我对ML非常浅薄的认知,modeling应该不难吧, 就是花时间攒数据 train model, 能想象出来的TT algo已有的优势
1) 用户量巨大 data量巨大 能更有效的training model - 那美国公司买了他的用户数据做出算法就是时间问题吧 2) 北美工程师比较贵,也许同样的价格北美能雇一个工程师 国内能雇N个来build algo 国内工程师质量也许并不比北美弱 3) 或许TT真的有什么不可被知的插件偷窥隐私
ML这行北美现在还是最强的吗
小塔 发表于 2020-09-14 15:43

09/15快到了
就禁了吧
中國跌倒 世界吃飽
minqidev
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
phlin
既然不难,为什么要买tiktok,干脆自己做个好了。
minqidev 发表于 2020-09-14 15:49

這個要從邪惡的 資本市場來看 tiktok 東西不值五億美元 但炒作的本夢比有幾百億美元 現在要是把夢直接戳破
有幾百億美元直接蒸發
其中有一堆華爾街的錢跟紅二代的錢
feifeiduan
不卖就是有猫腻?这什么逻辑?
按这个推断别双标 ,美国不卖芯片一定也是有猫腻了?听着感觉荒唐吗?



车到山前
可能有隐私问题使工程师没法得到足够的数据量来测试模型,这在中国不是问题。
小塔
回复 3楼minqidev的帖子
单一种族的问题make sense 既然只在单一种族的地区效果比较好 那到美国这么多元化的地区不work 为什么还觉得是secret recipe呢 这样的model到头来不会是overfitting的问题么
minqidev
回复 3楼minqidev的帖子
单一种族的问题make sense 既然只在单一种族的地区效果比较好 那到美国这么多元化的地区不work 为什么还觉得是secret recipe呢 这样的model到头来不会是overfitting的问题么
小塔 发表于 2020-09-14 16:17

你没发现,喜欢tiktok的,也是单一人群吗?
20岁以下的女孩,喜欢短裤,短衣,若影若现; 20多岁男孩,头盔,迷彩服; 或者唱歌,搞笑
这基本上是中,美年轻人都喜欢的东西。
d
ddz1332
字母自己又没说不能卖,习包子又被忽悠了 以为有什么高科技 不得了的,想报复美国一把,以前的几任吧 偷偷摸摸占了便宜还是知道自己不对的,抓到了就让一点点,美国就算了。。现在总加速师在,你不让我占便宜就是针对中国人民,我中国人民站起来了 要反对列强, 那就等着对等吧。。看看你怎么占便宜。 抖音本来就不公平, 可以垄断中国市场赚钱 再开发海外, 又有数据 又有中国的利润撑着,当然对别的公司不公平了
bluesunrise
主要价值不在算法, 而是积累的用户
lokiii
1/3数据1/3算法1/3产品设计, 总体上还是有区别的, FB抄了这么久了也没抄出个所以然, 中国那么多公司也没抄出来. 快手因为算法这块还是有差距就只能堆多个窗口降低对accuracy要求. tiktok还是有点东西的.
Olympian
主要是数据吧。tiktok数据很大,受到的限制也比较少,也已经有一段时间了,就肯定比其他类似的好吧。
piggydudu
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
minqidev 发表于 9/14/2020 3:49:11 PM
可是如果这样的话,抖音用国人数据train出来的model不一定适用于美国用户呀 ---发自Huaren官方Android app
p
psyentistc
bytedance对大众最成功的洗脑就是自己的算法是最强竞争力 lol
tiktok最重要的asset是用户和运营。网红运营这块,尤其是带货一条龙,国内比美国公司领先一个身位。
ecko
算法应该没啥特别的,主要还是data和运营
Tbbh
土工不让卖的算法,根本就不是大家讨论的对用户端的推送算法。 算法就是障眼的帽子。 土工担心的是内容审查部分的算法, 包括如何更新敏感词词库, 如何更新被监控人物的账户ID, 如何筛选要屏蔽的文章和作者,如何反馈信息给监管部门。如果这些信息都暴露了,其实也就暴露了几乎所有国产的信息平台和应用APP的后门,这些在国外运行的平台和应用都会受的大规模的集体诉讼,必然导致团灭,全部下架。
shoon_yee
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
minqidev 发表于 9/14/2020 3:49:11 PM
可是如果这样的话,抖音用国人数据train出来的model不一定适用于美国用户呀 ---发自Huaren官方Android app
piggydudu 发表于 2020-09-14 17:16

Tiktok就是美国用户的数据。还有国内年轻人的数据也还是很有用的。
n
nicho
bytedance对大众最成功的洗脑就是自己的算法是最强竞争力 lol
tiktok最重要的asset是用户和运营。网红运营这块,尤其是带货一条龙,国内比美国公司领先一个身位。
psyentistc 发表于 2020-09-14 17:49

我也觉得他最强的是运营还有用户规模,培训网红有一套,说算法强真的感觉是来忽悠外行的……整得好像是个跟光刻机一样的高科技似的
Mcdonald
没用过这些
不知道说啥
fino819
装了一个tiktok, 没觉得它的推荐有啥好的。
小塔
不卖就是有猫腻?这什么逻辑?
按这个推断别双标 ,美国不卖芯片一定也是有猫腻了?听着感觉荒唐吗?




feifeiduan 发表于 2020-09-14 15:52

咋的就说它有猫腻了??讨论tiktok究竟有啥优势不是么?? 这么冲什么劲儿 戳着啥了
facet
主要价值不在算法, 而是积累的用户
bluesunrise 发表于 2020-09-14 16:52

成功的产品,任何一个环节都是相当有价值的,尤其像tiktok这种以绝对优势碾压对手的产品
lavenderfan
还是那句话,50B买的是user base。不要听中文网的忽悠。大外宣在行动
anye
你没发现,喜欢tiktok的,也是单一人群吗?
20岁以下的女孩,喜欢短裤,短衣,若影若现; 20多岁男孩,头盔,迷彩服; 或者唱歌,搞笑
这基本上是中,美年轻人都喜欢的东西。

minqidev 发表于 2020-09-14 16:24

That's what TikTok's AI feeds you, or what you like, lol.
vikpie
1/3数据1/3算法1/3产品设计, 总体上还是有区别的, FB抄了这么久了也没抄出个所以然, 中国那么多公司也没抄出来. 快手因为算法这块还是有差距就只能堆多个窗口降低对accuracy要求. tiktok还是有点东西的.
lokiii 发表于 2020-09-14 16:56

据一个fb ml 组的人说tiktok有些技术是比fb领先的
tidewater
既然不难,为什么要买tiktok,干脆自己做个好了。
准确说,不能说是算法。是一种大量单一类型,语言环境, 生活习惯进行大量训练的结果。目前,全世界只有三个国家的数据比较好,中国,日本,韩国。 越南的数据也是个金矿。印度因为种族,语言太多了,并不是很好。
比如中国,可能某个场景有1亿人使用,训练了5年;如果放到美国,那就是1000万人,需要训练50年。 用户的行为数据,只有靠积累。
minqidev 发表于 2020-09-14 15:49

这种其实长期而言祸福胭脂 。。。 纯 ML 而言,短期而言狂砸大数据总是有优势,但如果太狠到过犹不及的话,这种白菜玩法的 benefits 会最终 diminish 。。。 而 reinforced learning / self-supervied learning 等等目前虽然问题多多,但最终可能胜出。
这不是说不要玩白菜,或者说直接跨时代玩超时代高大上 。。。 而是说把白菜玩到极致的不能极致,这也不是个长远之计的折中。
space_invader
据一个fb ml 组的人说tiktok有些技术是比fb领先的
vikpie 发表于 2020-09-15 14:47

个人经验instagram reels推的video都很sb ... 跟我喜好基本无关 不管什么algorithm都需要训练,同样算法十倍大的数据库训练出来的应该更优化。 除非开发出来十倍学习效率的算法, 不然超越比较困难。
space_invader
》可是如果这样的话,抖音用国人数据train出来的model不一定适用于美国用户呀 中国用户群跟美国用户群整体差异没那么大,流行文化大同小异, 还不如个体差异大,推荐根据个别用户喜好稍微及时优化一下就好了。
》美国公司买了他的用户数据做出算法就是时间问题吧 不会让卖中国用户群的数据吧, 光美国用户群的数据不够大。