tiktok和甲骨文

i
insect9

你打算怎么控制公司CTO的访问权限吧,你要什么权限他可以自己给自己批什么权限。

【 在 comeandgo 的大作中提到: 】
:
:笑话,我当然说的是美国本土的情况。
:
:连本土人的data access都可控,大洋之外的remote access怎么可能没有audit trail
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 来来,你告诉中国哪家公司的VP敢拒绝北京市公安局网警的协查要求。别说看个数
据,
:: 要删哪儿数据都是凌晨3点一割电话把你从被窝里拽出来, 然后层层通知全部门加班手
:: 工删数据。
:: 权限控制当然有,但是当技术部门最高负责人在中国的时候,这个权限控制对中国
公安
:: 无效。必须所有权转移,VP以上放美国,整个中国部门都没有访问权限,才是安全
的。
:: 实际上据我所知,在华的美企都是这么做的。部分敏感数据中国区的VP也没有访问
权限。

i
insect9

交出控制权就行,源代码无所谓。

【 在 shadowalker 的大作中提到: 】
:
:我认为交出源代码和所有控制权才勉强可以接受,否则就该毙掉。
:
:【 在 mouseCEO (玩偶鼠) 的大作中提到: 】
:: 这个协议正在等待等待政府的批准。细节还没有披露,大家还是等两天等详细内容
出来
:: 再喷吧。
:: 我个人认为,从国家安全的角度出发,如果Oracle的介入是:
:: 仅仅提供用户数据的运行和控制 - 烂deal,希望川普政府毙掉它。
:: 提供用户数据和应用服务器的运行和控制 - 可以接受的deal。
:: 比以上更多的控制和产权 - 好deal。
:
:

i
insect9

算法都是公开的,推荐这玩意就是一个大力出奇迹的领域。有数据就有一切。

【 在 nfnmd 的大作中提到: 】
:
:我觉得有了所有数据倒推算法难度降低无数倍。现在的马工不行就花钱挖呗。
:
:【 在 helloterran (hi you) 的大作中提到: 】
:: 你这两个说法都缺乏常识
:: 1 oracle没有那个水平,不可能开发出tiktok的替代算法。bd技术上也不可能跟
:oracle
:: 签无限期的licensing协议
:: 2 用户数据和推荐算法紧密耦合,谁也离不开谁。所谓只买operation不买算法纯粹外
:: 行记者扯淡
:: 新。
:

s
shadowalker

这桩交易的背后其实是中美两国的外交角力,川普说要求完全出售,中共就说禁止出售核心技术,所以川普如果答应了交出源代码之外的任何deal,都会被解读成对中共的软弱。

另外,如果tiktok真的在监控美国用户数据,其源代码中必会留下蛛丝马迹。

【 在 insect9 (insect9) 的大作中提到: 】
: 交出控制权就行,源代码无所谓。
: :
: :我认为交出源代码和所有控制权才勉强可以接受,否则就该毙掉。
: :
: :【 在 mouseCEO (玩偶鼠) 的大作中提到: 】
: :: 这个协议正在等待等待政府的批准。细节还没有披露,大家还是等两天等详细内容
: 出来
: :: 再喷吧。
: :: 我个人认为,从国家安全的角度出发,如果Oracle的介入是:
: :: 仅仅提供用户数据的运行和控制 - 烂deal,希望川普政府毙掉它。
: ...................

m
mengjianzhu3

这都哪跑出来的廊庑二货

【 在 Sven (斯文) 的大作中提到: 】
: oracle是上上代IT公司,技术水平差tiktok几个数量级,就算tiktok把数据给oracle,
: oracle也搞不定。
: oracle纯粹就是帮个忙打个杂搞个备份,用自己的关系糊弄下川普。川普也明白,给个
: 台阶他就下了。
: 这个台阶也就是忽悠下川粉,内行都知道这一局川普完败。

T
TopHuang

这是想多了。算法没什么难的,美国公司这方面的限制主要是法律个人隐私数据保护方面的。

中国这方面上上下下比较流氓,各种个人隐私数据随便拿训练出的比较好的结果罢了。美国拿了中国公司的数据,反而走了数据的捷径。

【 在 helloterran (hi you) 的大作中提到: 】
: 你这两个说法都缺乏常识
: 1 oracle没有那个水平,不可能开发出tiktok的替代算法。bd技术上也不可能跟
oracle
: 签无限期的licensing协议
: 2 用户数据和推荐算法紧密耦合,谁也离不开谁。所谓只买operation不买算法纯粹外
: 行记者扯淡
: 新。

T
TopHuang

拿来的文盲,oracle就是以数据处理优化为专长的公司。

【 在 Sven (斯文) 的大作中提到: 】
: oracle是上上代IT公司,技术水平差tiktok几个数量级,就算tiktok把数据给oracle,
: oracle也搞不定。
: oracle纯粹就是帮个忙打个杂搞个备份,用自己的关系糊弄下川普。川普也明白,给个
: 台阶他就下了。
: 这个台阶也就是忽悠下川粉,内行都知道这一局川普完败。

d
daemonself1

不是没什麽难的,根本就是很简单,黄赌毒人人都爱,就推荐这些就好
【 在 TopHuang (Raptor) 的大作中提到: 】
: 这是想多了。算法没什么难的,美国公司这方面的限制主要是法律隐私方面的。
: 中国这方面上上下下比较流氓,各种个人隐私数据随便拿训练出的比较好的结果罢了。
: 美国拿了中国公司的数据,反而走了数据的捷径。
: oracle

T
TopHuang

什么小P网站都会用cookie追踪你的浏览记录,然后推送类似的广告。这种利用你的浏
览记录类似的推送根本不是什么高科技,个人数据收集越多,推送越准。

【 在 daemonself1 (daemon) 的大作中提到: 】
: 不是没什麽难的,根本就是很简单,黄赌毒人人都爱,就推荐这些就好

d
daemonself1

推荐算法是最简单的ai,什么样的马农和ds会觉得推荐算法很难,真神奇
【 在 TopHuang (Raptor) 的大作中提到: 】
: 什么小P网站都会用cookie追踪你的浏览记录,然后推送类似的广告。这种利用你的浏
: 览记录类似的推送根本不是什么高科技,个人数据收集越多,推送越准。

I
Ignius

现在提交的deal明明控制权在bd手里,oracle只是partner,负责数据的存储和安全。
你还嘴硬啥呀?
【 在 insect9 (insect9) 的大作中提到: 】
: 交出控制权就行,源代码无所谓。
I
Ignius

真是无知者无畏呀。
【 在 TopHuang (Raptor) 的大作中提到: 】
: 什么小P网站都会用cookie追踪你的浏览记录,然后推送类似的广告。这种利用你的
浏览记录类似的推送根本不是什么高科技,个人数据收集越多,推送越准。
I
Ignius

推荐算法是没啥难。关键是那些优化出来的参数,怎样精准把握用户的taste。否则fb
和谷歌这么牛逼的公司做出来的玩意咋没人用呢。
【 在 daemonself1 (daemon) 的大作中提到: 】
: 推荐算法是最简单的ai,什么样的马农和ds会觉得推荐算法很难,真神奇
b
bingya

呵呵呵
这完全是两回事

简单的pattern,大家都会
比如说用户top黄喜欢看抖大腿的视频,这个pattern很容易分析出来
下面的事情大家都会做,向top黄推送抖大腿的视频,顺带着挂几个丝袜广告
可是现在的关键是,成千上万的视频,你怎么知道那个抖的是大腿,你不能把一个抖胳膊的推给top黄
还有,top黄喜欢的是白腿黑丝袜,你不能给他推个黄腿肉丝袜的

【 在 TopHuang (Raptor) 的大作中提到: 】
: 什么小P网站都会用cookie追踪你的浏览记录,然后推送类似的广告。这种利用你的浏
: 览记录类似的推送根本不是什么高科技,个人数据收集越多,推送越准。

w
wgyeric

re
i
insect9

美国这帮公私被政治正确洗脑洗得,全部精力都放在怎么给用户不想要的东西上来。所谓AI fairness, 李飞飞就是搞这玩意的。

什么是AI fairness呢,简单的例子就是“适合女性的工作”这样一个搜索词条,你要
是光出教师,护士,那就是政治不正确。AI fairness就是要解决这种隐形的性别假设
,调整算法把女科学家,女CEO调到结果页的前排。

这么个项目在2016, 2017年成为了公司的重点优先项目。而且明确说了导致的营收下降点击率下降属于正常,不放在考核指标里。

2018年之后这玩意实在做不下去,项目砍了。但每次开会都要提出来说这只是因为我们人手不够,人手够了要继续做。

这种做法和糙快猛的直接用户投票比推荐效果,谁好谁坏不是显然的嘛。

【 在 daemonself1 的大作中提到: 】
:
:不是没什麽难的,根本就是很简单,黄赌毒人人都爱,就推荐这些就好
:【 在 TopHuang (Raptor) 的大作中提到: 】
:: 这是想多了。算法没什么难的,美国公司这方面的限制主要是法律隐私方面的。
:: 中国这方面上上下下比较流氓,各种个人隐私数据随便拿训练出的比较好的结果罢
了。
:: 美国拿了中国公司的数据,反而走了数据的捷径。
:: oracle
:
:
:
:

i
insect9

推荐不是这么做的。。。。。

哪个视频是抖大腿的很简单,只看抖大腿的用户看的视屏就是抖大腿的。推荐算法本质上是个聚类学习,而不是模式识别。后台都不需要这些是抖大腿视频,他只要知道和你看一样视频的人都看了,你就多半也看。你常看的up主发布的新视频你多半也看。

【 在 bingya 的大作中提到: 】
:
:呵呵呵
:这完全是两回事
:
:简单的pattern,大家都会
:比如说用户top黄喜欢看抖大腿的视频,这个pattern很容易分析出来
:下面的事情大家都会做,向top黄推送抖大腿的视频,顺带着挂几个丝袜广告
:可是现在的关键是,成千上万的视频,你怎么知道那个抖的是大腿,你不能把一个抖
胳膊的推给top黄
:还有,top黄喜欢的是白腿黑丝袜,你不能给他推个黄腿肉丝袜的
:
:【 在 TopHuang (Raptor) 的大作中提到: 】
:: 什么小P网站都会用cookie追踪你的浏览记录,然后推送类似的广告。这种利用你的浏

I
Ignius

这才是懂行的。楼上几个不懂装懂。还以为抖音的核心算法就是个简单的推荐,还尼玛拿cookie来类比。笑死人了。我简单的说说,首先是对新上传的双重审核,ai机器审核和人工审核,防止重复内容,并且通过抽取视频中的画面、关键帧,与抖音大数据库中已存在的海量作品进行匹配消重,来决定内容流量推荐的权重。然后就是叠加推荐算法,和对老作品的挖坟(数据挖掘)

【 在 bingya (bing) 的大作中提到: 】
: 呵呵呵
: 这完全是两回事
: 简单的pattern,大家都会
: 比如说用户top黄喜欢看抖大腿的视频,这个pattern很容易分析出来下面的事情大家都会做,向top黄推送抖大腿的视频,顺带着挂几个丝袜广告可是现在的关键是,成千
上万的视频,你怎么知道那个抖的是大腿,你不能把一个抖胳膊的推给top黄
: 还有,top黄喜欢的是白腿黑丝袜,你不能给他推个黄腿肉丝袜的
h
helloterran

哈哈哈哈哈哈

看看fb的asso,界面逻辑一模一样,使用体验就是一坨屎

oracle有个屁的技术开发推送算法

把模型结构亮给他们看他们都看不懂

【 在 TopHuang (Raptor) 的大作中提到: 】
: 这是想多了。算法没什么难的,美国公司这方面的限制主要是法律个人隐私数据保护方
: 面的。
:
: 中国这方面上上下下比较流氓,各种个人隐私数据随便拿训练出的比较好的结果罢了。
: 美国拿了中国公司的数据,反而走了数据的捷径。
:
: 【 在 helloterran (hi you) 的大作中提到: 】
: : 你这两个说法都缺乏常识
: : 1 oracle没有那个水平,不可能开发出tiktok的替代算法。bd技术上也不可能跟
: oracle
: : 签无限期的licensing协议
: : 2 用户数据和推荐算法紧密耦合,谁也离不开谁。所谓只买operation不买算法纯
粹外
: : 行记者扯淡
: : 新。
I
Ignius

你也太能扯蛋了。
这个只是推荐的一种方式,已经有些过时了。比如fb广告的customize audience. 就是把你的app的一部分用户id提供给fb,然后fb按照这些用户ID的特点给你找出上万个聚
类的用户群来,供你做广告推广的target audience。现在因为对用户隐私的保护,这
个越来越做不下去了。

【 在 insect9 (insect9) 的大作中提到: 】
: 推荐不是这么做的。。。。。
: 哪个视频是抖大腿的很简单,只看抖大腿的用户看的视屏就是抖大腿的。推荐算法本质上是个聚类学习,而不是模式识别。后台都不需要这些是抖大腿视频,他只要知道和你看一样视频的人都看了,你就多半也看。你常看的up主发布的新视频你多半也看。
h
helloterran

对对对,火箭最好烧无烟煤

【 在 TopHuang (Raptor) 的大作中提到: 】
: 什么小P网站都会用cookie追踪你的浏览记录,然后推送类似的广告。这种利用你的浏
: 览记录类似的推送根本不是什么高科技,个人数据收集越多,推送越准。
:
: 【 在 daemonself1 (daemon) 的大作中提到: 】
: : 不是没什麽难的,根本就是很简单,黄赌毒人人都爱,就推荐这些就好
I
Ignius

fb也搞ai fairness? 这蛋扯得太大了。
【 在 insect9 (insect9) 的大作中提到: 】
: 美国这帮公私被政治正确洗脑洗得,全部精力都放在怎么给用户不想要的东西上来。所谓AI fairness, 李飞飞就是搞这玩意的。
: 什么是AI fairness呢,简单的例子就是“适合女性的工作”这样一个搜索词条,你
要是光出教师,护士,那就是政治不正确。AI fairness就是要解决这种隐形的性别假
设,调整算法把女科学家,女CEO调到结果页的前排。
: 这么个项目在2016, 2017年成为了公司的重点优先项目。而且明确说了导致的营收下降点击率下降属于正常,不放在考核指标里。
: 2018年之后这玩意实在做不下去,项目砍了。但每次开会都要提出来说这只是因为我们人手不够,人手够了要继续做。
: 这种做法和糙快猛的直接用户投票比推荐效果,谁好谁坏不是显然的嘛。
i
insect9

呵呵,说的好像你做这一行似的。不用custom audience的CPC比用了的低30%。你一句
做不下去了就做不下去了?禁cookie死掉的是bluekie这样第三方卖数据的,狗脸这种
直接用登陆用户信息上first party cookie 绕开一切限制。

你说的这些东西都是公司出来宣讲的时候忽悠人用的,和实际产品上用来赚钱的技术压根不是一套东西。

【 在 Ignius 的大作中提到: 】
:
:这个只是推荐的一种方式,已经有些过时了。比如fb广告的customize audience. 就
是把你的app的一部分用户id提供给fb,然后fb按照这些用户ID的特点给你找出上万个聚
:类的用户群来,供你做广告推广的target audience。现在因为对用户隐私的保护,这:个越来越做不下去了。
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 推荐不是这么做的。。。。。
:: 哪个视频是抖大腿的很简单,只看抖大腿的用户看的视屏就是抖大腿的。推荐算法
本质上是个聚类学习,而不是模式识别。后台都不需要这些是抖大腿视频,他只要知道和你看一样视频的人都看了,你就多半也看。你常看的up主发布的新视频你多半也看。
:

n
nfnmd


oracle分分钟花十亿挖1000个抖音的人你信不信

【 在 helloterran (hi you) 的大作中提到: 】
: 哈哈哈哈哈哈
: 看看fb的asso,界面逻辑一模一样,使用体验就是一坨屎
: oracle有个屁的技术开发推送算法
: 把模型结构亮给他们看他们都看不懂
: 粹外

i
insect9

AI fairness可是研究重点,狗家去年把搜索和广告两个部门里面不直接和广告定价相
关的AI部分抽出来弄了个跨部门的大组,专门研究fairness。这还不算youtube那边从
2016年之后一门心思扑在AI fairness上的。每次开会都一堆人跳出来要做AI fact
check。

核心宗旨就是用户都是傻逼,他想看的都是骗人的,咱们要治病救人,不能给他们他们要看的!

【 在 Ignius 的大作中提到: 】
:
:fb也搞ai fairness? 这蛋扯得太大了。
:【 在 insect9 (insect9) 的大作中提到: 】
:: 美国这帮公私被政治正确洗脑洗得,全部精力都放在怎么给用户不想要的东西上来
。所谓AI fairness, 李飞飞就是搞这玩意的。
:: 什么是AI fairness呢,简单的例子就是“适合女性的工作”这样一个搜索词条,你:要是光出教师,护士,那就是政治不正确。AI fairness就是要解决这种隐形的性别假:设,调整算法把女科学家,女CEO调到结果页的前排。
:: 这么个项目在2016, 2017年成为了公司的重点优先项目。而且明确说了导致的营收
下降点击率下降属于正常,不放在考核指标里。
:: 2018年之后这玩意实在做不下去,项目砍了。但每次开会都要提出来说这只是因为
我们人手不够,人手够了要继续做。
:: 这种做法和糙快猛的直接用户投票比推荐效果,谁好谁坏不是显然的嘛。
:

I
Ignius

那也是只限于G一家。我早说了G家高智商作弊成群。fb没听说搞这个。
I
Ignius

我还真就是搞这一行的,fb广告的custom audience我是最早使用的,属于early
adopter,曾经非常好用。fb一开始上传的用户ID都没有hash,还是我汇报的bug。但是现在很少用了。因为越来越不好用了。还不如我自己配置的kpi指标精准。

【 在 insect9 (insect9) 的大作中提到: 】
: 呵呵,说的好像你做这一行似的。不用custom audience的CPC比用了的低30%。你一
句做不下去了就做不下去了?禁cookie死掉的是bluekie这样第三方卖数据的,狗脸这
种直接用登陆用户信息上first party cookie 绕开一切限制。
: 你说的这些东西都是公司出来宣讲的时候忽悠人用的,和实际产品上用来赚钱的技术压根不是一套东西。
i
insect9

FB 2016年专门成立了一个组用AI做fact check,试图来鉴别FB上发的假新闻。唯一比
Twitter要点脸的是做不出来就干脆不发布了,不像Twitter直接找CNN来当中立媒体人
工标注。

【 在 Ignius 的大作中提到: 】
:
:那也是只限于G一家。我早说了G家高智商作弊成群。fb没听说搞这个。
:

i
insect9

错了,不是2016年,是2017年。

【 在 insect9 的大作中提到: 】
:
:FB 2016年专门成立了一个组用AI做fact check,试图来鉴别FB上发的假新闻。唯一比:Twitter要点脸的是做不出来就干脆不发布了,不像Twitter直接找CNN来当中立媒体人:工标注。
:
:【 在 Ignius 的大作中提到: 】
::
::那也是只限于G一家。我早说了G家高智商作弊成群。fb没听说搞这个。
::
:
:

I
Ignius

这个跟fb做推荐算法有啥关系,你跑题跑的太远了。
【 在 insect9 (insect9) 的大作中提到: 】
: FB 2016年专门成立了一个组用AI做fact check,试图来鉴别FB上发的假新闻。唯一
比Twitter要点脸的是做不出来就干脆不发布了,不像Twitter直接找CNN来当中立媒体
人工标注。
I
Ignius

挖低级码工有啥用呀?抖音里真正掌握了核心推荐算法的不超过5个人,都被供起来了
。oracle挖个屁,人家还不愿意来美国呢。

【 在 nfnmd (我爱总复习) 的大作中提到: 】
: oracle分分钟花十亿挖1000个抖音的人你信不信
i
insect9

智商呀,fact check之后就是shadow ban, 加mark, 降低推荐权重呀。

所有这些措施的效果都是一样,降低推荐相关性。推荐相关性最好的做法就是无视内容,直接做用户聚类。其他的花里胡哨的内容理解都是发文章吹牛用的,同时满足一下AI fairness社会责任感的心理诉求。

“社会责任感”越低,推荐效果越好,这是铁律。

【 在 Ignius 的大作中提到: 】
:
:这个跟fb做推荐算法有啥关系,你跑题跑的太远了。
:【 在 insect9 (insect9) 的大作中提到: 】
:: FB 2016年专门成立了一个组用AI做fact check,试图来鉴别FB上发的假新闻。唯一:比Twitter要点脸的是做不出来就干脆不发布了,不像Twitter直接找CNN来当中立媒体:人工标注。
:

n
nfnmd

这就很扯了,你当算法是可乐糖浆?

【 在 Ignius (Hyperion) 的大作中提到: 】
: 挖低级码工有啥用呀?抖音里真正掌握了核心推荐算法的不超过5个人,都被供起来了
: 。oracle挖个屁,人家还不愿意来美国呢。

d
daemonself1

其实说难听了,视频推荐是tmd推荐里面最最最最简单的,就是用户都tmd爱看点俗的,所以你那参数调的庸俗点就好了,我看抖音推荐的水平不怎么低,远不如pornhub,我都鲁的停不下来
【 在 insect9 (insect9) 的大作中提到: 】
: 智商呀,fact check之后就是shadow ban, 加mark, 降低推荐权重呀。
: 所有这些措施的效果都是一样,降低推荐相关性。推荐相关性最好的做法就是无视内容
: ,直接做用户聚类。其他的花里胡哨的内容理解都是发文章吹牛用的,同时满足一下AI
: fairness社会责任感的心理诉求。
: “社会责任感”越低,推荐效果越好,这是铁律。
: :
: :这个跟fb做推荐算法有啥关系,你跑题跑的太远了。
: :【 在 insect9 (insect9) 的大作中提到: 】
: :: FB 2016年专门成立了一个组用AI做fact check,试图来鉴别FB上发的假新闻。唯一
: :比Twitter要点脸的是做不出来就干脆不发布了,不像Twitter直接找CNN来当中立媒体
: ...................

I
Ignius

美国不是也指控抖音根据tg要求对用户的内容做censorship吗?fb,谷歌的推荐算法做不过抖音没啥丢人的。你不用嘴硬了。
【 在 insect9 (insect9) 的大作中提到: 】
: 智商呀,fact check之后就是shadow ban, 加mark, 降低推荐权重呀。
: 所有这些措施的效果都是一样,降低推荐相关性。推荐相关性最好的做法就是无视内容,直接做用户聚类。其他的花里胡哨的内容理解都是发文章吹牛用的,同时满足一下AI fairness社会责任感的心理诉求。
: “社会责任感”越低,推荐效果越好,这是铁律。
I
Ignius

是黑盒。现在外界的人都是靠猜,有的猜的接近些,有的猜得差得很远。
【 在 nfnmd (我爱总复习) 的大作中提到: 】
: 这就很扯了,你当算法是可乐糖浆?
I
Ignius

pornhub的推荐每次看到的内容都几乎一样,重复性太高了,哪能跟抖音每天都有大量
的新内容相比。你太能扯了。
i
insect9

推荐算法都不知道啥是低俗的啥不是。但只要不封内容,最后热门的一定都是低俗的。最基本的远离是reddit的顶和踩,然后根据你顶和踩的内容,把你和和你一样偏好的人聚在一起形成一个chamber room最后不断的推荐这个chamber room里最热门的内容就完了。

而现在美国的公司的AI研究方向全都是怎么样能不形成chamber room。因为你啥都不做就会有自然的聚集性,最后发展成菌斑那样的神经病院。

短视频这种东西,从诞生之初就是神经病院,所以这推荐特好做。

【 在 daemonself1 的大作中提到: 】
:
:其实说难听了,视频推荐是tmd推荐里面最最最最简单的,就是用户都tmd爱看点俗的
,所以你那参数调的庸俗点就好了,我看抖音推荐的水平不怎么低,远不如pornhub,我都鲁的停不下来
:【 在 insect9 (insect9) 的大作中提到: 】
:: 智商呀,fact check之后就是shadow ban, 加mark, 降低推荐权重呀。
:: 所有这些措施的效果都是一样,降低推荐相关性。推荐相关性最好的做法就是无视
内容
:: ,直接做用户聚类。其他的花里胡哨的内容理解都是发文章吹牛用的,同时满足一
下AI
:: fairness社会责任感的心理诉求。
:: “社会责任感”越低,推荐效果越好,这是铁律。
:: :
:: :这个跟fb做推荐算法有啥关系,你跑题跑的太远了。
:: :【 在 insect9 (insect9) 的大作中提到: 】
:: :: FB 2016年专门成立了一个组用AI做fact check,试图来鉴别FB上发的假新闻。
唯一

I
Ignius

每天来美新版的人都有啥偏好?抖音应该推荐给美新版的人什么内容?
【 在 insect9 (insect9) 的大作中提到: 】
: 推荐算法都不知道啥是低俗的啥不是。但只要不封内容,最后热门的一定都是低俗的。最基本的远离是reddit的顶和踩,然后根据你顶和踩的内容,把你和和你一样偏好的人聚在一起形成一个chamber room最后不断的推荐这个chamber room里最热门的内容就完了。
: 而现在美国的公司的AI研究方向全都是怎么样能不形成chamber room。因为你啥都不做就会有自然的聚集性,最后发展成菌斑那样的神经病院。
: 短视频这种东西,从诞生之初就是神经病院,所以这推荐特好做。
I
Ignius

抖音的两个推荐源一种是content-based推荐,一个是user-based推荐。会兼顾大众探
索性的内容和用户已知历史个性化的内容。触发层会有多个推荐源的数据被召回,排序层做最后的融合排序。

【 在 insect9 (insect9) 的大作中提到: 】
: 推荐算法都不知道啥是低俗的啥不是。但只要不封内容,最后热门的一定都是低俗的。最基本的远离是reddit的顶和踩,然后根据你顶和踩的内容,把你和和你一样偏好的人聚在一起形成一个chamber room最后不断的推荐这个chamber room里最热门的内容就完了。
: 而现在美国的公司的AI研究方向全都是怎么样能不形成chamber room。因为你啥都不做就会有自然的聚集性,最后发展成菌斑那样的神经病院。
: 短视频这种东西,从诞生之初就是神经病院,所以这推荐特好做。
i
insect9

尼扯这些没用呀,content based说的是用户和up主的相关度,user based说的是用户
和看过这个视频的其他用户的相关度。

真用图像识别做的话很容易翻车,因为目前的人工智障不可能根据图像内容来区分这是撸猫的视频还是虐猫的视频。是黑tesla的车评还是舔tesla的车评,扫到一个元素加个关键字就推荐太容易翻车了。直接推荐兴趣爱好和你高度重合的人看的视频多安全。。。。。。

【 在 Ignius 的大作中提到: 】
:
:抖音的两个推荐源一种是content-based推荐,一个是user-based推荐。会兼顾大众探:索性的内容和用户已知历史个性化的内容。触发层会有多个推荐源的数据被召回,排
序层做最后的融合排序。
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 推荐算法都不知道啥是低俗的啥不是。但只要不封内容,最后热门的一定都是低俗
的。最基本的远离是reddit的顶和踩,然后根据你顶和踩的内容,把你和和你一样偏好的人聚在一起形成一个chamber room最后不断的推荐这个chamber room里最热门的内容就完了。
:: 而现在美国的公司的AI研究方向全都是怎么样能不形成chamber room。因为你啥都
不做就会有自然的聚集性,最后发展成菌斑那样的神经病院。
:: 短视频这种东西,从诞生之初就是神经病院,所以这推荐特好做。
:

I
Ignius

这个纯属瞎扯蛋了。抖音的推荐算法很复杂的,需要参考多个维度:内容,用户特征和环境特征。结合三方面的维度,推荐模型会给出一个预估,即推测推荐内容在这一场景下对这一用户是否合适。 这个推荐系统还需要一个非常灵活的实验平台,可以支持各
种学习监督算法的组合。你说的那种只是其中的一种罢了。抖音模型支持LR,FM,GBDT,DNN等几种算话的组合。fb以前用的就是LR和GBDT的组合。现在抖音用的应该是LR和
dnn组合。

你不做对视频主帧图像识别,怎么对上传的新视频与老视频匹配和消重?

【 在 insect9 (insect9) 的大作中提到: 】
: 尼扯这些没用呀,content based说的是用户和up主的相关度,user based说的是用
户和看过这个视频的其他用户的相关度。
: 真用图像识别做的话很容易翻车,因为目前的人工智障不可能根据图像内容来区分这是撸猫的视频还是虐猫的视频。是黑tesla的车评还是舔tesla的车评,扫到一个元素加个关键字就推荐太容易翻车了。直接推荐兴趣爱好和你高度重合的人看的视频多安全。。。。。。
h
helloterran

levels.fyi看看oracle的薪资结构再来扯淡行不?

友提,oracle ic4的平均包还不如fb e4平均包。但是e4的中位年限是3.7年。ic4中位
年限多少?13.4年!

在oracle干10年,还不如faang刚入职的小年轻。这个人早就废了,这个公司的现状就
是无解,无解!

字节包裹比fb又高出20%,你oracle挖个屁啊

你们川轮不要因为oracle老大给川普捐了点钱,就拼命给这个过气公司涂脂抹粉。

Ellison从来都是见风使舵,回头就把川普骂个狗血喷头

【 在 nfnmd (我爱总复习) 的大作中提到: 】
: oracle分分钟花十亿挖1000个抖音的人你信不信
:
: 【 在 helloterran (hi you) 的大作中提到: 】
: : 哈哈哈哈哈哈
: : 看看fb的asso,界面逻辑一模一样,使用体验就是一坨屎
: : oracle有个屁的技术开发推送算法
: : 把模型结构亮给他们看他们都看不懂
: : 粹外
h
helloterran

笑死,为了抬杠而装逼放炮,至于这么入戏么?

你说的这几种情况都是最容易鉴别的。关键帧加上提取音频识别一下内容就完事儿。

【 在 insect9 (insect9) 的大作中提到: 】
: 尼扯这些没用呀,content based说的是用户和up主的相关度,user based说的是用户
: 和看过这个视频的其他用户的相关度。
:
: 真用图像识别做的话很容易翻车,因为目前的人工智障不可能根据图像内容来区分这是
: 撸猫的视频还是虐猫的视频。是黑tesla的车评还是舔tesla的车评,扫到一个元素加个
: 关键字就推荐太容易翻车了。直接推荐兴趣爱好和你高度重合的人看的视频多安全。。
: 。。。。
:
: 【 在 Ignius 的大作中提到: 】
: :
: :抖音的两个推荐源一种是content-based推荐,一个是user-based推荐。会兼顾大众探
: :索性的内容和用户已知历史个性化的内容。触发层会有多个推荐源的数据被召回,排
: 序层做最后的融合排序。
: :
: :【 在 insect9 (insect9) 的大作中提到: 】
: :: 推荐算法都不知道啥是低俗的啥不是。但只要不封内容,最后热门的一定都是低俗
: 的。最基本的远离是reddit的顶和踩,然后根据你顶和踩的内容,把你和和你一样偏好
: 的人聚在一起形成一个chamber room最后不断的推荐这个chamber room里最热门的内容
: 就完了。
: :: 而现在美国的公司的AI研究方向全都是怎么样能不形成chamber room。因为你啥都
: 不做就会有自然的聚集性,最后发展成菌斑那样的神经病院。
: :: 短视频这种东西,从诞生之初就是神经病院,所以这推荐特好做。
: :
i
insect9

你分的清楚去重和entity identification的技术差别吗?你这纯粹属于公司的文宣材
料看多了,拿一堆PR用的技术名词当卖点。

Bing刚出来的时候用的排序算法比狗新多了,你要用相同用户数据去调bing的搜索引擎效果比狗还好。问题是屁用没有,用户历史数据比狗差一个量级,你算法再好也没用。

狗的中文搜索也基本完蛋了,因为完全没有用户数据。你现在盲测对比Baidu和狗的中
文搜索质量,输的一定是狗。

最基本的模型,堆数据量才是核心。新模型在上面修修补补都是码农混饭的。那一点点所谓的改进主要靠裁剪数据编报告,你指望用户能感知出差别那纯粹是想多了。

【 在 Ignius 的大作中提到: 】
:
:这个纯属瞎扯蛋了。抖音的推荐算法很复杂的,需要参考多个维度:内容,用户特征
和环境特征。结合三方面的维度,推荐模型会给出一个预估,即推测推荐内容在这一场景下对这一用户是否合适。 这个推荐系统还需要一个非常灵活的实验平台,可以支持各
:种学习监督算法的组合。你说的那种只是其中的一种罢了。抖音模型支持LR,FM,
GBDT,DNN等几种算话的组合。fb以前用的就是LR和GBDT的组合。现在抖音用的应该是
LR和
:dnn组合。
:
:你不做对视频主帧图像识别,怎么对上传的新视频与老视频匹配和消重?
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 尼扯这些没用呀,content based说的是用户和up主的相关度,user based说的是用:户和看过这个视频的其他用户的相关度。
:: 真用图像识别做的话很容易翻车,因为目前的人工智障不可能根据图像内容来区分
这是撸猫的视频还是虐猫的视频。是黑tesla的车评还是舔tesla的车评,扫到一个元素加个关键字就推荐太容易翻车了。直接推荐兴趣爱好和你高度重合的人看的视频多安全。。。。。。
:

I
Ignius

又开始转进了?你刚才不说根本不用图像识别吗?而且我发现你眼神确实有问题。我明明说的是匹配和消重。你就把匹配二字给忽略了?既然有图像识别技术,当然可以通过dnn来做identification和classificatuon。而且这个又不用像特斯拉的autopilot那样高的准确率。

fb的推荐算法比不过抖音,是因为它用了gbdt,在图像处理方面远远不如dnn。你敢说fb的用户量少?你这不是瞎扯淡吗。你可能这方面就懂些皮毛,然后就在这里乱说了。比博导根本不懂得好点有限。

【 在 insect9 (insect9) 的大作中提到: 】
: 你分的清楚去重和entity identification的技术差别吗?你这纯粹属于公司的文宣
材料看多了,拿一堆PR用的技术名词当卖点。
: Bing刚出来的时候用的排序算法比狗新多了,你要用相同用户数据去调bing的搜索引擎效果比狗还好。问题是屁用没有,用户历史数据比狗差一个量级,你算法再好也没用。
: 狗的中文搜索也基本完蛋了,因为完全没有用户数据。你现在盲测对比Baidu和狗的
中文搜索质量,输的一定是狗。
: 最基本的模型,堆数据量才是核心。新模型在上面修修补补都是码农混饭的。那一点点所谓的改进主要靠裁剪数据编报告,你指望用户能感知出差别那纯粹是想多了。
n
nfnmd

第一次听说挖人是按平均工资给钱的

【 在 helloterran (hi you) 的大作中提到: 】
: levels.fyi看看oracle的薪资结构再来扯淡行不?
: 友提,oracle ic4的平均包还不如fb e4平均包。但是e4的中位年限是3.7年。ic4中位
: 年限多少?13.4年!
: 在oracle干10年,还不如faang刚入职的小年轻。这个人早就废了,这个公司的现状就
: 是无解,无解!
: 字节包裹比fb又高出20%,你oracle挖个屁啊
: 你们川轮不要因为oracle老大给川普捐了点钱,就拼命给这个过气公司涂脂抹粉。
: Ellison从来都是见风使舵,回头就把川普骂个狗血喷头

h
helloterran

第一次听说lowb公司被喷子嘴炮指挥就能挖到人做成项目的

喷子这套逻辑要是能行,oracle一开始就不会过气嘛哈哈哈

“分分钟拍出10亿挖1000个tiktok员工”,xswl

【 在 nfnmd (我爱总复习) 的大作中提到: 】
: 第一次听说挖人是按平均工资给钱的
:
: 【 在 helloterran (hi you) 的大作中提到: 】
: : levels.fyi看看oracle的薪资结构再来扯淡行不?
: : 友提,oracle ic4的平均包还不如fb e4平均包。但是e4的中位年限是3.7年。ic4
中位
: : 年限多少?13.4年!
: : 在oracle干10年,还不如faang刚入职的小年轻。这个人早就废了,这个公司的现
状就
: : 是无解,无解!
: : 字节包裹比fb又高出20%,你oracle挖个屁啊
: : 你们川轮不要因为oracle老大给川普捐了点钱,就拼命给这个过气公司涂脂抹粉。: : Ellison从来都是见风使舵,回头就把川普骂个狗血喷头
I
Ignius

人在国内被bd供奉着,吃香的喝辣的,股票期权还有暴涨的机会。oracle拿啥挖呀?而且人家已经成了公司的核心,到了一定的地位就不是钱的事了。你以为像你们打工仔一样给个大包就去了?井底之蛙。

【 在 nfnmd (我爱总复习) 的大作中提到: 】
: 第一次听说挖人是按平均工资给钱的
l
ludovic

扯蛋的代碼。代碼重寫一遍化不了多少時間。就是調参需要時間。但是如果沒有了
riktok,沒啥競爭,過段時間就調出來了。這個東西難點在郀I思路,思路對了剩下不
難。

【 在 Ignius (Hyperion) 的大作中提到: 】
: 老川可以说,把抖音美国用户的数据交给oracle这个“trusted tech partner”.来管
: 理,安全性就没问题了。反正大多数红脖不懂这个,老川说啥就信啥呗。tg已经表明态
: 度了,想要核心代码没门,宁可把抖音北美业务关了。oracle现在这个deal就相当于抖
: 音把北美抖音的it work外包给oracle了。oracle躺着收钱。抖音花钱消灾。
: 程序,那明显不符合聚聚对tiktok强制出售的要求,估计大概率聚聚不会同意。

I
Ignius

你咋不去问问facebook做的短视频lasso
为啥没人用呢?Facebook用户少吗?会写代码的不够多吗? 无知的人认为什么东西都
很简单,一叶障目啊。楼上一个同学还拿cookies来类比呢。你咋不说你会做独木船,
就能制造航母了呢。

【 在 ludovic (荷叶粉蒸肉) 的大作中提到: 】
: 扯蛋的代碼。代碼重寫一遍化不了多少時間。就是調参需要時間。但是如果沒有了
riktok,沒啥競爭,過段時間就調出來了。這個東西難點在郀I思路,思路對了剩下不
難。
T
TopHuang

摆脱,不是说和cookie是一回事,是说像cookie一样掌握你的浏览记录推送分析就很容易了

YouTube天天给你推送你想要的东西。tiktok火起来只不过抢了手机界面优化的短视频
这块市场,先入为主而已。并不是技术上有什么优势。

tiktok注册用户,先让你自己选一堆你感兴趣的categories,这已经简化了很多推送过程了。

你这才是无知者无畏呢

【 在 Ignius (Hyperion) 的大作中提到: 】
: 这才是懂行的。楼上几个不懂装懂。还以为抖音的核心算法就是个简单的推荐,还尼玛
: 拿cookie来类比。笑死人了。我简单的说说,首先是对新上传的双重审核,ai机器审核
: 和人工审核,防止重复内容,并且通过抽取视频中的画面、关键帧,与抖音大数据库中
: 已存在的海量作品进行匹配消重,来决定内容流量推荐的权重。然后就是叠加推荐算法
: ,和对老作品的挖坟(数据挖掘)
: 都会做,向top黄推送抖大腿的视频,顺带着挂几个丝袜广告可是现在的关键是,成千
: 上万的视频,你怎么知道那个抖的是大腿,你不能把一个抖胳膊的推给top黄

T
TopHuang

这什么难的,就是图像识别。听说过google lens吧?至于种族肤色这些,也只有中国
人敢搞,这在美国要是把这些条件放在算法里面,被人知道了,这个公司会被骂死的。

【 在 bingya (bing) 的大作中提到: 】
: 呵呵呵
: 这完全是两回事
: 简单的pattern,大家都会
: 比如说用户top黄喜欢看抖大腿的视频,这个pattern很容易分析出来
: 下面的事情大家都会做,向top黄推送抖大腿的视频,顺带着挂几个丝袜广告
: 可是现在的关键是,成千上万的视频,你怎么知道那个抖的是大腿,你不能把一个抖胳
: 膊的推给top黄
: 还有,top黄喜欢的是白腿黑丝袜,你不能给他推个黄腿肉丝袜的

I
Ignius

如果这么简单,为啥美国公司没做出来能竞争的呢?还得靠政府来帮着打压。无知的人就是一叶障目呀。以为啥都很简单。这么简单你怎么做不出来呢?
【 在 TopHuang (Raptor) 的大作中提到: 】
: 摆脱,不是说和cookie是一回事,是说像cookie一样掌握你的浏览记录推送分析就很容易了
: YouTube天天给你推送你想要的东西。tiktok火起来只不过抢了手机界面优化的短视
频这块市场,先入为主而已。并不是技术上有什么优势。
: 你这才是无知者无畏呢
T
TopHuang

你非要不懂装懂,这和技术门槛没有关系,都是一个timing和用户粘滞性的问题

tiktok在美国也不是从零开始的,买了musically基础上搞的,一样的道理

【 在 Ignius (Hyperion) 的大作中提到: 】
: 如果这么简单,为啥美国公司没做出来能竞争的呢?还得靠政府来帮着打压。无知的人
: 就是一叶障目呀。以为啥都很简单。这么简单你怎么做不出来呢?
: 容易了
: 频这块市场,先入为主而已。并不是技术上有什么优势。

I
Ignius

你才不懂装懂呢。我就问你,为啥fb做的lasso那么烂。fb的用户少吗?用户粘滞性不
够吗?为啥他们不用lasso,用tiktok?
【 在 TopHuang (Raptor) 的大作中提到: 】
: 你非要不懂装懂,这和技术门槛没有关系,都是一个timing和用户粘滞性的问题
h
helloterran

我替他回答,因为扎克伯格有原则,有底线。 不屑于挖掘用户数据。lol

【 在 Ignius (Hyperion) 的大作中提到: 】
: 你才不懂装懂呢。我就问你,为啥fb做的lasso那么烂。fb的用户少吗?用户粘滞性不
: 够吗?为啥他们不用lasso,用tiktok?
: 【 在 TopHuang (Raptor) 的大作中提到: 】
: : 你非要不懂装懂,这和技术门槛没有关系,都是一个timing和用户粘滞性的问题
I
Ignius

靠,musical.ly用户量能比得上fb已有用户量吗? tiktok跟lasso都是2018年在美国
launch的。结果一个爆款,一个shutdown。
【 在 TopHuang (Raptor) 的大作中提到: 】
: 你非要不懂装懂,这和技术门槛没有关系,都是一个timing和用户粘滞性的问题
: tiktok在美国也不是从零开始的,买了musically基础上搞的,一样的道理
T
TopHuang

来晚了呗,timing错过了。就像google拼了老命做plus,还是打不过成势的facebok。

【 在 Ignius (Hyperion) 的大作中提到: 】
: 你才不懂装懂呢。我就问你,为啥fb做的lasso那么烂。fb的用户少吗?用户粘滞性不
: 够吗?为啥他们不用lasso,用tiktok?

T
TopHuang

平台app不一样呀,musically已经有现成手机用户短视频群了,Facebook用户又不是
lasso用户。Facebook的手机平台新app一直不行,messenger也搞不过WhatsApp之类的。

【 在 Ignius (Hyperion) 的大作中提到: 】
: 靠,musical.ly用户量能比得上fb已有用户量吗? tiktok跟lasso都是2018年在美国: launch的。结果一个爆款,一个shutdown。

I
Ignius

你太能搞笑了。

Tiktok 2018年8月份在美国上市,lasso 11月份上市。就差了三个月。

fb 2006年9月份开始上市,google plus是2011年6月份开是上市,差了5年。

【 在 TopHuang (Raptor) 的大作中提到: 】
: 来晚了呗,timing错过了。就像google拼了老命做plus,还是打不过成势的facebok

I
Ignius

那Snapchat是怎么被facebook 的Instagram story干掉的?

【 在 TopHuang (Raptor) 的大作中提到: 】
: 平台app不一样呀,musically已经有现成手机用户短视频群了,Facebook用户又不是lasso用户。Facebook的手机平台新app一直不行,messenger也搞不过WhatsApp之类的。
i
insect9

不是timing的问题,你让FB先做也还是一样的结果。核心是所有的美国IT企业从2015年开始至今在用户相关性方面都是在做负优化。大量的时间精力花在过滤所谓fake news, hate speech,racial discrimination上了。就算是上新项目,上来也会把这些条条
框框先过一遍,只留下能在新闻联播上播出的伟光正的内容,能火就怪了。

社交媒体的难点是如何把低俗和盈利统一,低俗带来流量,但这些流量没法通过广告渠道变现。如果一开始就满足广告主的高大上需求,那么一开始就不会有流量。这更多的是盈利模式设计和营销的问题,和技术半毛钱关系没有。

短视频领域真正的技术核心是视频的实时编解码,CDN优化这些直接关系时效性和带宽
费用的方面。盯着推荐算法完全是脑子抽抽了。UI设计都比推荐算法重要多了。

【 在 TopHuang 的大作中提到: 】
:
:来晚了呗,timing错过了。就像google拼了老命做plus,还是打不过成势的facebok。
:
:【 在 Ignius (Hyperion) 的大作中提到: 】
:: 你才不懂装懂呢。我就问你,为啥fb做的lasso那么烂。fb的用户少吗?用户粘滞性不
:: 够吗?为啥他们不用lasso,用tiktok?
:
:
:
:
:

w
wishee

听过联邦学习吗?另外数据也是可以匿名化后再进推荐模型的,对训练模型而言只需要embedding过后的结果,那时已经看不出来原始数据了。国内字节跳动的推荐算法都已
经做成to B的了,自己搜“灵驹”,这个都轻车熟路了。

【 在 insect9 (insect9) 的大作中提到: 】
: 只能是2,1是无法维持的。没法access用户data的话,推荐模型根本无法跟新。而且不
: 是说推荐效果不好那种无法更新,而是针对新用户和新内容无法做出推荐那种无法更新。
: :
: :这个交易如果只是让甲骨文管理经营美国市场,以后还需要从中国字节跳动升级代码
: 程序,那明显不符合聚聚对tiktok强制出售的要求,估计大概率聚聚不会同意。
: :
: :如果甲骨文接手后要自己开发代码升级,那也许能通的过。
: :
: :目前公开信息看来,很可能是前一种,所以通不过的可能性很大,我估计有七八成。
: :
: ...................

i
insect9

匿名化这一步谁做?

【 在 wishee 的大作中提到: 】
:
:听过联邦学习吗?另外数据也是可以匿名化后再进推荐模型的,对训练模型而言只需
要embedding过后的结果,那时已经看不出来原始数据了。国内字节跳动的推荐算法都已
:经做成to B的了,自己搜“灵驹”,这个都轻车熟路了。
:
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 只能是2,1是无法维持的。没法access用户data的话,推荐模型根本无法跟新。而
且不
:: 是说推荐效果不好那种无法更新,而是针对新用户和新内容无法做出推荐那种无法
更新。
:: :
:: :这个交易如果只是让甲骨文管理经营美国市场,以后还需要从中国字节跳动升级代码
:: 程序,那明显不符合聚聚对tiktok强制出售的要求,估计大概率聚聚不会同意。
:: :

w
wishee

感觉你是半桶水,懂一些又不真懂...在字节跳动,做推荐算法的人数10倍于CDN优化,视频编码这些。字节跳动没你懂?tiktok的主流又不是直播,直播谈实时编解码还重要一点;内容主要是ugc,如果是pgc或者ogc(如netflix)那cdn/编解码也会重要一点

【 在 insect9 (insect9) 的大作中提到: 】
: 不是timing的问题,你让FB先做也还是一样的结果。核心是所有的美国IT企业从2015年
: 开始至今在用户相关性方面都是在做负优化。大量的时间精力花在过滤所谓fake
news,
: hate speech,racial discrimination上了。就算是上新项目,上来也会把这些条条
: 框框先过一遍,只留下能在新闻联播上播出的伟光正的内容,能火就怪了。
: 社交媒体的难点是如何把低俗和盈利统一,低俗带来流量,但这些流量没法通过广告渠
: 道变现。如果一开始就满足广告主的高大上需求,那么一开始就不会有流量。这更多的
: 是盈利模式设计和营销的问题,和技术半毛钱关系没有。
: 短视频领域真正的技术核心是视频的实时编解码,CDN优化这些直接关系时效性和带宽
: 费用的方面。盯着推荐算法完全是脑子抽抽了。UI设计都比推荐算法重要多了。
: :
: ...................

T
TopHuang

instagram也是买的,已经有很大的市场占有率了

【 在 Ignius (Hyperion) 的大作中提到: 】
: 那Snapchat是怎么被facebook 的Instagram story干掉的?
: lasso用户。Facebook的手机平台新app一直不行,messenger也搞不过WhatsApp之类
的。

w
wishee

oracle做啊,神经网络很多层的,裸数据先过oracle手上的一层,过过一层就看不出原数据了。剩下模型的主体还是tiktok训。如果是联邦学习,backpropagation可以一路
更新会oracle手上的那一层。

【 在 insect9 (insect9) 的大作中提到: 】
: 匿名化这一步谁做?
: :
: :听过联邦学习吗?另外数据也是可以匿名化后再进推荐模型的,对训练模型而言只需
: 要embedding过后的结果,那时已经看不出来原始数据了。国内字节跳动的推荐算法
都已
: :经做成to B的了,自己搜“灵驹”,这个都轻车熟路了。
: :
: :
: :【 在 insect9 (insect9) 的大作中提到: 】
: :: 只能是2,1是无法维持的。没法access用户data的话,推荐模型根本无法跟新。而
: 且不
: ...................

I
Ignius

你还是没说到点子上。

Tiktok火起来的真正原因是因为它开创一个新的社交文化:social entertainment.
说白了就是供你娱乐大众,搞笑的。

fb,Instagram,这些都是social media, 给别人演示你自己的生活记录。Zuckerberg 一开始认为tiktok就跟Instagram的explore tab一样的功能。 所以lasso一上来方向就搞错了,再加上求推荐算法不如tiktok,当然没人用了。

【 在 insect9 (insect9) 的大作中提到: 】
: 不是timing的问题,你让FB先做也还是一样的结果。核心是所有的美国IT企业从2015年开始至今在用户相关性方面都是在做负优化。大量的时间精力花在过滤所谓fake
news, hate speech,racial discrimination上了。就算是上新项目,上来也会把这些条条框框先过一遍,只留下能在新闻联播上播出的伟光正的内容,能火就怪了。
: 社交媒体的难点是如何把低俗和盈利统一,低俗带来流量,但这些流量没法通过广告渠道变现。如果一开始就满足广告主的高大上需求,那么一开始就不会有流量。这更多的是盈利模式设计和营销的问题,和技术半毛钱关系没有。
: 短视频领域真正的技术核心是视频的实时编解码,CDN优化这些直接关系时效性和带
宽费用的方面。盯着推荐算法完全是脑子抽抽了。UI设计都比推荐算法重要多了。
I
Ignius

我说的是Instagram story。facebook专门针对snapchat推出的竞品,一下子就把
snapchat给crush了。
【 在 TopHuang (Raptor) 的大作中提到: 】
: instagram也是买的,已经有很大的市场占有率了
I
Ignius

这才是懂行的。
【 在 wishee (温顺的野猪) 的大作中提到: 】
: 感觉你是半桶水,懂一些又不真懂...在字节跳动,做推荐算法的人数10倍于CDN优化,视频编码这些。字节跳动没你懂?tiktok的主流又不是直播,直播谈实时编解码还重要一点;内容主要是ugc,如果是pgc或者ogc(如netflix)那cdn/编解码也会重要一点
i
insect9

废话,做推荐算法属于灌水呀,人当然多。CDN优化的核心工作外包出去了人当然少,
剩下的没外包出去的部分能插上手的人也不多,加太多乌七八糟996的人进去除了添乱
还是添乱呀。

【 在 wishee 的大作中提到: 】
:
:感觉你是半桶水,懂一些又不真懂...在字节跳动,做推荐算法的人数10倍于CDN优化
,视频编码这些。字节跳动没你懂?tiktok的主流又不是直播,直播谈实时编解码还重要一点;内容主要是ugc,如果是pgc或者ogc(如netflix)那cdn/编解码也会重要一点
:
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 不是timing的问题,你让FB先做也还是一样的结果。核心是所有的美国IT企业从
2015年
:: 开始至今在用户相关性方面都是在做负优化。大量的时间精力花在过滤所谓fake
:news,
:: hate speech,racial discrimination上了。就算是上新项目,上来也会把这些条条
:: 框框先过一遍,只留下能在新闻联播上播出的伟光正的内容,能火就怪了。
:: 社交媒体的难点是如何把低俗和盈利统一,低俗带来流量,但这些流量没法通过广
告渠
:: 道变现。如果一开始就满足广告主的高大上需求,那么一开始就不会有流量。这更
多的

I
Ignius

开始打滚了。这就没意思了吧。
【 在 insect9 (insect9) 的大作中提到: 】
: 废话,做推荐算法属于灌水呀,人当然多。CDN优化的核心工作外包出去了人当然少
,剩下的没外包出去的部分能插上手的人也不多,加太多乌七八糟996的人进去除了添
乱还是添乱呀。
i
insect9

那就完事了,embedding cluster这一层至少贡献了最终模型效果的80%。之上的多层模型基本是给996调参师们打发时间用的。

【 在 wishee 的大作中提到: 】
:
:oracle做啊,神经网络很多层的,裸数据先过oracle手上的一层,过过一层就看不出
原数据了。剩下模型的主体还是tiktok训。如果是联邦学习,backpropagation可以一路
:更新会oracle手上的那一层。
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 匿名化这一步谁做?
:: :
:: :听过联邦学习吗?另外数据也是可以匿名化后再进推荐模型的,对训练模型而言只需
:: 要embedding过后的结果,那时已经看不出来原始数据了。国内字节跳动的推荐算法:都已
:: :经做成to B的了,自己搜“灵驹”,这个都轻车熟路了。
:: :

d
daemonself1

你是班加罗尔开发法阿,多1万倍又如何?干技术1万sb干出来的只能比1个sb干出来的
更烂,好东西通常就2-3个人搞出来了。最好再加一个鼓励师。很多实验室招小师妹就
是干这个用的,当年我研究生2年纪小师妹进实验室,我一连出了10个点子,老板发了
一堆top文章,5年才用完
【 在 wishee (温顺的野猪) 的大作中提到: 】
: 感觉你是半桶水,懂一些又不真懂...在字节跳动,做推荐算法的人数10倍于CDN优化,
: 视频编码这些。字节跳动没你懂?tiktok的主流又不是直播,直播谈实时编解码还重要
: 一点;内容主要是ugc,如果是pgc或者ogc(如netflix)那cdn/编解码也会重要一点: news,

i
insect9

娱乐大众的产品多了去了,娱乐大众怎么让广告主买单才是问题。反正技术是最不重要的。

【 在 Ignius 的大作中提到: 】
:
:你还是没说到点子上。
:
:Tiktok火起来的真正原因是因为它开创一个新的社交文化:social entertainment.
:说白了就是供你娱乐大众,搞笑的。
:
:fb,Instagram,这些都是social media, 给别人演示你自己的生活记录。Zuckerberg 一开始认为tiktok就跟Instagram的explore tab一样的功能。 所以lasso一上来方向
就搞错了,再加上求推荐算法不如tiktok,当然没人用了。
:
:【 在 insect9 (insect9) 的大作中提到: 】
:: 不是timing的问题,你让FB先做也还是一样的结果。核心是所有的美国IT企业从
2015年开始至今在用户相关性方面都是在做负优化。大量的时间精力花在过滤所谓fake
:news, hate speech,racial discrimination上了。就算是上新项目,上来也会把这
些条条框框先过一遍,只留下能在新闻联播上播出的伟光正的内容,能火就怪了。
:: 社交媒体的难点是如何把低俗和盈利统一,低俗带来流量,但这些流量没法通过广
告渠道变现。如果一开始就满足广告主的高大上需求,那么一开始就不会有流量。这更多的是盈利模式设计和营销的问题,和技术半毛钱关系没有。

i
insect9

你自己去看bytedance他们自己推崇的重要员工是做推荐的还是做基础架构的。。。。。

【 在 Ignius 的大作中提到: 】
:
:开始打滚了。这就没意思了吧。
:【 在 insect9 (insect9) 的大作中提到: 】
:: 废话,做推荐算法属于灌水呀,人当然多。CDN优化的核心工作外包出去了人当然少:,剩下的没外包出去的部分能插上手的人也不多,加太多乌七八糟996的人进去除了添:乱还是添乱呀。
:

w
wishee

你这就像在说一桌菜,主要让人吃饱的是白米饭。但是value是在菜,白米饭是value最小的,因为平凡没花样,你去吃米其林还是路边小店,都是那样。

【 在 insect9 (insect9) 的大作中提到: 】
: 那就完事了,embedding cluster这一层至少贡献了最终模型效果的80%。之上的多层模
: 型基本是给996调参师们打发时间用的。
: :
: :oracle做啊,神经网络很多层的,裸数据先过oracle手上的一层,过过一层就看不出
: 原数据了。剩下模型的主体还是tiktok训。如果是联邦学习,backpropagation可以
一路
: :更新会oracle手上的那一层。
: :
: :【 在 insect9 (insect9) 的大作中提到: 】
: :: 匿名化这一步谁做?
: :: :
: ...................

I
Ignius

这话你说的出口? 怎么优化ctr这门技术对广告平台不重要? 原来广告平台还多了去
呢,为啥fb最好用?蛋不是这样扯的。
【 在 insect9 (insect9) 的大作中提到: 】
: 娱乐大众的产品多了去了,娱乐大众怎么让广告主买单才是问题。反正技术是最不重要的。
I
Ignius

博导,我觉得这里的讨论已经超出了你的知识范畴。还是少说两句,要点脸面好吗?
【 在 daemonself1 (daemon) 的大作中提到: 】
: 你是班加罗尔开发法阿,多1万倍又如何?干技术1万sb干出来的只能比1个sb干出来
的更烂,好东西通常就2-3个人搞出来了。最好再加一个鼓励师。很多实验室招小师妹
就是干这个用的,当年我研究生2年纪小师妹进实验室,我一连出了10个点子,老板发
了一堆top文章,5年才用完
w
wishee

可以,人家公司没你懂,核心工作外包出去,然后专门雇一些人灌水添乱,结果产品还能把FB按在地上揍。你就继续活在自己的世界吧....

【 在 insect9 (insect9) 的大作中提到: 】
: 废话,做推荐算法属于灌水呀,人当然多。CDN优化的核心工作外包出去了人当然少,
: 剩下的没外包出去的部分能插上手的人也不多,加太多乌七八糟996的人进去除了添乱
: 还是添乱呀。
: :
: :感觉你是半桶水,懂一些又不真懂...在字节跳动,做推荐算法的人数10倍于CDN优化
: ,视频编码这些。字节跳动没你懂?tiktok的主流又不是直播,直播谈实时编解码还重
: 要一点;内容主要是ugc,如果是pgc或者ogc(如netflix)那cdn/编解码也会重要一点
: :
: :
: :【 在 insect9 (insect9) 的大作中提到: 】
: ...................

I
Ignius

哈哈哈,笑的我一口咖啡喷在ipad上。
【 在 wishee (温顺的野猪) 的大作中提到: 】
: 可以,人家公司没你懂,核心工作外包出去,然后专门雇一些人灌水添乱,结果产品还能把FB按在地上揍。你就继续活在自己的世界吧....
w
wishee

公司雇人的时候,能确定雇到nb还是sb?当然是在重要的方向多雇一点人,以期雇到nb的概率更大一点。

【 在 daemonself1 (daemon) 的大作中提到: 】
: 你是班加罗尔开发法阿,多1万倍又如何?干技术1万sb干出来的只能比1个sb干出来的
: 更烂,好东西通常就2-3个人搞出来了。最好再加一个鼓励师。很多实验室招小师妹就
: 是干这个用的,当年我研究生2年纪小师妹进实验室,我一连出了10个点子,老板发了
: 一堆top文章,5年才用完

I
Ignius

这话说的。做推荐模型,推荐实验平台,推荐评估系统,不需要基础架构? 你还真以
为推荐算法就是简单的聚类就完了?
【 在 insect9 (insect9) 的大作中提到: 】
: 你自己去看bytedance他们自己推崇的重要员工是做推荐的还是做基础架构的。。。
。。
t
tree9990


【 在 insect9 (insect9) 的大作中提到: 】
: 废话,做推荐算法属于灌水呀,人当然多。CDN优化的核心工作外包出去了人当然少,
: 剩下的没外包出去的部分能插上手的人也不多,加太多乌七八糟996的人进去除了添乱
: 还是添乱呀。
: :
: :感觉你是半桶水,懂一些又不真懂...在字节跳动,做推荐算法的人数10倍于CDN优化
: ,视频编码这些。字节跳动没你懂?tiktok的主流又不是直播,直播谈实时编解码还重
: 要一点;内容主要是ugc,如果是pgc或者ogc(如netflix)那cdn/编解码也会重要一点
: :
: :
: :【 在 insect9 (insect9) 的大作中提到: 】
: ...................

做推荐算法属于灌水????

越说越离谱了
h
helloterran

其实字节的业务模型复杂度远远超过硅谷公司,里面无数的细节都是坑。 喷子一开口
,"推荐算法就那么回事"。

这些喷子可能觉得中国人发掘出的技术方向,那必然是没有深度也不重要的

说到底就是自恨呗

【 在 Ignius (Hyperion) 的大作中提到: 】
: 这话说的。做推荐模型,推荐实验平台,推荐评估系统,不需要基础架构? 你还真以
: 为推荐算法就是简单的聚类就完了?
: 【 在 insect9 (insect9) 的大作中提到: 】
: : 你自己去看bytedance他们自己推崇的重要员工是做推荐的还是做基础架构的。。。
: 。。
I
Ignius

蠢人眼里啥事都很简单,因为他们根本不了解事物背后的原理。一叶障目,不识泰山说的就是这种蠢人。
【 在 helloterran (hi you) 的大作中提到: 】
: 其实字节的业务模型复杂度远远超过硅谷公司,里面无数的细节都是坑。 喷子一开
口,"推荐算法就那么回事"。
: 这些喷子可能觉得中国人发掘出的技术方向,那必然是没有深度也不重要的
: 说到底就是自恨呗