你说的浮躁肯定是有的现象,但是“估计整个google都没人care那些回答的对错,因为万般皆下品,唯有算法高,其他领域的知识都是垃圾”这一估计是你自己的想象。做model的最终要看model的performance的,要比较model出来的结果和真正的/正确的结果有多大出入。这些真正的/正确的结果很多是靠人工label的。做model的很多公司(大的小的都算)都是要花钱买这些labeled data 或者自己直接雇人label这些data,用来train 和 test model。labeling 和 cleaning data都要domain knowledge,这些根本就是modeling的前期工作,是modeling的一部分。
你说的浮躁肯定是有的现象,但是“估计整个google都没人care那些回答的对错,因为万般皆下品,唯有算法高,其他领域的知识都是垃圾”这一估计是你自己的想象。做model的最终要看model的performance的,要比较model出来的结果和真正的/正确的结果有多大出入。这些真正的/正确的结果很多是靠人工label的。做model的很多公司(大的小的都算)都是要花钱买这些labeled data 或者自己直接雇人label这些data,用来train 和 test model。labeling 和 cleaning data都要domain knowledge,这些根本就是modeling的前期工作,是modeling的一部分。
+1 亲身体验,再赞成不过。亲眼见过很多不懂domain language的人设计的ERP乱七八糟
是这样,我队友就是这方面的牛牛。
我总觉得是人为了显得高大上导致词汇乱用后的产物,这两个做好了其实做出的product应该是相似的,但是现实里看公司结构资源配置等。
就算是银行, 保险公司这样的复杂business rule, 只要feed进入llm, 再人工调节一下, train一个model是很容易的事情, 再用这个model 来指导coding, 或者ds
太理想化了 ai替代掉初中级工作后 很难再找到有经验的资深专家来audit
你说的浮躁肯定是有的现象,但是“估计整个google都没人care那些回答的对错,因为万般皆下品,唯有算法高,其他领域的知识都是垃圾”这一估计是你自己的想象。做model的最终要看model的performance的,要比较model出来的结果和真正的/正确的结果有多大出入。这些真正的/正确的结果很多是靠人工label的。做model的很多公司(大的小的都算)都是要花钱买这些labeled data 或者自己直接雇人label这些data,用来train 和 test model。labeling 和 cleaning data都要domain knowledge,这些根本就是modeling的前期工作,是modeling的一部分。
不太可能的。
大模型要工作得好,必须要有成千亿的优质数据点喂给它,才能涌现这种程度的ai。
传统行业的知识都是不公开的。外界公司搞不到这些优质数据点。另外,量必须是海量。其实你可能没有那么多数据喂给大模型。
开源代码和互联网符合这个条件。其他传统领域的工作不符合。
就拿生物来说吧。假论文辣鸡数据假数据这多,喂给大模型有用吗?
这个就是为什么ai不能完全替代人工 专家也是从菜鸟一步步学习进步上来的 中低端工作都没了 高级专家总不会从天而降吧
多谢,我一直觉得专利只能是有形的,因为只有有形的才能判断是否对方使用了自己的idea,和对侵权做出估价和求偿。楼主注册的专利也是某种东西吗,还是思维的分析方法?话说思维的分析方法如何算钱呢?
多谢经验分享!
银行,保险,没有复杂的东西,我都呆过。。。
那是因为你只懂得技术,不懂business. 银行和保险啊里不同lob 差别都很大比如 credit card, auto loan, deposit, small business etc.