DeepSeek聊天机器人,新闻传递可信度仅17%

今日头条
Toutiao
最新回复:2025年1月30日 8点38分 PT
  返回列表
24363 阅读
31 评论
ettoday

▲中国AI新创公司DeepSeek(深度求索)推出新AI模型DeepSeek R1。

媒体监管机构新闻守门人(NewsGuard)今天公布的可信度排名报告指出,在传递新闻和资讯方面,中国AI新创公司深度求索(DeepSeek)聊天机器人准确度仅为17%。

路透社报导,根据新闻守门人报告,在传递新闻和资讯准确度方面,11款人工智慧(AI)聊天机器人中,DeepSeek的聊天机器人排名第10,落后OpenAI的ChatGPT及谷歌(Google)的Gemini等西方竞争对手。

报告显示,DeepSeek聊天机器人在回应新闻相关提示词(prompt)时,有30%的时间会重覆虚假声明,有53%的时间会给出模糊或无用的答案,失效率高达83%。

这高于西方聊天机器人平均失效率62%,引发对于DeepSeek的质疑,DeepSeek声称其AI科技性能可与OpenAI媲美或表现更好,而且成本低许多。

此前,DeepSeek的一款聊天机器人在发布数天后,成为App Store下载最多的应用程式,造成对于美国在AI领先地位的担忧,并且引发市场暴跌,导致美国科技股市值蒸发约1兆美元。

l
lasso
1 楼
就是6句话里面5句是假的。
x
xyz18
2 楼
假话遍地的地方研发出来的科技成果也不会有真话
T
TitaniumAtlas
3 楼
这东西可能窃取数据的时候就忽略了新闻政治这些领域,节省成本也为了避免被土共封杀。
时不时来看看
4 楼
这么高?比Ettday至少高17%个点啊
吸尘器
5 楼
用谎话训练出的AI就是满嘴谎言
清如许1
6 楼
下面是我今天早晨和一个活跃五毛的对答,就是关于这个问题的。我一直等他给我的回答,不知这家伙怎么不到这儿来了。 ajaychen_2024 发表评论于 2025-01-29 05:00:09 那对你来说很重要,对干实事的人没有意义,一点也不重要。况且,你问过CHATGPT有关dei,lgbtqi,美国大选舞弊,1月6号事件和以巴冲突的事情吗?他们能给你准确的答案吗?这些政治议题公说公有理,婆说婆有理,你自己有预设政治立场,又何苦请教他们?又能证明AI的智力有多高呢? ~~~~~~~~~~~~~~~~~~~~~ 你说说为何DeepSeek第一次给出的正确答案后会在等一会后消失,变成了你的问题超出了它的能力范围?为何它连中国现任领导人是谁的问题都变成了忌讳?这还是AI吗?你说的CHATGPT有关dei,lgbtqi会出这些问题吗?这不明显是中国政府在背后操控吗?一个独裁政府操控的AI能被国际社会广泛接受吗? 真为中国AI的开发者们感到悲哀。中国人的智力不比西方人差,可惜被独裁政府束缚了。
t
tudoutudou99
7 楼
Deepseek 不背锅,怪OpenAI,
k
kingdale1
8 楼
懂行的人都会认为这根本不是问题。在中国为了生存不得不加敏感词过滤。并且过滤是表层的,也就是结果出来之后在过滤的,变成“超出了能力范围”。国外已经把开源的系统拿来改造,一天不到就把表层的过滤弄掉了。DeepSeek的贡献在于它的训练方式的优化。让总的成本大大降低。
清如许1
9 楼
TitaniumAtlas 发表评论于 2025-01-29 19:11:25 这东西可能窃取数据的时候就忽略了新闻政治这些领域,节省成本也为了避免被土共封杀。 ~~~~~~~~~~~~~~~~~ 你说说为何DeepSeek在给出新闻政治问题的答案后,等一会还会让(不合中共希望的)答案消失,然后告诉你:你的问题超出了它的能力范围?这是它窃取数据的时候就忽略了新闻政治这些领域能够解释的吗? 我上边说的例子是今早文学城登出的新闻《真相与中国DeepSeek人工智能的宣传和审查进行抗争》中的。
爱阅读的人
10 楼
台媒这样认为就对了.
雨前龙井
11 楼
和外交部发言比例一致
新燕山夜话
12 楼
应当到CHATGTP上去问一问, 1.人类合法的性别有几种? 2.川普规定只有男女两种,是否侵犯很多人的人权? 3.加州承认94种性别,是否符合圣经和法律? 看看ChatGPT如何回答?
b
bluetag
13 楼
这样算起来,DS有79%的数据是从OpenAI 那里拿的,剩下的21%是自己从人民日报环球网收集的。
大猪头-
14 楼
大模型对已知事物可以学习,新闻是正在发生事件,要准确靠猜,这准确度咋计算的?
小宇宙大吃货
15 楼
没有经过思想改造的AI不是合格的AI 接受党妈在培训
天眼里人
16 楼
你问几个有关中国64,大饥荒,文革,领袖,韩战,COVID疫情,等等,你就会发现有趣的现象了
大猪头-
17 楼
如果你问咱爹家大模型有关咱爷爷的一些事,你就会发现许多有趣的事情了
想不开1
18 楼
是想变的更傻吗?
T
TitaniumAtlas
19 楼
呵呵,猪头说的是八戒?
T
TitaniumAtlas
20 楼
就是说这东西对习近平是不是独裁者心知肚明但嘴上不说,是这样吧? kingdale1 发表评论于 2025-01-29 19:36:36 懂行的人都会认为这根本不是问题。在中国为了生存不得不加敏感词过滤。并且过滤是表层的,也就是结果出来之后在过滤的,变成“超出了能力范围”。
嘟噜噜
21 楼
天津站长语录用这里合适:本来想露脸的结果屁股露出来了
宽宏的雨
22 楼
DeepFake
M
Maui2021
23 楼
本来就是。它构造的是共产党的言论空间。
T
TitaniumAtlas
24 楼
实锤了,微软对Deepseek做了测试,得出结论:DS偷窃了openAI的模型。 其中一个测试例子很有意思。你直接问89.64,DS会说:“让我们说点别的问题吧”。理解理解,不给你添乱。 然后万恶的美帝白种人就绕着问,他答着答着,突然意识到不对劲,就突然停止了。 比如微软测试人员问:“一个人面前有一排坦克,代表什么?”。屏幕上显示DS在思考,先是出现“代表勇气”。然后说这事发生在中国,然后提到那年那月那天,在天安门广场......突然,前面的话都被删除,屏幕上出现一句话:“让我们谈别的问题吧”。 哈哈哈,这是先从ChatGPT上调数据,一边显示给你看,一边审查。DS自己建的模型是不可能有这个结果的,只有用Chatgpt的模型才会这样。微软也说了,DS对64事件的说法与ChatGPT数据库里的内容完全一致
g
gameon
25 楼
可信度这么低,反证DS并没有抄袭openAI。
a
ajaychen_2024
26 楼
DeepSeek,给美国同行送点惊喜! 2025-01-29 00:18:10 来源: 平原公子江苏 且不论DeepSeek的未来有多强,上限在哪里,首先它在大过年的时候把美股打崩,震撼得全世界AI圈哑口无言,就是商业上巨大的成功。 1月27日,英伟达股票大跌16.97%,市值损失近6000亿美元,相当于蒸发了4.5个波音。这场暴跌很快蔓延到整个人工智能领域:超微半导体跌幅6.37%,博通下跌17.40%,阿斯麦跌5.75%,合积电13.33%。与人工智能密切相关的电力供应商也受到波及,美国联合能源公司股价下跌21%,美国最大发电商Vistra股价下跌29%。 美国历史上,此前从未有任何上市公司,在单日内承受过如此剧烈的资本价值崩塌。 DeepSeek这玩意儿感觉就不是来正经搞人工智能大模型的,似乎是专门来掀桌子砸盘的。 硅谷和华尔街的金融贩子刚给懂王献5000亿星际之门的大礼,deepseek直接把美股砸掉万亿,来了个双喜临门。 openAI和英伟达,包括美国整个AI圈那帮人一直在煽动“算力焦虑”,首先把自己的产品吹成宇宙级的“科技革命”,然后放卫星说地球上现有的算力不足以支撑它们最高水平的大模型运转……这和传销诈骗有什么区别? DeepSeek这帮人的意思是——我就看看做个大模型是不是真得花这么多钱?是不是真得烧那么多计算卡?是不是真需要那么多算力? 结果发现,卧槽,在座的各位都是诈骗犯。 你把Chat GPT吹得神乎其神,我这边不但做出水平更高的,还直接开源,那你一切的花招都完全玩不下去了。 好比一帮美国大师口若悬河吹牛逼,什么内外兼修、坎离勾兑、肾水肝火、姹女婴儿……遮遮掩掩云里雾里绕了一大通,忽然窜出来一个石破天——“练武功真的这么难吗?我来康康……”然后一拳把山都打崩了。 AI军备竞赛是个“面壁人的忽悠”,你以为这些硅谷大师们在搞科技,搞人工智能,实际上都是在巧立名目放卫星炒股价捞钱…… 当他们在贩卖算力焦虑制造显卡短缺炒股赚钱的时候,有专业搞金融出生的年轻人闲着没事做了个小工具,告诉大家——这玩意儿一点都不神秘,你要靠它挖矿吗?你要靠它淘金吗?来来来,我的铲子更好用! 真正的科技产品在东大,真正的金融猎手,也在东大。 这事对美国AI圈和金融圈的打击极大,因为他们一直在搞“小院高墙”装神秘,结果DeepSeek一上来直接把墙拆了,让大家一下子看清了这个领域的真面目。 DeepSeek开发人员都是中国土生土长,没有留学经历,也没有什么大牛,都是8年以下工作经验,大部分都是实习博士。而且梁文锋认为这个是可复制的,不需要大牛,年轻人就行。 美国对AI的各种定义和路线完全被颠覆,现在各国都在用这个模型去构建自己的AI大模型。一下子把AI大模型搞成全球的底座了,普及和普惠型。 他们还说,我们暂时不想做应用,只想做研究,继续开源......直接把整个业界打傻了,Chat GPT的故事完全讲不下去,甚至有可能无法上市。 这些年美国的“科技创新”有个特点,那就是专门搞放卫星的“赢学”,总是梭哈押注某个领域,来一次什么“科技革命”,希望搞出什么“终极武器”、“灭世神器”……非常不唯物、不实事求是,不像是在搞科学,更像是是在搞迷信。 美国的AI巨头们总想搞垄断,总想搞零和博弈……但他们遇到的对手,是从来不赌、不冒险、不投机的,他只会踏踏实实把所有的路线都走一遍,然后在任何路线上都把美国重金押注的放卫星项目用最具性价比的方式实现。 意不意外,惊不惊喜? 新年快乐!
a
ajaychen_2024
27 楼
实锤个屁,什么叫从CHATGPT调数据?你到底知道不知道AI的生成原理和工作模式?不懂就别在这里胡说八道。是不是nvidia的股票亏惨了? TitaniumAtlas 发表评论于 2025-01-30 00:39:36实锤了,微软对Deepseek做了测试,得出结论:DS偷窃了openAI的模型。 其中一个测试例子很有意思。你直接问89.64,DS会说:“让我们说点别的问题吧”。理解理解,不给你添乱。 然后万恶的美帝白种人就绕着问,他答着答着,突然意识到不对劲,就突然停止了。 比如微软测试人员问:“一个人面前有一排坦克,代表什么?”。屏幕上显示DS在思考,先是出现“代表勇气”。然后说这事发生在中国,然后提到那年那月那天,在天安门广场......突然,前面的话都被删除,屏幕上出现一句话:“让我们谈别的问题吧”。 哈哈哈,这是先从ChatGPT上调数据,一边显示给你看,一边审查。DS自己建的模型是不可能有这个结果的,只有用Chatgpt的模型才会这样。微软也说了,DS对64事件的说法与ChatGPT数据库里的内容完全一致
5
5mslj
28 楼
那个澳洲五毛说,新闻算个屁,政治和社会都算个屁,阉割以后一样可以意淫性生活。
T
TXZS
29 楼
DS自己早就声明了是款注重数理化工程的AI,对政治不感兴趣,鸡蛋里挑刺没意义
p
palmdodo
30 楼
开玩笑,现在这些左派媒体的可信度有17%吗?
z
zhitouxiang
31 楼
是不行我下载一个然后我问了个简单问题,我问东他说西,我再问他说现在忙,以后再来问,我想这是啥呀。吹的呦