Meta承认使用盗版书籍训练AI：拒绝赔偿作家 - 2024年1月14日北美华人网存档

一年多

楼主 (北美华人网)

Meta最近因使用数千本盗版书籍训练人工智能模型存在法律风险而引发版权侵权诉讼。 据悉，Meta使用大量盗版书籍的“Books3”数据集训练其LLAM 1和LLAM 2模型，Meta虽承认使用了 Books3 数据集，却拒绝向作者支付适当的补偿。 Books3是一个包含19.5万本图书、总容量近37GB的文本数据集，由AI研究者Shawn Presser于2020年创建，旨在为改进机器学习算法提供更好的数据源。 Meta也将其用于训练自己的LLAM模型，然而Books3中包含大量从盗版网站Bibliotik爬取的受版权保护作品，使得Meta的行为面临法律风险。 多位科技公司今年面临类似的投诉，指责他们在构建生成式AI模型时侵犯了艺术家、作者和其他内容创作者的版权。 此外，欧盟关于人工智能的新临时规则可能会迫使公司披露用于训练模型的数据集，这可能会使他们面临更大的法律风险。

大

大喜妞

一年多

这必须被罚吧。如果是公开数据，还能争一争。盗版网站的书看一看就违法了，别说作为商业用途。希望能赔偿那些作家。大部分作家都是靠信念在撑着。

facet

一年多

回复 1楼pathdream的帖子
谢谢告知上哪找盗版书，原来是 Bibliotik

ccang1234

一年多

呵呵，老美也有盗版书啊

zzsummer

一年多

回复 1楼pathdream的帖子
谢谢告知上哪找盗版书，原来是 Bibliotik
facet 发表于 2024-01-14 11:10

哇这必须mark一下了

pwwq

一年多

这个现在不是Meta一家的问题， WSJ做了三期的Podcast 连载，讲了OpenAi的整体情况，里面也提到了，现在这个训练Ai牵扯的作家的版权的问题，现在也有作家协会开始告 OpenAI 相关的企业X 这是AI到了目前这一步，开始争议比较大的，各界开始着手考虑的事情，感兴趣的同学，英语没有问题的，自己去听Wsj的节目建议不要在这类简体中文的，小编文章上浪费时间。

吃

吃鸡蛋

一年多

回复 1楼pathdream的帖子
谢谢告知上哪找盗版书，原来是 Bibliotik
facet 发表于 2024-01-14 11:10

盗版书吧虽然不好，但是个人看看一般有不追究
但是商业用途用来赚钱就不行了，尤其是买它这么有钱的公司

吃

吃瓜爷

一年多

前两天看到一NYT和OPENAI的文章。抄的内容真像似。不过看了清华女违法还理直气壮的样子，这些大厂的行为不难理解。

pathdream

一年多

ai 大抄出奇迹
z-lib 为啥不去更大的盗版网站呢要抄就抄全一点的啊抄一点也是抄抄很多也是抄啊再上全世界所有p2p torrent 抄语音图像且抄且开心
截至2022 年10 月1 日，Z-Library 称其已拥有超过11291325 本图书和84837643 篇学术文章，是「世界上最大的电子图书馆」。Nov 11, 2022

UglyMeggieL

一年多

赔偿也是book3 给作者，meta给book3吧。

UglyMeggieL

一年多

话说meta股票真是很棒的！今年好多朋友都2M

大

大青椒

一年多

哈哈，祖上不少都是北欧海盗，骄傲还来不及叽歪不让盗那都是骗破壳小鸡的，谁信谁是破壳小鸡