Nature报道数据库被“滥用” Nature 也在近期的报道中指出,除了NHANES,其他生物医学数据库(UK Biobank、FAERS、GBD和FinnGen)也频繁被这些低质论文利用。面对这一问题,Journal of Global Health已经率先采取行动,收紧了对基于这些数据库的论文的审核标准。现在,使用开放数据集投稿的作者必须声明过去三年内使用类似数据集发表过多少篇论文,披露是否使用人工智能撰写手稿,并解释其如何排除结果中的假阳性。为应对“滥用数据集”的趋势,其他期刊和出版商或将效仿Journal of Global Health,引入类似的严格审核机制。
不是学术论文排名 中国遥遥领先吗?
T5里还有个鄙视链啊?
好
https://www.shanghairanking.com/methodology/arwu/2025 软科是一家独立机构,不属于政府或大学,专注于高等教育领域的研究和咨询服务。
哈佛医学院庞大,发文章多,压MIT一头很正常
这真是想不到
你信吗。诺贝尔,图灵,菲尔兹权重变一下,又是另一个排名
我信。如果权重一直没有太大调整,这说明中国大学进步了,美国大学退步了。
中国大学有进步是事实,但是太飘了。 科学进步哪有这么快,又不是大跃进大炼钢铁超英赶美, 中国作者文章井喷,但是大量论文是为了混职称,改两个参数就是一篇灌水,论文加工厂成批加工复制。 如果国内大学这么厉害,你们为什么不在中国大大学,而要背井离乡? 现在西方有中国留学大潮出现吗
Science报道“论文工厂” 2025年5月14日,Science《科学》在其线上新闻专栏Science Insider 报道了一项令人震惊的研究发现:近 3 年来,利用美国健康与营养调查(NHANES)等公开数据库发表的低质量论文数量激增,其中超过 92% 的论文由中国研究人员贡献。这一现象被认为与“论文工厂”和人工智能(AI)技术的滥用密切相关。
论文指出Matt Spick(Scientific Reports的副主编)注意到大量风格雷同的论文涌入Scientific Reports期刊,几乎每天都有一篇,有时甚至一天两篇,内容几乎一模一样,这些论文都使用了同一个公开的美国数据集:国家健康与营养调查(NHANES)。
原文链接:https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai
Nature报道数据库被“滥用” Nature 也在近期的报道中指出,除了NHANES,其他生物医学数据库(UK Biobank、FAERS、GBD和FinnGen)也频繁被这些低质论文利用。面对这一问题,Journal of Global Health已经率先采取行动,收紧了对基于这些数据库的论文的审核标准。现在,使用开放数据集投稿的作者必须声明过去三年内使用类似数据集发表过多少篇论文,披露是否使用人工智能撰写手稿,并解释其如何排除结果中的假阳性。为应对“滥用数据集”的趋势,其他期刊和出版商或将效仿Journal of Global Health,引入类似的严格审核机制。
一、绝大部分低质论文来自中国,FinnGen成重灾区 根据Matt Spick、Anthony Onoja等人的研究,2021年-2025年间,有六个数据集的论文数量远超预期增长,其中NHANES、UK Biobank、FAERS、GBD和FinnGen这五个数据源的“模板化”论文爆发式增长。这些低质论文往往选取某种健康问题、关联的环境或生理因素,以及特定人群的已公开数据,通过简单替换变量生成所谓的“新发现”,如饮用半脱脂牛奶与预防抑郁症(PMID 39703337)或受教育程度与术后腹疝(PMID 39616067)之间,以及许多其他缺乏生物学基础的假设。
与ARIMA预测相比的六个数据源实际出版数量
在检查这六个数据源论文的地理来源变化时,研究发现来自中国的论文从2021年占PubMed数据库索引论文的19%猛增至2024年的65%,为所有国家/地区中增长最多的。在这六个数据集中,FinnGen数据源的中国论文增长最为显著,截至2024年,89%相关论文的主要作者来自中国。
2021年至2024年PubMed中编入索引的论文增加的国家/地区
这种论文产出的不平衡分布表明,这种增长并非研究生产力的普遍提高,而是发展中国家的研究人员在“不发表就灭亡”的学术压力下,因缺乏科研支持而铤而走险,最终助长了”论文工厂“的发展。
这类灌水论文现在成为世界大学排名一个重要指标 世界大学评比依据这类论文数量,和依据诺贝尔奖图灵奖数量,最后结果会有很大不同。