22岁加国华裔学霸自创神器:专门检测论文真实性

今日头条
Toutiao
最新回复:2023年1月8日 19点15分 PT
  返回列表
59466 阅读
8 评论
加国无忧

相信不少留学生都看过这样的偷懒教程,在网站上简单输入几个关键词,AI就可以立刻输出一篇全新的论文。

这样的“作弊”方式,被年轻学生应用在学校的作业、考试等多个领域,让老师们觉得困扰。近日,一位来自多伦多的华裔青年正在尝试解决这个问题。

图源:buzzfeednews

图源:twitter@edward_the6

22岁的Edward Tian现在是普林斯顿大学(Princeton University)的学生,他高中毕业于多伦多大学附属中学(University of Toronto Schools),还参加过清华大学以及麻省理工学院的暑校。

1月2日,Tian在推特上发布了关于他的工具GPTZero的消息。他说:“我在新年期间创建了GPTZero:一个可以快速有效地检测文章是ChatGPT还是人写的应用程序。”

图源:twitter@edward_the6

ChatGPT原本是一种智能聊天机器人系统,它能够生产连贯性文字,这个技术可以帮助有阅读障碍的人进行对话沟通。后来人们才发现,它对于创作音乐、童话故事、甚至是论文写作都有帮助。

不少教育工作者担心,高中或大学学生可能会使用这种技术写作业。他们的担忧并不是错的,一名记者最近成功地使用ChatGPT帮助她通过了AP英语测试。

据Chalkbeat报道,纽约市的公立学校刚刚阻止了学校设备和互联网网络对ChatGPT网站的访问。

图源:ChatGPT

计算机科学专业和新闻学辅修专业的Tian说:“人工智能写作变得越来越好,但我们必须负责任地研发。”

他并不反对使用人工智能工具进行写作,但他认为这是一个不稳定的时刻:“我希望人们能够使用ChatGPT,而且它会变得越来越普遍,但它必须有一些保障措施。”

图源:buzzfeednews

GPTZero的工作原理是分析一段文字,确定是否有迹象表明是机器人写的。它寻找两个标志:迷惑性(perplexity)和突发性(burstiness)。

迷惑性是指每个词由机器人建议的可能性有多大,人类会更随机使用词组。

突发性衡量的是每个句子的复杂程度。机器人写的每个句子的复杂性都差不多,但人类会写出更顶尖的表达,这个是长短结合的。

图源:twitter@edward_the6

为了测试Tian的创作,记者测试了一篇由ChatGPT写的短文,主题是描述一下《哈姆雷特》的主要主题。

GPTZero给这篇论文的迷惑性评分为10分,突发性评分为19分。根据Tian的解释,这些都是相当低的分数,意味着作者更有可能是一个机器人。这个结果是正确的。

为了比较,记者把自己写的文章输入该工具。最终的结果是困惑性39分,突发性387。GPTZero认为这篇文章很可能是人写的,结果正确。

图源:twitter@edward_the6

然而,GPTZero的确切成功率尚不清楚。也有一个推特用户说它失败过。人们对GPTZero的反应不一。成年人大多表示赞赏,一些青少年则称Tian为“缉毒警察”。

Tian在采访中说,在他发了这条推特后,他的邮箱爆满了,很多人在讨论投资这个项目,但现在GPTZero仍是免费使用的。

他说:“我想支持各地的新人英语教师。”

参考链接:

https://www.buzzfeednews.com/article/katienotopoulos/ai-writing-detection-tool-homework-students

j
junkuso
1 楼
加拿大小学校明天开学了,老师通过网发出一条假期后学习计划,其中一条有关圣诞节的题目:《说说你在圣诞节的故事》。许多小朋友就在群里讨论,大家最多的最有感的话题是『圣诞老人怎么成了中国人』?理由综合五花八门的,最集中的理由是: . (A): 圣诞老人全世界免费送礼物还得自己架一辆驯鹿车,他并不富有啊! (B): 是啊!可是,那这么多的礼物哪来的呢? (C): 我妈妈说现在通膨这么高,接近10%耶!我说我得到的礼物一定很贵吧? 那圣诞老人哪来钱呢?我爸爸说的:当然是圣诞老人自己做的最便宜啦! (D): 我的礼物是 Made in China, 你们的呢? (E,F,G,H,I,J,K。。。): 我的礼物也是 Made in China! . 最后,大家一致认为:圣诞老人肯定是中国人;【传说中圣诞老人来自哪里只能是传说】,在现实中更可能就是来自中国!
f
fck1234
2 楼
PU威武
媚眼瞟瞟
3 楼
骗子太多
R
Robin_Snow
4 楼
能检测AI 写的挺好,不过对于数据造假和实验造假,还是没办法
d
daji8
5 楼
这人一定不得好死
媚眼瞟瞟
6 楼
傻逼咧着嘴就跟Harry老婆一样恶心
l
lb
7 楼
这是砸场子/估值的啊。
t
tinyL
8 楼
用一个AI打败另一个AI……