应警惕人工智能论文对科研完整性和准确性的破坏
审稿人或难识别AI撰写的论文摘要
科技日报北京1月16日电 (记者张梦然)据近日发表在预印本服务器bioRxiv上的一项研究,人工智能(AI)聊天机器人ChatGPT已可写出令人信服的假研究论文摘要,甚至连审稿科学家也无法发现。
聊天机器人ChatGPT会根据用户提示创建逼真文本,它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具,并供用户免费使用。
自发布以来,研究人员一直在努力解决相关伦理道德问题,因为它大部分输出可能很难与人类撰写的文本区分开来。近日美国西北大学的一个研究小组使用ChatGPT生成人工研究论文摘要,以测试科学家是否可辨别它们。
研究人员要求机器人基于发表在《美国医学会杂志》《新英格兰医学杂志》《英国医学杂志》《柳叶刀》和《自然·医学》上的50篇研究编写摘要。然后,他们通过抄袭检测器和AI输出检测器将这些摘要与原始摘要进行比较,并要求一组医学研究人员找出编造的摘要。
结果,ChatGPT生成的摘要通过了抄袭检查器,原创性得分中位数为100%,表明没有检测到抄袭。人工智能输出检测器发现了66%的生成摘要,但人工审稿人只正确识别了68%的生成摘要和86%的真实摘要,他们错误地将生成摘要中的32%识别为真实,将14%的真实摘要识别为编造。
研究人员称,ChatGPT写出了能骗过人类的科学摘要,如果科学家无法确定研究是否属实,或会产生“可怕的后果”。
研究人员表示,在虚假信息会危及人们生命安全的医学等领域,期刊需要采取更严格的方法来验证信息的准确性。而这些问题的解决方案,不应集中在机器人本身,“而是导致这种行为的不正当激励措施,例如通过论文数量进行招聘和晋升审查,而不考虑其质量或影响”。
【总编辑圈点】
大火的ChatGPT,不止是聊天工具,它在教育领域的渗透已经引起了广泛关注和讨论,当然,随之而来的还有忧虑。如果你使用过ChatGPT,也会惊讶于它撰写报告的能力。给它一个主题,它就能在几秒内生成大纲,也能在几秒内进行细化,而且看起来非常是那么回事。这次,科研人员发现它撰写的论文甚至能骗过审稿人。这又是一个人如何使用新技术的经典伦理问题。工具本身无罪,但应用边界应该清晰,使用者也要对自己的行为负起责任。 【编辑:房家梁】