审稿人或难识别AI撰写的论文摘要-中新网

　　应警惕人工智能论文对科研完整性和准确性的破坏

　　审稿人或难识别AI撰写的论文摘要

　　科技日报北京1月16日电 (记者张梦然)据近日发表在预印本服务器bioRxiv上的一项研究，人工智能(AI)聊天机器人ChatGPT已可写出令人信服的假研究论文摘要，甚至连审稿科学家也无法发现。

　　聊天机器人ChatGPT会根据用户提示创建逼真文本，它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具，并供用户免费使用。

　　自发布以来，研究人员一直在努力解决相关伦理道德问题，因为它大部分输出可能很难与人类撰写的文本区分开来。近日美国西北大学的一个研究小组使用ChatGPT生成人工研究论文摘要，以测试科学家是否可辨别它们。

　　研究人员要求机器人基于发表在《美国医学会杂志》《新英格兰医学杂志》《英国医学杂志》《柳叶刀》和《自然·医学》上的50篇研究编写摘要。然后，他们通过抄袭检测器和AI输出检测器将这些摘要与原始摘要进行比较，并要求一组医学研究人员找出编造的摘要。

　　结果，ChatGPT生成的摘要通过了抄袭检查器，原创性得分中位数为100%，表明没有检测到抄袭。人工智能输出检测器发现了66%的生成摘要，但人工审稿人只正确识别了68%的生成摘要和86%的真实摘要，他们错误地将生成摘要中的32%识别为真实，将14%的真实摘要识别为编造。

　　研究人员称，ChatGPT写出了能骗过人类的科学摘要，如果科学家无法确定研究是否属实，或会产生“可怕的后果”。

　　研究人员表示，在虚假信息会危及人们生命安全的医学等领域，期刊需要采取更严格的方法来验证信息的准确性。而这些问题的解决方案，不应集中在机器人本身，“而是导致这种行为的不正当激励措施，例如通过论文数量进行招聘和晋升审查，而不考虑其质量或影响”。

　　【总编辑圈点】

　　大火的ChatGPT，不止是聊天工具，它在教育领域的渗透已经引起了广泛关注和讨论，当然，随之而来的还有忧虑。如果你使用过ChatGPT，也会惊讶于它撰写报告的能力。给它一个主题，它就能在几秒内生成大纲，也能在几秒内进行细化，而且看起来非常是那么回事。这次，科研人员发现它撰写的论文甚至能骗过审稿人。这又是一个人如何使用新技术的经典伦理问题。工具本身无罪，但应用边界应该清晰，使用者也要对自己的行为负起责任。【编辑:房家梁】

审稿人或难识别AI撰写的论文摘要-中新网

相关阅读