马里兰大学的一组计算机科学家开发了一种方法,可以为人工智能系统生成的文本添加水印。他们发布了一篇论文,描述了他们在arXiv预印本服务器上的方法。
ChatGPT等文本生成人工智能系统最近才出现在新闻中。一些新闻网站报道说,学生被发现使用聊天机器人为他们写论文。其他感兴趣的各方已经测试了它们在应试中的用途,并发现它们表现良好。
与此同时,教育领域的教师、教授和其他人越来越担心如何进行,因为他们无法判断学生提交的论文是否由人工智能系统撰写。在这项新的努力中,马里兰州的小组开发了一种方法来帮助那些有此类担忧的人——使用水印。
与现金或其他印刷文件一样,水印是隐藏在印刷材料中的信息,只有在特定条件下才能看到,例如在特殊光线下。研究人员建议,像ChatGPT的制造商OpenAI这样的公司可以将标识符添加到他们的机器人创建的文本中,临时用户(学生)看不到这些标识符,但可以被教师使用的软件应用程序检测到。为了使这种方法奏效,大多数或所有AI文本生成器的制造商都必须自愿或在政府强制下购买该计划。
在AI生成的文本中创建水印不仅仅涉及向文本文件添加一些元数据(如照片),因为可以使用智能手机或其他设备轻松复制生成的文本。
因此,水印必须存在于文本中而不是在文本后面。为了创建这样的水印,马里兰州的团队指出,文本生成系统在生成文本时通过一次预测和选择一个词来工作,并且它们以一种可预测的方式进行。当文本生成器工作时,它会选择看起来很合适的词,然后在使用之前必须被其他代码列入绿名单。
研究人员指出,与人类编写的文本相比,人工智能编写的文本往往包含更多列入绿名单的单词,这表明可以用作水印的模式。他们编写了一种能够检测这些词的算法,并发现它工作得相当可靠。他们指出,他们的方法可能只适用于某些人工智能系统,但建议可以为其他系统构建其他水印系统。