游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

再不能用ChatGPT写作业了!新算法给AI文本加水印,置信

  明敏Alex发自凹非寺
  量子位公众号QbitAI
  AI生成文本,又遇新对手!
  凭借识别AI生成文本中的水印,一种新算法能够准确判断文本到底是谁写的。
  无需访问模型参数、API,结果置信度高达99。999999999994。
  方法一经发布就引来大量网友围观。这回拿ChatGPT作弊,怕不是要更难了?
  要知道,最近一段时间,ChatGPT先是成为美国高中生的写作业利器,后面帮专业媒体写稿子,引发巨大恐慌。如Nature、纽约教育部等,都针对ChatGPT发布禁令。
  马里兰大学学者们提出的这一新方法,为解决这些麻烦提出了个新思路。
  不少网友都觉得,这个方法提出的正是时候,而且效果看着也不错。
  有学者还和美国高中生喊话,你们要做好准备了!
  作者表示,方法代码将在2月15日免费开源。计算文本由AI生成的概率
  所谓模型水印,人类无法看到,但是计算机可以。
  这是一种现在被常用于大规模语言模型(LLM)中的方法,能让AI生成的文本带有特殊标记。即把信号嵌入到生成的文本中,让算法能从一小段token中检测出来。
  最近,OpenAI方面也表示,考虑在ChatGPT中添加水印,以降低模型被滥用带来的负面影响。
  这篇最新论文的作者,就想验证下这个想法到底靠不靠谱。他们通过给LLM中嵌入水印,然后再进行检测。其中水印的嵌入不会影响文本生成质量。
  具体来说,大规模语言模型每次生成一个token,每个token将从包含大约5万个词汇的词汇表中进行选择。
  在新token生成之前,该方法会从基于最近已生成的token为随机数生成器(RNG)提供种子,以此来压一个水印。
  然后使用RNG,能将词汇表分为黑名单和白名单,并要求LLM接下来只能从白名单中选择词汇。
  如果整段文本中,白名单中的词汇越多,就意味着越有可能是AI生成的。
  黑白名单的区分,基于一个原则:
  人类使用词汇的随机性更强。
  举例来说,如果在美丽的后面生成词汇,水印算法会将花列入白名单,将兰花列入黑名单。
  论文作者认为,AI更可能使用花这个词汇,而不是兰花。
  然后,就能通过计算整段文本中白名单token出现的情况,来检测水印。
  如果一共有生成了N个token,所有的token都使用了白名单词汇,那么这段文字只有2的N次方分之一概率是人类写的。
  即便这段文字只有25个词组成,那么水印算法也能判断出它到底是不是AI生成的。
  但作者也表示,水印有时候也不一定完全靠谱。
  比如模型输出了SpongeBobSquare,下一个单词一定会是Pants吧?但是Pants会被标记到黑名单里,即认为是只有人才会写的词。
  (注:SpongeBobSquarePants是《海绵宝宝》动画片的英文,可理解为一个专有名词)
  这种情况会严重影响算法的准确性,因此作者将其定义为低熵token,因为模型几乎不会有更好的选择。
  对应来看,也会有高熵token,比如海绵宝宝感觉这个句式里,能填入的词汇太多了。
  对于这一情况,作者选择针对高熵token制定更强的规则,同时保留低熵token,确保水印质量更好。
  与此同时,他们还添加了波束搜索(Beamsearch),允许LLM能够排布一整个token序列,以避免黑名单词汇。
  这么做,他们能确保LLM使用白名单词汇的概率在大约80左右,而且不影响文本生成质量。
  举例来看,对于下面这段文字,水印算法认为它有99。999999999994的可能是由AI生成的。
  因为在这段文字中,包含36个token。如果是人类写的,那么文本中应该包含92。6个白名单词汇(白名单词汇的概率约为25)。
  但这段文字中,包含了28个白名单词汇。
  计算来看,这段文字由人类写出的概率,仅有0。0000000000006(6乘以10的15次方)。
  如下标注的是文本中的黑名单token。
  需要注意的是,如果想要水印正常发挥作用,并不受到攻击,就必须对文本进行一些标准化处理,并且需要检测某些类型的对抗性提示。
  这一方法是对外公开的,将在2月15日开源代码。
  加一个随机秘钥,也能变成保密模式并且托管到API上,这能保证水印不会被篡改。
  论文中使用的模型是Meta开源的OPT1。3B模型。
  由于不用访问底层模型,所以该检测方法的速度很快,成本也不会很高。
  而且可以使用标准语言模型生成带水印的文本,不用再重新训练。网友:似乎很容易绕过?
  巴特,不少网友觉得,这个方法的具体实践效果可能远不及理想,质疑之声迭起。
  有人提出:如果我在AI生成的文字基础上,修改几个词,还能被查出来吗?那在替换成近义词后,检测准确率会下降多少?
  毕竟大家往往不会一字不改、直接用AI生成的内容。
  对此,论文通讯作者、马里兰大学副教授TomGoldstein回答称:对于一段自带水印的文字,至少得修改4075的token,才可能成功去除水印。
  (如果用其他程序修改内容话),为发生同义词攻击,导致生成内容的质量很低。
  简而言之,想要通过换近义词来消除水印,得大篇幅修改,而且若不是人亲自手动修改的话,效果会很拉胯。
  还有人提出:
  对于专门设计过的低熵token序列,应该能检测出水印。但是,长度和检测率之间(存在一些矛盾),它们的优先级应该如何权衡?
  对此,Tom教授表示:根据设定,使用波束搜索时,绝大多数(通常是90)的token在白名单上,即使是低熵token,也会被列入白名单。
  所以,至少得修改一半以上的token,才能删除水印,而这需要一个超级强大的LLM模型才行,一般人很难接触到。
  不过,研究者们也在论文中承认,这种方法确实存在一些局限性。
  比如,检测水印的z统计量,只取决于白名单大小参数和生成白名单的哈希函数,和其他不少重要的参数并没有什么相关性。
  这就让他人可以在下游水印检测器上做手脚,可以改变水印采样算法,重新部署水印,最终让原本生成的水印失效。
  就连OpenAICEOSamAltman也表示:
  创造完美检测AI抄袭的工具,从根本上来说是不可能的。
  (尽管他说OpenAI打算启用水印大法)
  但话说回来,人们为了限制AI生成文字的负面影响,还是煞费苦心
  之前就有人搞出了一个检测ChatGPT的网站,名曰GPTZero,只需要把相应的内容粘进去,几秒内就能分析出结果。
  论文地址:
  https:arxiv。orgabs2301。10226
  参考链接:
  〔1〕https:twitter。comtomgoldsteincsstatus1618287665006403585
  〔2〕https:twitter。comgoodsidestatus1610552172038737920
  〔3〕https:www。technologyreview。com202301271067338awatermarkforchatbotscanspottextwrittenbyanai
  完
  量子位QbitAI头条号签约
  关注我们,第一时间获知前沿科技动态

1399元,荣耀Play6TPro手机8GB128GB版本今IT之家4月28日消息,此前荣耀Play6TPro8GB128GB版本开启预售,售价1399元。4月28日上午10点08分正式开售。荣耀Play6TPro搭载联发科天玑8……三星计划将中国代工的智能手机订单提高2000万部,今年总量达IT之家4月27日消息,据TheElec报道,消息人士称,三星计划将其在中国代工生产的智能手机提高2000万部,今年总量达7000万部。报道称,三星最初计划自行生产这20……梅西彻底输了?名嘴C罗最伟大的遗产,是他对葡萄牙的8大贡献去年9月,C罗在葡萄牙足协的年度盛会上,获得历史最佳射手奖,当时他借此机会宣布,他不仅想参加2022年的世界杯,还想参加2024年的欧洲杯。当晚,五人制球星里卡迪尼奥也被……2013年,谷歌高管在游艇上离奇暴毙,7分钟的监控揭开他的丑51岁的福雷斯特海斯是谷歌自动驾驶业务的高管。他拥有一栋价值300万美元的豪宅,一艘价值20万美元的游艇,他手握权利和资本,是一个站在资本主义社会金字塔顶点的人物。……华硕将推Asus8z手机5。9英寸小屏,骁龙888处理器IT之家2月26日消息,据印度媒体91mobile消息,华硕即将在印度发布华硕8z小屏手机,发布日期现已确定为2月28日。IT之家了解到,华硕8z将配备5。9英寸FHDA……航天员出舱影像为啥背景一片漆黑9月1日,我国神舟十四号航天员陈冬、刘洋顺利走出舱门,这是中国航天员首次从空间站出舱主通道问天实验舱气闸舱迈入太空。然而细心的小伙伴们会发现,历次航天员出舱画面中,航天员……消息称索尼今年不会发布新一代Xperia5机型IT之家5月8日消息,日前,索尼宣布将于北京时间5月11日15点举行Xperia新品全球发布会,官方称NextONEiscoming,表明发布会的主角是Xperia1IV。……亚马逊Fire7平板电脑将搭载FireOS操作系统,升级AnIT之家5月22日消息,亚马逊新款平板电脑Fire7将搭载该公司的FireOS操作系统的新版本FireOS8,其将基于Android11,之前的FireOS7是基于Androi……iphone14即将发布却报严重安全漏洞,还值得我们购买吗?8月20日晚间,苹果曝出严重安全漏洞冲上热搜第一,引发舆论热议。据央视财经报道,美国苹果公司在当地时间周三发布两份安全报告,披露公司旗下智能手机iPhone、平板电脑iP……上海徐汇太平洋外星人的硬核射击游戏霓虹入侵者来啦最近一款名为《霓虹入侵者》的游戏,凭借着爽快的打击感和可爱的画风而备受玩家们期待。该作由发行了诸多优秀独立游戏的发行商CurveGames与荷兰游戏工作室TriangleStu……泾河新城发挥龙头聚集效应打造光伏产业链集群新春伊始,在西咸新区泾河新城隆基绿能光伏产业园内,项目建设如火如荼。随着近期年产100GW单晶硅片及50GW单晶电池项目的落地,隆基绿能携手泾河新城最新打造的光伏产业园,……一加询问国外网友OxygenOS13要什么新功能,多人请求改IT之家5月30日消息,去年9月份,一加宣布OxygenOS与OPPO的ColorOS合并,目前最新版本为OxygenOS12。1,下一代是OxygenOS13。上周末,……
1974年,朝阳群众抓捕克格勃立大功,苏联方面多年不知是咋暴前几日,著名钢琴家李某违法被朝阳群众举报后,朝阳群众这个特殊的组织再次引起了公众的注意。在近几年的娱乐圈新闻、法制新闻中,朝阳群众的存在感可是相当不低。有人盘点了朝……莫负好春光!山西60个赏花景点邀您赴约来源:人民网山西频道4月7日上午,锦绣太原城相约万柏林第十届樱花节暨山西中部城市群赏花季在太原市万柏林区玉泉山景区内启动。启动仪式上发布了分别以桃花、杏花、樱花、梨花、牡……诺基亚,已经悄悄地东山再起现在一提到,主流的手机品牌还有哪些这个问题。机哥估计机友们应该很容易会想到苹果、三星、华为、小米、OPPO、vivo。。。可要是说曾经很主流,但现在已经很少听到的,……它每秒可喷出1吨物质高达300公里,木星是背后的主宰者木星,是太阳系内除了太阳之外最大的天体,它的质量比其他七大行星质量总和还要大,所以木星的引力非常大,人类要想近距离探索木星非常难,木星上浓厚的大气层带来的巨大压力几乎让人们动弹……远古时期的台湾岛屿,会有巨石文明的存在吗?朋友们好,今天我们来聊一下台湾水底考古的惊奇发现。澎湖县位于台湾南部的台湾海峡上,和台湾本岛的嘉义县遥遥相望,最近距离只有45公里。大大小小的岛屿加起来有九十座之多,其中……短视频矩阵运营平台抖音矩阵自动获客工具现如今,短视频已经成为了网络营销的一个重要方式。在这个趋势下,短视频矩阵运营平台抖音短视频智能营销获客系统应运而生,这是一个支持多平台发布的短视频矩阵运营平台,包括抖音、快手、……春天的爱情一春天来了我把一场雨种植在你的眼睛里你的眼神如一池秋波更加清澈在我的心底不论上弦月还是下弦月都会轻勾缠绵不论是斜坡、河畔还是阡陌……武山腊月年味浓赶年集、办年货早已成为一种武山特有的风俗,对于很多人来说,在忙碌中感受着过年的热闹、新春的喜庆与生活的踏实,这样的日子更有滋有味。俗语说进了腊月门,转眼就是年。武山的腊月……红米K40S迎来劲敌,骁龙870144Hz潜望长焦,友商更有由于国内市场的特殊性,手机领域的竞争十分激烈,各大厂商都有自己的真香机,或者是推出子品牌来比拼,那么众所周知红米就是小米的小老弟,虽然如今算是独立运营,但两者关系依旧相当密切,……英雄难过美人关英魂之刃口袋版国风七夕情侣皮肤惊艳上线情不知所起,却一往情深。7月29日,《英魂之刃口袋版》七夕皮肤甜蜜来袭,凯撒大帝携手埃及艳后与大家共度七夕,全新的情侣皮肤将会给大家带来怎样的惊喜呢?另外,关羽新皮肤悍斧勇士,……掌门教育创始人张翼的传奇人生乔布斯在斯坦福大学毕业典礼上的演讲,除了最有名的一句求知若渴,虚心若愚,另外有一句同样令人印象深刻:唯有未来回顾时,你才会明白点点滴滴是如何串在一起的;所以你得相信,你现在所体……奔四奔五的女人,出门尽量少戴黄金翡翠,换成另外3种更贵气女人天生爱美,这一点大家都知道,女性朋友们对于造型,对于穿搭都有着自己的想法,而随着年龄增长,大家的穿衣风格都会有很大的改变,所以对于奔四奔五的女性来说,我们的日常穿搭一定要足……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网