您的位置:首页 > 互联网

ai内容识别在哪里「OpenAI下架AI文本检测器,用AI检测AI宣告失败」

发布时间:2023-08-03 13:19:11  来源:互联网     背景:

声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。

“既是天使、也是魔鬼”,或许是如今对AI最为精确的一句描述。如今再度走红的AI在帮助人类社会实现效率革命的同时,同样也带来AI新闻造假的泛滥以及愈演愈烈的AI骗局,因此监管AI就成为了当下科技界一个重要的议题。然而面对可以称得上是日新月异的AI技术迭代速度,针对其可能衍生出诸多危险结果的思潮也开始高涨。

面对这一问题,作为当下AI技术先驱的OpenAI站了出来。该公司创始人萨姆·奥特曼自今年年初开始就频频“走穴”,出席从学术界到工业界,再到监管层面围绕AI的相关讨论,更是主动提出了监管方案,并希望监管部门早日考虑立法。同时OpenAI也没忘记尝试从技术层面来约束AI,并在今年2月推出了一款试图区分人工编写文本和AI生成文本的检测工具。

这款工具名为AI文本检测器(AI Text Classifier),也曾被OpenAI方面认为有助于防止AI文本生成器被滥用,但在经过了数月的实践后,OpenAI在数天前悄然下线了AI文本检测器。根据OpenAI的说法,下架这款工具是因为检测准确率过低,但“会继续研究更有效的相关技术”。所以简而言之,就是OpenAI此前希望用AI来监管AI的尝试似乎已经落空了。

ai文本分析

此前OpenAI在推出这款AI文本检测器时,其实外界的期待值曾颇高,并希望它能够与ChatGPT上演一出“猫鼠游戏”。而这款公布的使用也一点都不复杂,在检测过程中用户只要将需要检测的文本复制到检测器上,就可以检查内容是否为AI生成,而且也不限定文本内容的种类。

如果说在面对海量的信息时,人工监管几乎不现实,那么用AI相关技术来监测内容或许才是更具现实意义的操作。然而遗憾的是,AI文本检测器的效果甚至连差强人意可能都称不上。据OpenAI方面公布的相关数据显示,AI检测器在识别AI生成文本方面的正确率仅为26%,同时将人类所写内容识别为AI生成的错误率则达到了9%。

ai ocr

实际上,用户体感可能还远低于这一数字。有研究人员就曾使用一本在数年前就已出版书籍中的片段进行了测试,结果AI文本检测器显示,不清楚这本书的序言是否由AI撰写,但前言“或许(Possibly)是人工智能生成,第一章的一段是“可能是(Likely)”人工智能写的。

更有甚者,还有人曾将莎士比亚的《麦克白》放上去进行检测,结果的反馈却是,“The classifier considers the text to be likelyAI-generated”。即这款AI检测器认为,《麦克白》可能是AI写的。

事实上,不仅仅是OpenAI在尝试以AI来制衡AI,如今有相当多的机构或研究人员正走在这条路上,但截至目前无一例外都没有商业化的价值。

ai检查

虽然OpenAI方面目前并未公布AI文本检测器的技术原理,但从其所要实现的目的来看,大概率是使用监督学习的方法。监督学习其实是机器学习中的一种训练方式,是指利用一组已知类别的样本调整分类器的参数,使得其达到所要求性能的过程。在这里,训练数据成为输入数据,分类则成为标签数据。

简单来说,尽管本不知道A和B能得倒一个什么样的关系,但是通过很多个A和B、且已知AB关系的数据可以得知,他们存在一种函数式关系f(A,B),并且在后续可以通过f(A,B)来得到一个符合实际规律(相对准确)的结果。众所周知,ChatGPT训练中很重要的一步是RLHF, 即有人类反馈的增强学习,这其实就是非常典型的监督学习。

ai检查

沃尔玛与京东合作的原因

作为一个AI领域经典的方法论,监督学习技术自然也有已经被发现的缺陷。其一,监督学习的一个重要前提,是需要大量的标注数据,并且标注数据的质量对模型性能有着直接的影响,不准确或不完整的标注数据可能会导致模型的错误预测。其二,在实际应用中,不同类别的样本数量可能存在严重的不平衡,即某些类别的样本数量远远少于其他类别。这就会导致模型在学习过程中对少数类别的识别性能较差,从而影响到模型的整体性能。

比如,OpenAI的AI文本检测器之所以认不出《麦克白》是莎士比亚的作品,关键因素就是莎士比亚是接近500年前的历史人物,他写《麦克白》所使用的古英语和现代英语存在不小的区别。但OpenAI的数据集里古英语的数量大概率极为有限,因此AI自然也就无法确定《麦克白》来自何处,而找不到出处就推断为AI产出的内容,其实也是相当合理的。

腾讯音乐市场份额

因此这就是问题所在,如果AI检测工具本身的性能够强,它就需要一个接近ChatGPT、或者其他AI大模型量级的数据集。但显而易见的是,从目前的情况来说,从无到有标注一个有别于ChatGPT的数据集不仅OpenAI做不到,即使它的重要投资方微软也有力未逮。毕竟如果真的有这样的数据集,为什么不去拿它训练ChatGPT,来孵化出更强大的GPT-5呢?

所以归根结底,用AI来监管AI现阶段可能还只是一个美好的畅想,但从当下的技术条件来看,这一路径并不具备现实意义。如果说单单帮助人类分辨到底哪些内容是由AI产出,或许数字水印技术反而更有可行性。在ChatGPT等AI大模型生成内容的那一刻就加入水印,直接让用户看到内容时就能知道它到底是不是由AI生成的。


返回网站首页

本文评论
moto X40年底登场:首批搭载骁龙8 Gen2 极致性价比
今日消息,博主数码闲聊站透露,moto X40采用FHD+全面屏,搭载高通骁龙8 Gen2旗舰处理器,后置主摄为5000万像素。和moto X30 Pro对比,moto X40处理器升级到了骁龙8 Gen2,但是主摄不是...
日期:10-16
下代性能追上Zen2、10代酷睿 国产CPU龙芯主机开卖:2499元零利润「龙芯cpu到几代了」
快科技5月31日消息,龙芯是国产自主研发CPU的代表,并且推出了100%自主的龙架构(LoongArch)指令集,今年还会推出新一代CPU龙芯3A6000系列,官方表示其性能可对标7nm的AMD的Zen 2,相当...
日期:05-31
iQOO Neo7 SE首曝:天玑8200加持_iqoo 天玑1200
上个月,iQOO推出了iQOO Neo7,该机搭载联发科天玑9000+旗舰处理器,是同价位唯一一款天玑9000+直屏旗舰。这款新品开售1分钟销售额突破2亿元,成为双11的爆款机型。按照iQOO的产品...
日期:11-07
京智科技(北京)有限公司「北京移动发布“京智行业专网”解决方案,助力政企业务升级」
2023/5/29 17:59 北京移动发布“京智行业专网”解决方案,助力政企业务升级   2023年5月26日,中国移动北京公司(以下简称“北京移动”)联合华为在北京召开“京智+”数字经济...
日期:05-30
小米10s12期免息「小米12S现24期免息还立减600:跌至3399」
小米12S现在可以使用24期免息的活动,而且立减600元,小米12S正面屏幕依旧采用了居中挖孔屏,微曲面的屏幕手感也很好,而且整体的尺寸搭配握持的手感。无论是触感还是握感都有着不...
日期:10-22
新华三的业务「新华三集团发布私域大模型“百业灵犀”LinSeer」
6月12日 消息:在近日的2023NAVIGATE 领航者峰会上,新华三集团正式发布私域大模型——“百业灵犀”LinSeer。新华三集团表示,将利用大模型的力量,以四个“专”,为垂直行业和专属...
日期:06-12
5000元的笔记本电脑「5000元的笔记本电脑能用多久」
近年来,随着科技的不断进步,电子产品也越来越成为人们生活中不可或缺的一部分,其中电脑更是成为了现代人工作和生活中必不可少的工具。而在众多的电脑产品中,笔记本电脑的轻便、...
日期:06-03
掌趣科技:与悠米将共同开发“AI游戏创作平台”「掌趣科技游戏官网」
6月25日 消息:掌趣科技在互动平台表示,公司同北京悠米互动娱乐科技有限公司近日达成业务合作。通过整合双方的核心技术及优势资源,公司与悠米将共同开发“AI游戏创作平台”,旨...
日期:06-25
国光电器涨停 称搭载ChatGPT的智能音箱将于本月推出_国光电器百科
5月8日 消息:今日,国光电器在互动平台表示,公司积极布局ChatGPT相关产品,目前已与多个客户在该领域展开合作。公司与某国内客户合作研发的一款能搭载ChatGPT的智能音箱将于本月...
日期:05-09
百度APP上线“疫情指数” 提供疫情预测参考_疫情下载百度app
12月14日 消息:12月13日,百度APP正式上线“疫情指数”,该指数包括“百度健康问诊指数”、“百度疫情搜索指数”两大指数。用户通过查询“地区名+疫情”等关键词,如“北京疫情”...
日期:12-14
九号公司 官网「文旅AIGC产品开发商“九号诶艾科技”获300万元种子轮融资」
7月24日 消息:近日,初创公司“九号诶艾科技”宣布获得“海南康氏实业投资集团”的种子轮融资,旨在加速AIGC垂直产业的布局。oppoa17价格公布据介绍,九号诶艾科技公司于2023年成...
日期:07-24
美国遭到网络攻击,安全等级达到顶级_美互联网安全新规:如遭网络进攻可武力还击
美国白宫当地时间16日发布新的互联网安全规定,就日后美国如何应对互联网安全等事务提出具体方案,其中最“强硬”的一条规定是,如果日后美国遭遇有可能威胁国土安全的网络攻击,...
日期:07-28
近五成00后在高中进行职业规划?青团社兼职8个词帮助年轻人发散看就业
  近日,国新办发布就业和社会保障有关情况,2021年高校毕业生909万人,达到新高,全国就业总量压力不减。   青团社调研显示,专业不对口、个人能力欠缺,是大四学生自评「最影响...
日期:07-16
大学招聘体育老师 要求得过奥运冠军引热议:官方回应专业技能很重要
近日,有条招聘教师的帖子在小红书上火了。一名用户发帖表示:这个学校招聘教师居然要求奥运冠军。所以说全国冠军也不能报,太卷了太卷了!”网友发布的图片显示,这是杭州师范大学上...
日期:04-08
NBA可变藏品遭疯抢,数藏市场迎来“引爆点”?
声明:本文来自于微信公众号 Tech星球(ID:tech618),作者:陈桥辉,授权转载发布。随着NBA季后赛的赛事拉开序幕,国内NBA球迷的热情和关注度也瞬间高涨,每天微博都能看到比赛的热搜话...
日期:04-22
2023世界人工智能大会 蒂姆维澳这个比赛“狠”有科技含量「世界人工智能大赛夺冠」
7 月6- 8 日, 2023 世界人工智能大会在上海世博中心和世博展览馆举办,本届大会以“智联世界 生成未来”为主题,汇集国内外知名学者与顶尖技术企业参与。蒂姆维澳携手临港集团与...
日期:07-10
佳能R5 Mark II配置流出:6000万像素+8K 60P视频录制「佳能eos r5拍视频怎么样」
佳能R5 Mark II配置流出:6000万像素+8K 60P视频录制TCL T7D  【CNMO新闻】近日,CNMO注意到,Canon Rumors公布了部分和佳能EOS R5 Mark II 有关的配置信息。目前来看,佳能EOS R5...
日期:07-19
edg战队u「Uzi就差官宣了?EDG海报空个位置引热议 网友:无字暗示乌兹」
6月9日消息,这两天,电竞圈热门事件无疑就是Uzi被曝出要加盟EDG战队了,多个话题霸榜微博热搜。6月8日,Mr_谢帆”爆料称,EDG.Uzi正在聊ing,随后957又在直播时称Uzi去EDG了确定了”,当...
日期:06-11
仅靠iPhone难以拉动业绩,业内下调台积电资本支出预期「台积电芯片涨价苹果」
根据太报消息,有亚系外资表示,台积电仅靠第三季度苹果iPhone 15系列新机的拉货,难以带动下半年的业绩,因此下调对台积电2023年、2024年资本支出的预期。亚系外资表示,半导体产业...
日期:06-21
中国移动联合中兴通讯完成无线网络数字孪生平台创新技术验证,开启数字孪生开放合作新模式
通信世界网消息(CWW)为响应国家网络强国战略,顺应业务发展需求,中国移动推出“智慧网络国家新一代人工智能开放创新平台” ,面向产学研开放5G智慧应用服务试验环境,解决通信+AI跨...
日期:06-12