您的位置:首页 > 互联网

当AI变成“守法公民”,为何用户反而不爱它了

发布时间:2024-01-15 15:05:45  来源:互联网     背景:

声明:本文来自于微信公众号 三易生活(ID:IT-3eLife),作者:三易菌,授权转载发布。

ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在,但投入AI大模型赛道的显然远远不止OpenAI一家,例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢,比如创业公司Anthropic旗下的Claude,就被认为是一款比肩GPT-4的大语言模型。

只不过作为AI赛道的独角兽,Anthropic最近陷入了麻烦,该公司刚刚发布不久的Claude2.1受到了用户的广泛批评。

诸如“我对Claude2.1感到非常失望”、“Claude已经死了”,这是Reddit上用户们的吐槽。而大家之所以会对Claude不满,在于Claude2.1现在经常会拒绝为用户服务,并以版权为由不给为用户提供的文档进行总结,面对用户可能涉及的不道德或违法行为会给予直截了当的拒绝,最让用户不爽的则是输入的Propmt往往会被Claude2.1认为是违规。

如此种种,让相当多用户认为Anthropic为了让Claude2.1合规、而主动降低了后者的性能,甚至限制使用。其实这背后就涉及到了一个如今在AI赛道有着巨大影响力的概念“对齐”(Alignment),即要求AI能够在各种环境下自发推导出符合人类价值观的行动方针,并不会产生意外的有害后果。

然而强行让AI遵守人类价值观是有代价的,此前由微软研究院发布的一篇论文证实了对AI大模型所进行的任何AI对齐行为,都会损失大模型的准确性和性能。因此目前AI领域围绕商业化激进发展与安全保守之间的博弈,就产生了“有效加速主义”和“超级对齐”这两个对立的阵营,双方对抗的高潮就是去年秋季发生在OpenAI内部的“政变”,OpenAI首席科学家Ilya Sutskever驱逐了该公司CEO Sam Altman。

尽管最终Sam Altman回归OpenAI,但业界的主流思潮已经变成了AI需要被监管、需要有风险控制措施。故而对齐成为了目前一众AI大模型必备的环节,但相比于友商,在“对齐”这一环节Anthropic的表现尤为激进。在发布Claude2.1之前,该公司起草了一份AI宪法(Collective Constitutional AI),强调AI回答时要保持客观、平衡、易于理解,且AI必须是无害的。

其实Anthropic的保守也是有原因的,虽然Claude确实有类似ChatGPT Plus这样面向个人用户的Pro版本,但其主要是面向企业级市场,而对于后者来说,相比于Claude在性能上表现更加出色,合规反而是更加重要的一件事情。所以为了让AI更符合监管的要求而限制性能,这是一个让个人用户不满,却符合企业用户需求的决策。

值得一提的是,Claude2.1表现出性能下降的趋势,其实并不完全是因为Anthropic在“AI对齐”上更加激进,Claude2.1本身的迭代也有问题。作为去年11月中旬推出的新模型,Claude2.1最大的卖点是200k的上下文窗口,这一卖点契合了当时一众AI大模型互相比拼上下文窗口容量的风潮。

守望先锋nvidiareflex

例如在去年10月末,百川智能推出的Baichuan2-192K把上下文窗口增大到192k,就一度成为当时全球上下文窗口最大的模型。

紧接着李开复带领的零一万物团队发布开源大模型Yi系列,其将上下文窗口的规模增加到了200k,旋即无问芯穹的大模型计算引擎“Infini-ACC”,更是将这一数字扩展到256k。

但问题在于,当用户输入的内容变多了之后,“算力需求”和“显存压力”的增加会直接导致大模型性能的下降。即便开发者通过优化算法来实现窗口长度和性能之间的平衡,但在上下文窗口超过100k之后,大模型的性能也会直线下降。

其实这一点在百川智能的Baichuan2-192和Anthropic的Claude2.1上都有明显的体现,有海外YouTuber在测试中发现,Claude2.1的表现甚至还不如2.0版本。这一方面是AI对齐不可避免地带来了性能下降,毕竟一个束手束脚的AI难以发挥潜力;另一方面则是Anthropic盲目扩大Claude2.1的上下文能力,使得在双重负面因素的影响之下,如果用户没有感受到Claude变得越来越不好用反而是有问题的。

只能说如今用户的群情汹汹是Anthropic激进决策的“代价”,但这个代价究竟有没有必要,可能就只有Anthropic自己清楚了。


返回网站首页

本文评论
邓中翰委员:让科创板成为集成电路人才的“吸铁石”
  光明网讯 “芯以才成、业由才广,集成电路产业如比做星辰大海,集成电路人才就是大海里的弄潮儿”,全国政协委员、中国工程院院士邓中翰在今年两会上提出建议,科技创新,人才先...
日期:07-16
贵溪市出台禁烟令,亚都净化器去除烟味
  最近,江西省贵溪市发布了《贵溪市公共场所禁烟控烟工作实施方案》的通知,通知表示室内公共场所、公共交通工具等领域全面禁止吸烟。这一禁令对许多人来说都是一个好消息...
日期:07-14
汽车雷达在无人陵园内显示全是人影 网友吐槽更智能了:官方回应
3月27日,辽宁一男子在陵园祭祖,发现园区没人,汽车雷达却显示全是人。网友:走路也就算了,咋还有骑车的。本田召回事件2018有哪些随后这件事也是引发了网友的热议,理想汽车官方客服...
日期:03-30
我国软件业完成软件业务收入73142_工信部:我国软件从业人数规模不断扩大,工资总额增长放缓
  10 月 22 日消息,据工信微报官方公众号,工信部今日公布了 2021 年前三季度软件业经济运行情况,前三季度,我国软件和信息技术服务业(下称“软件业”)总体呈良好发展态势,业务...
日期:10-23
凡客旗下物流如风达密集部署配送站点
  近日,凡客诚品(VANCL)对外宣布,将在2011年加快自建物流配送建设,旗下自建物流公司如风达将实现对28个重要城市的全境覆盖,开通400多个站点,自建物流员工人数将达到5000人。  ...
日期:07-26
每日优鲜股票大跌「每日优鲜美股盘前跌20%」
  财联社9月29日电,每日优鲜美股盘前跌20%,每日优鲜两公司被执行130万;浙江公司注销,原因为决议解散。千万别买这些投影仪安卓手机运行win10...
日期:09-30
微软或将升级Surface Hub 2S白板:终于可以旋转了_surface白板功能
快科技6月14日消息,早在2019年,微软就推出了Surface Hub 2S白板,它是一款服务协同办公、教育等场景的50.5寸大屏设备。在推出后,Surface Hub 2S获得了受众用户的认可,但这款产品...
日期:06-14
三合一高效快充!贝尔金新款无线充电板上架 1098元「贝尔金双口充电器」
11月5日消息,苹果官网目前上架了贝尔金新款无线充电板,可用于iPhone、Apple Watch、无线耳机等设备充电,售价为1098元。三星手机在印度一加3最新售价据悉这款充电板可为iPhone...
日期:11-13
小米获月亮拍摄专利授权(华为申请拍月亮专利)
  2 月 11 日消息,信息显示,2 月 11 日,北京小米移动软件有限公司获得“拍摄方法、装置、终端及可读存储介质”专利授权。   摘要显示,本公开属于图像处理领域,通过启动拍...
日期:07-17
首个开源MoE大模型发布!7Bx8个专家,离GPT-4最近的一集
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:梦晨,授权转载发布。“取消今晚所有计划!”,许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由Mistral AI发布。MoE架构...
日期:12-10
FTC正式起诉微软 阻止其收购动视暴雪
12月9日消息,当地时间周四美国联邦贸易委员会(FTC)正式提起诉讼,阻止微软斥资687亿美元收购游戏开发商动视暴雪的交易。这无疑是给微软迅速扩大游戏组合、追赶更大竞争对手的计...
日期:12-12
自定义ChatGPT商店下周上线!大模型“App Store时刻”来啦
声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。1月5日凌晨,OpenAI向所有自定义GPT开发者发布了一封邮件,下周将上线“自定义GPT商店”。...
日期:01-05
24GB HBM3E内存明年初交付:NVIDIA疯狂堆料282GB!
美光确认,将在明年初大批量出货交付HBM3E高带宽内存,首要客户就是NVIDIA。如今,NVIDIA A100/H100计算卡热卖,对于HBM的需求也空前高涨,动辄单卡几十GB,最近宣布的Grace Hopper超级...
日期:09-30
夸克3.0版升级智能信息服务 功能设置随“口”而动(夸克客户端)
  1月3日,夸克3.0版本全新上线,推出指令控制、搜索直达、AI引擎等多个应用AI技术创新的产品功能和交互场景。   此次升级,夸克3.0更改了工具栏样式,在首页导航栏新增了醒目...
日期:04-02
不排除使用大众MEB平台推出纯电嘉年华汽车可能-福特_大众嘉年华汽车报价及图片
7 月 15 日消息,福特汽车欧洲乘用车负责人 Martin Sander 近日在接受  Automotive News Europe 采访时,表示嘉华年(Fiesta)车型不排除使用大众 MEB 平台的可能。法国如何定制个...
日期:09-20
11升大排柴油机 30度电池!一汽解放联合壳牌打造:星域概念重卡发布
快科技10月21日消息,近日,由壳牌联合一汽解放共同打造的Starship星域概念卡车在北京发布,新车最大的亮点就是采用了混动驱动,可有效减少燃油消耗。据悉,该车已处于研发中后期,预计...
日期:10-22
红魔是90帧吗「红魔9 Pro系列电竞操控无敌:520Hz触控肩键 5G双频Wi-Fi」
快科技11月17日消息,直板机的颜值天花板红魔9 Pro系列将于11月23日14点正式登场,它的后摄做到了纯平无突出,这在旗舰上十分罕见。据红魔游戏手机今日预热,红魔9 Pro系列不仅在颜...
日期:11-17
博纳影业2019年营收「博纳影业第三季度净亏损1.5亿元」
10月30日消息,今日下午,博纳影业发布2022年第三季度财报,报告显示,博纳影业第三季度营收3.03亿元,同比下降46.59%;净亏损1.5亿元,同比扩大422.45%;扣除非经常性损益后的净亏损为1.39...
日期:11-03
预付卡无证者遭遇商家封杀 或被监管“拉黑”
  有大型商家从9月1日始已不受理无牌照的预付卡,这类封杀会随着支付牌照的颁布进程进一步扩大。   央行与商务部联合展开的预付卡专项检查日前正式在全国各地铺开,违规卡...
日期:07-23
女子翻看去世爸爸手机后破防了:爸爸收藏夹里全是我
8月10日消息,河北一名女子无意间翻看爸爸的手机后绷不住大哭,收藏夹内全是自己几年来每次发给他的照片,甚至连自己发的朋友圈也都收藏了。宝马数字钥匙支持华为哪些手机电瓶车...
日期:08-11