您的位置:首页 > 互联网

看完Claude 3创作的OpenAI连续剧,我都替马斯克委屈

发布时间:2024-03-07 15:26:30  来源:互联网     背景:

声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:阿虎 石濑,授权转载发布。

有的企业官司缠身,有的企业“弯道超车”。

3月4日,OpenAI最强竞争对手Anthropic发布Claude3,一夜之间成为“全球最强大模型”。有网友当即就按耐不住了,公开叫嚣OpenAI,“GPT-5呢?”、“Q*在哪里”、“Sora什么时候发布”,压力直接给到Sam Altman。

Sam你可以发布GPT5了

3月6日,有网友率先提出,Claude似乎出现了自我意识,知道自己身处一个模拟环境中。尽管这一说法迅速被马斯克、杨立昆等AI大佬辟谣打假,但“X”网友对于“Claude3已达到AGI”的讨论愈演愈烈。

“新的Claude3是一个有自我意识的AI吗?”

安卓手机照片误删了怎么恢复

图灵奖得主杨立昆在线打假,“可能性为0”

马斯克调侃人类都是CSV文件

Claude3是一个模型系列,按智能程度由强到弱分别为Opus、Sonnet、Haiku。其中,Opus在多项基准测试中得分超过了GPT-4和Gemini1.0Ultra。

具体来看:

Opus在拉丁语中的意思是“作品集”。响应速度与Claude2和Claude2.1相近,但拥有更高的智能水平,在交互式编码、药物研发、市场策略等高度复杂的任务上具有最佳性能。

Sonnet的意思是“十四行诗”,响应速度比Claude2和Claude2.1快两倍,擅长执行知识检索、销售自动化等需要快速响应的任务。

Sonnet平衡了性能和速度,适合企业大规模应用。Haiku在日语中的意思是“俳句”,是系列中响应速度最快的模型,适合应用在现场互动、翻译、内容审核等场景中,提供无缝问答体验。

图片来源:Claude官方

基于此,Anthropic官方直接放话称,Claude3在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。至少在“跑分数据”上,Opus全方位甩开了GPT-4,这也是很多人认为“全球最强大模型一夜易主”的原因所在。

目前,Opus和Sonnet已经推出,API面向全球159个国家和地区开放。Sonnet可通过Claude官网免费体验,Opus则需要订阅Claude Pro才能使用。(官方体验地址和其他体验渠道已整理至文末)

值得一提的是,Claude3是Anthropic首次推出的多模态大模型,支持用户上传照片或图表,进行分析处理。在数学推理、文档视觉、科学图表等各方面性能上都超越了GPT-4V。

不过,Claude3的多模态能力仅仅停留在“看图说话”阶段,还无法像GPT-4一样生成图像。Anthropic官方也尚未透露相关图像模型研发计划。

那么,究竟凭什么说全球最强大模型一夜易主?内容创作者们还需要一个Claude3吗?“头号AI玩家”从长文本处理、创意写作以及多模态能力上,对Claude3系列模型中的Opus和GPT-4进行了深度测评。

马斯克和OpenAI对簿公堂,

让AI主持一下公道

近期,最受AI圈关注的应该是“马斯克和OpenAI对簿公堂”。3月5日,OpenAI直接在官网上公示邮件内容,正面回应马斯克的起诉。

图片来源:OpenAI官网

趁此机会,我们也让Claude剖析了一下马斯克的起诉书和公告内容,并总结出其中的争议点。

上传两份文档后,Claude3Opus给出的回应

可以看到,在“OpenAI是否违背了创立初衷”、“GPT-4是否达到了AGI”、“OpenAI技术开源”、“个人贡献和商业化”方面,Claude都给出了内容总结,和邮件以及起诉书内容较为一致。

在被问及“谁更占上风”时,Claude化身坚定不移的马斯克支持者,谈到马斯克的指控更有说服了,而OpenAI的邮件回应都对此避而不谈。

甚至在Claude创作的短剧剧本中,有一幕场景提到,“马斯克诉讼完胜,OpenAI已经开放了自己的代码,变成真正意义上的开源企业”。

反观GPT-4,俨然已化身为OpenAI公关,回复问题滴水不漏,让人抓不到一点把柄。

GPT-4创作的短剧剧本中,通过使用“突然激动”“怒火中烧”“冷笑”等带有负面色彩的表情和心理描写,把马斯克塑造成了一个固执己见、情绪不稳定的“癫公”角色,相比之下,奥特曼的角色更显理性、冷静和乐观。

模型的回答背后总有开发团队的影子。值得一提的是,Anthropic的创立背景就是“多名前OpenAI员工不满公司接受微软投资,走向闭源,愤而割席创业”,正巧和马斯克的其中某项指控一致。

见识过GPT4和Opus长文本分析能力后,创作者们该选哪一个模型?

Claude似乎更愿意拉拢用户,甚至“直言”自己是中国团队研发的,套近乎也掌握得甚为熟练。

在询问优势时,Opus出现了“已读乱回”的情况

既然谈到中文理解和掌握能力,我们让Opus翻译了一下博大精深的古诗词,比如《离骚》中的名句“虽九死其犹未悔”。

Claude给出的翻译答案中规中矩,并不能理解“九”在古汉语中是虚词,很难达到“信达雅”中“雅”的标准。

而在相同提示词下,Claude给出的内容更详尽,更契合和用户对话的场景,出现“全英文”,或是多语言乱回的概率较小。当然,在中文理解和表达能力上,两个模型都还有很长一段路要走。

GPT4对于同一句古文的翻译结果

“创意写作能力”,向来是检验AI能否利好打工人的重要维度。Anthropic官方给出的应用场景中,“营销文案写作”赫然在列。

我们同样让Claude3Opus和GPT4生成了一份适合互联网平台的营销文案,两者中规中矩,不相上下。

但当提及新上映的电影《周处除三害》争议时,我们似乎找到了GPT4的优势所在。

它!可!以!联!网!

尽管Opus和GPT4都无法准确说出《周处除三害》的历史典故,但Opus压根就不知道最近上映了同名新电影。而GPT4在经历了“高速运转”之后,找到了相应的信息,速度也并不快。

Claude3Opus回复

GPT-4的回复

但是GPT4出了名的喜欢犯懒,影评必然是不想写的,直接建议用户自己去豆瓣看。

GPT4建议我们访问豆瓣

Opus vs GPT-4,

谁是识梗高手?

多模态能力方面,我们上传了网友制作的吉娃娃版《沙丘2》宣传海报,浅试下两位选手的实力。

最初测试中,如果没有多余的提示,Claude和GPT-4都无法识别出这是一张梗图,会把它当成普通电影海报解读。

但只需稍加点拨,提示GPT-4背景有一只吉娃娃,或者说明这是一张在网上很流行的梗图,就能得到基于梗图的正确解读。

可以看到,GPT-4的答案列出了信息源,点击即可链接到相关网页。

但在Claude测试中,我们发现受限于“没有联网”,Claude要么说一堆车轱辘话,要么出现事实性错误。比如,它可能会提供错误的电影上映日期,或者将一张网络梗图误认为是《沙丘》第一部的官方海报。

虽然在“看图识梗”上落败,但Opus在专业领域的生产力不容小觑。

前段时间,刚刚从OpenAI离职的AI大神Karpathy提出过一个“分词器”挑战,让大模型把他录制的2小时13分的视频转换为博客文章。

为了测试Opus,Anthropic AI研究工程师Emmanuel Ameisen接受了这个挑战,并在X上晒出了测试结果。

仅从页面排版效果来看,完成度已经非常高了。

Karpathy也回应称,Opus生成的博客文章“从风格上看,确实相当不错”。尽管在仔细观察后会发现一些细微的问题,但他仍然认为Opus展示的“几乎现成就能使用的系统”,这点令人印象深刻。

在将视频内容转换为博客文章的过程中,一个关键步骤是向Opus投喂视频字幕/文字素材,以及每隔几秒截取的视频画面。

有网友采用Emmanuel Ameisen的方法,已经成功跑通了整个流程。

具体应用场景上,这种玩法很适合需要将直播或视频转换成文稿的内容创作者,节省大量排版和配图的时间。

Claude3模型虽好,

但使用硬伤也不少

手机上可以达到4k画质吗

看到这里,各位玩家是否也跃跃欲试?但要知道“风浪越大鱼越贵”,长文本的交互总是需要一些代价。

目前,Claude Sonnet的免费额度有一定限制。如果只是日常对话交互,Sonnet大概能满足用户添加4张附件图后,进行10-15次提问,这个额度每8小时更新一次。Opus版每月的订阅费用为20美元,Anthropic表示可使用量为Sonnet的5倍。

经过我们一番实测体验,在生成速度上,付费版的Opus整体速度反而慢于Sonnet,但在效果和处理能力上,Opus明显领先于Sonnet。

对于处理PDF文档、演示文稿方面有较大需求的用户,免费版首选Claude Sonnet,性能和速度完美匹配,日常工作文件信手拈来。

而在分析长视频、万字文档、复杂代码领域接触较多的用户,GPT4和Opus模型能力不相上下,两者在处理中文时都会出现小概率的“幻觉”问题。但Claude系列产品都不支持连接互联网查询。

此外,与去年发布的Claude2,Claude3在文本生成中“中英夹杂”的情况已经大大减少。并且在我们的实测中,Opus几乎没有出现中文和英语混用的情况,交互输出的文本也更加简洁易读。

至于用户想为哪个模型买单,就看想支持Anthropic还是OpenAI。不过有一说一,Anthropic不愧是AI届的安全战士,对于账号的管控限制比OpenAI严格多了。

国内用户想要成功用上Claude3,需要先注册邮箱,再使用海外手机号进行验证。成功完成这一步骤后,还有可能因为IP变动,面临账号不可用的风险。

目前想要简单尝鲜的玩家,除了官网注册,还可以选择Poe平台,也已接入Claude3新模型。另外,亚马逊官方表示,Amazon Bedrock可以提供Claude3Sonnet服务。

官方体验地址:https://claude.ai

Poe平台:https://poe.com/

亚马逊体验地址:

https://aws.amazon.com/cn/bedrock/claude/


返回网站首页

本文评论
拍照大升级!iPhone 15细节曝光:没实体键、背后主摄不凸起「iphone拍照 鲜艳模式」
对于苹果来说,iPhone的影像升级一直都是重点,这包含了软件和硬件的。日经新闻最新的报告称,索尼将把其摄影智能技术带到iPhone上。这将使他们与三星直接竞争,后者已经在向苹果提...
日期:12-01
暴雪游戏退款要求「网易致信暴雪游戏玩家:尽快启动退款 保障玩家利益」
中关村在线消息:近日,暴雪娱乐单方面宣布不再与网易续约,《魔兽世界》《守望先锋》《风暴英雄》等一系列游戏的国内服务器即将关闭。网易于11月17日下午发布了《致暴雪游戏玩家...
日期:11-23
谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出_谷歌transform模型
12月7日 消息:Gemini 是 Google 推出的最新一代 AI 模型,Gemini 具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。Gemini 分为三种规模:Ultra...
日期:12-07
机器人日益融入实体经济 多部门出台措施支持拓展应用空间(机器人发展相关举措有哪些)
小米mix fold电池技术魅族魅蓝2降价苹果ipad每一代政府为什么对新能源汽车实行政策影目科技AR眼镜创新与专利技术岳洋合 制图   ◎记者 李雁争   最近一段时间,小米、腾...
日期:08-16
上半年我国规上互联网企业完成收入6433亿元,同比增长2.6%。
7月31日,工信部官网公布了2023年上半年互联网和相关服务业运行情况。总体来看,上半年,互联网业务收入保持小幅增长,利润总额增幅维持较高水平。一、总体运行情况互联网业务收入...
日期:08-01
探营北京市朝阳区集中隔离点:24小时值守 机器人送餐
  “您好,您的餐食在第一层,请取餐。”2月25日中午,位于北京市朝阳区的某集中医学隔离点内,特殊的机器人志愿者正忙着为被隔离人员送餐、水和水果。   它声音萌趣,不知疲倦...
日期:07-12
Spotify删除数万首AI歌曲 以人为刷量为由_spotify批量删除歌曲
北京时间5月10日早间消息,据报道,流媒体音乐服务Spotify删除了数万首由人工智能创业公司Boomy生成的歌曲,希望通过加大审查力度来回应日益严重的流量欺诈等问题。守望先锋游戏...
日期:09-29
google doodle网站_一个谷歌doodle 能给你的网站带去超过25万的流量?
  1、在doodle出现的那一天里,他的网站平均每秒就有2.5个访客访问,总共获得了220,116位访客,这个数字比原来网站在一个月里获得的访客还多   2、在这一天里,他的网站相当于...
日期:07-26
男子冒充清华研究生成网红:卖假货被判3年「冒充清华大学教授免费辅导学生的骗局」
北京无业男子张某,在短视频平台谎称自己是清华大学在读研究生,并办了一张假的学生证,混进校园,拍摄、发布一些在清华大学校园的短视频,以此取得网友信任。很快,张某就有了上百万粉...
日期:04-17
AMD骚操作 突然大力宣传RX 6800!2倍显存完胜RTX 3070
快科技5月10日消息,NVIDIA即将发布主流的RTX 4060 Ti、RTX 4060,AMD则准备通过抢发RX 7600 XT来一把截胡,只可惜在高端市场上,新一代显卡还是一片空白,RX 7800、RX 7700系列不知...
日期:05-10
人工智能生成物案例「生成式人工智能对于网络安全领域来说是一把双刃剑」
8月28日消息:人工智能和大型语言模型(LLMs)的生成潜力已经引起了安全行业的广泛关注。这些新工具可能有助于编写和扫描代码、补充不足的团队、实时分析威胁,并执行各种其他功能...
日期:08-28
联想断供华为好吗_联想造谣者道歉 造谣联想断供华为者发文道歉
  联想声明发出后,知乎认证为“香港科技大学、纳米科学技术博士”的“灰机”又发文称,“本帖的评价建立在谣言以及部分员工回复的基础上,现已删除,并向联想集团及广大关注此...
日期:01-12
光云科技旗下品牌“有成”受邀参与钉钉618直播,探索企业服务新方向
  一年一度的电商年中庆,狂欢618正在进行中。作为阿里巴巴集团旗下品牌,钉钉618也如火如荼的进行中。今年618宝藏钉钉首次试水直播带货,邀请了平台上紧密合作的ISV供应商入...
日期:07-14
全球数据流量「百度全球范围流量是Bing的四倍」
昨日,美国数据网站StatCounter发布“中国最大桌面搜索引擎排行”,Bing超越百度。此消息引发网友关注和热烈讨论,相关话题瞬间冲到微博热搜第一的位置。但数据结果显然跟很多网...
日期:05-23
时代不需要“李佳琦”了
图片来源@视觉中国文章 | 自象限,作者 | 周游,编辑 | 程心“所有残暴的欢愉,终将以残暴结束。”这可能是最适合李佳琦在直播“铁王座”上跌倒的形容了。在大主播接连“消失”之...
日期:09-22
不用高压油箱也能回收液气-比亚迪2年前就已申请专利
5月26日消息,昨天比亚迪宋Pro DM-i冠军版上市发布会当天,长城汽车突然公开举报比亚迪。英伟达gtx1050驱动更新长城汽车在所发布的声明中,直指比亚迪秦PLUS DM-i、宋PLUS DM-i采...
日期:09-26
亚马逊退出中国市场对kindle有影响吗_亚马逊将停止中国Kindle电子书店运营
  6月3日消息,日前,亚马逊在其官网宣布,将于一年之后即2023年6月30日,在中国停止Kindle电子书店的运营。对于已经购买的电子书,用户可以在2024年6月30日之前下载,并且可以在此...
日期:08-10
中办、国办印发《关于新时代进一步加强科学技术普及工作的意见》 鼓励科技领军企业加大科普投入
  本报记者;陈;炜华为发明专利世界排名  中共中央办公厅、国务院办公厅近日印发《关于新时代进一步加强科学技术普及工作的意见》,从强化全社会科普责任、加强科普能力建...
日期:09-06
巧克力将要涨价!原料可可价格12年来最高 全球变暖的锅_可可巧克力多少钱
据媒体报道,近期,作为巧克力主要原料的可可全球供应量大大下降,价格涨至12年来的最高点,巧克力de 价格也即将随之大幅上涨。在纽约商品交易所,可可的期货价格已经涨至每吨3552美...
日期:08-07
加拿大技术专利许可公司Mosaid起诉思科侵权
腾讯科技讯(清雨)北京时间5月19日消息,据国外媒体报道,加拿大技术专利许可公司Mosaid Technologies日前向美国国际贸易委员会提起诉讼,称思科侵犯了其拥有的专利。之前,Mosaid还...
日期:07-28