您的位置:首页 > 互联网

ChatGPT最强竞品重磅升级,免费可用!第一手实测在此,网友:有个性

发布时间:2023-07-13 13:02:39  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),衡宇 克雷西 发自 凹非寺 ,授权转载发布。

在OpenAI祭出GPT-4的API和“最强插件”代码解释器后,竞争对手显然坐不住了。

就在刚刚,Anthropic旗下Claude发布第二代——没错,就是被外界评价为GPT-4最强竞品的那一个。

浅划一下这次更新动作的重点:

免费,不用排队,自己用邮箱注册即可登陆。

科技大佬们打起来真是妙啊,妈妈再也不用担心ChatGPT/GPT-4将我拒之门外后,打工或写作业时没有AI用了!

英伟达AI高级科学家Jim Fan火速尝鲜,并在推特上分享了自己的Claude2用户体验。

图片

关于Jim Fan老师谈到的Things you should know,量子位挑了些重点:

  • 免费使用!

  • Claude2(100K 上下文)比GPT-4-4K便宜了4-5倍

  • 实际可以支持20万token上下文,约15万个单词,输入一本书不在话下;不过现在只开放了10万token长度

  • 知识更新鲜,知识截止时间是2023年初,而GPT-4停在2021年9月;

  • 可以将多个文档导入后,询问文档之间概念的关系,支持txt、pdf多种格式(ChatPDF之类的应用,危)

  • 代码、小学数学能力,比初代Claude有所进步。

图片

国内AI博主海辛也在微博上惊讶连连。

因为上传自己的简历后,Claude2分析出了她的MBTI人格:

图片

除了他们,第一波冲进网页体验Claude2的网友们已经在激情分享了自己的体验感:

不错子,和GPT-4-32k比,Claude2的回答更个性化~

图片

于是乎,量子位先冲了一波网页对话,来看我们的人肉测验——

咦,Claude更新了?注册一个试试

首先奉上最有节目效果的弱智吧Benchmark,给读者朋友们开开胃。

问的问题无外乎弱智吧的典中典,譬如“咖啡算不算豆浆”“数据线可不可以暂存数据”之类的。

图片

图片

看到Claude2一本正经地回答弱智吧问题,就会发现AI还是太单纯了,看不出人类的小心机。

不过正经地看,这些回答倒也没毛病。

上面的两个问题算Claude2顺利过关,那么如果提问一些更无厘头的问题呢?

问,玉皇大帝到底住在九重天的哪一层?

答,从立足点来看,玉皇大帝所在的天庭,应该处于平流层,因为“这更符合天庭圣洁的定位”。

图片

当然,没有人能评判这个回答到底对还是错,但至少Claude2的这一通分析,还算有理有据。

开胃小菜就展示到这里,下面上正餐!

长文档是本次更新的一大亮点,这一点已经被推特网友们惊呼鹅妹子嘤了。

比如上传两个pdf,可以看到,Claude2可以从两个pdf文档中做出摘要,这两个文档一个关于“语言流变模式”,一个关于“对称性”,并且将文档内容分点列在对话框中:

图片

此前,量子位就出过让初代Cladue-100k版本在20秒速通92页论文的攻略《白嫖GPT-4最强竞品!》。

不只是较大的文档,根据Claude2开放的10万token的上下文来看,一次性上传一本书让它读,也是小菜一碟。

对普通用户来说,现在不仅能够上传长文档,还可以用上传的文件构建自己的知识库,对Claude翻阅文档后进行回答,真的是非常实用。

以至于内心出现一个疑问,会不会在ChatGPT摊薄Jasper、Notion等公司的蛋糕后,Claude也要对ChatPDF类工具下手了?

最后,我们为大家奉上今天的餐后甜点:让Claude2来写个程序试试

为了考验Claude设计算法的能力,我们选择了一种古典密码,让它试着写个解密程序出来。

这种密码叫做维吉尼亚密码,可以理解成二维的凯撒(位移)密码,其中包括密钥。

图片

举个例子说明一下它的算法:

假如明文是B,密钥是C,B是字母表中第二个,那么从C开始数的第二个字母D就是密文。

如果数到了Z,就重新从A开始接着数,密钥长度不足时则进行循环。

解密自然就是把加密过程倒过来。

Claude输出了这样的代码(C++,下同):

#include<iostream>

#include<string>

usingnamespacestd;

stringdecryptVigenere(stringciphertext,stringkeyword){

stringplaintext;

intkeywordIndex=0;

for(inti=0;i<ciphertext.length();i++){

intp=(ciphertext[i]-'A')-(keyword[keywordIndex]-'A');

p=(p+26)%26;

plaintext+=(char)(p+'A');

keywordIndex=(keywordIndex+1)%keyword.length();

}

returnplaintext;

}

intmain(){

stringciphertext;

cout<<"请输入密文:";

cin>>ciphertext;

stringkeyword;

cout<<"请输入密钥:";

cin>>keyword;

stringplaintext=decryptVigenere(ciphertext,keyword);

cout<<"明文是:"<<plaintext<<endl;

return0;

}

我们把“CHATGPT”用密钥“CLAUDE”进行了加密,密文是“ESANJTV”,并尝试用Claude给出的程序解密。

一次就成功了,看来Claude的代码能力的确没让我们失望。

图片

这个问题可能有些简单,我们再加大难度试试。

我们试着从LeetCode中找了一道中等难度的问题,人类解这道题的通过率大概是60%。

给定一个长度为n的整数数组 height 。有 n 条竖直的线,第 i 条线的两个端点是 (i,0) 和 (i, height[i]) 。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水(容器不能倾斜)。返回容器可以储存的最大水量。

这样说可能不那么容易想象,下面的这张图或许更加直观:

图片

原题中给出的示例一共有9条线,高度分别为“1,8,6,2,5,4,8,3,7”,相应的最大水量是49。

我们给Claude2的Promot是酱婶儿的:

写一个C++程序解决这个问题,不要自己设定初始值,让用户输入:(接上面的问题)

Claude2给出了这样的答案:

#include<iostream>

#include<vector>

usingnamespacestd;

intmaxArea(vector<int>&height){

intmax_area=0;

intn=height.size();

for(inti=0;i<n;i++){

for(intj=i+1;j<n;j++){

intwidth=j-i;

inth=min(height[i],height[j]);

max_area=max(max_area,width*h);

}

}

returnmax_area;

}

intmain(){

vector<int>height;

intinput;

cout<<"请输入一系列整数:"<<endl;

while(cin>>input){

height.push_back(input);

}

cout<<"最大面积为:"<<maxArea(height)<<endl;

return0;

}

}

我们没让Claude2专门调整输入和输出格式,所以没有提交给LeetCode,而是直接运行的。

用的数据也是上面提到的,结果表明,Claude2给出的代码至少在核心算法上是正确的。

(下图输入中的a是告诉CPU这一系列整数输入完了,可以替换成任意非数字字符)

图片

看来这个问题也没能难倒Claude2。

除了代码,Claude2据称还拥有小学级别的数学水平。

那就顺便用经典的鸡兔同笼问题考一考它(这道题是ChatGPT出的):

图片

反复尝试了很多次,虽然方程式列得没有问题,但Claude2解出的答案都是20(正确答案应该是40)。

看来计算这种事,对Claude2来说还是有点困难。

有关这次更新的更多信息,可以看下Anthropic的宣传片:

与OpenAI“撕”出来的AI公司

见识过Claude2的表现后,那就不得不提一下背后的公司Anthropic,毕竟真的有点意思。

快手品牌是什么意思

Anthropic自称是一家AI安全公司,且具有公益性(PBC)。

眼下,它和OpenAI同样将重心放在生成式AI上。1月份,公司在市场上已经有50亿美元估值。

Anthropic由OpenAI前研究副总裁Dario Amodei带领10名员工创业,于2021年成立。

这里面既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐),可以说是带走了相当一批核心人才。

redmig60hz

出走成立新公司的原因之一,自然是对OpenAI现状并不满意。

从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。

这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。

当然,还有一部分原因是这群人想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。

于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。

图片

现如今,微软真的和OpenAI有了“深度绑定”的味道。

然而既狗血又八卦味十足的事情是,今年2月,谷歌CEO劈柴哥重磅宣布,斥资3亿美元,投的就是Anthropic。

之所以被外界抱以厚望,称呼Claude2为GPT-4最强竞品,不仅仅是因为Claude实测下来体验确实位于第一梯队,还因为背后实力强大的“爸爸们”:

今年5月,该公司表示筹集了4.5亿美元,使Anthropic筹集的资金总额超过10亿美元

在谷歌入股之前,Anthropic就已经获得了多位大佬的投资,如Skype创始人Jaan Tallinn,Facebook联创Dustin Moskovitz,谷歌前CEO、现技术顾问Eric Schmidt等人。

现在,合作伙伴列表里除了Zoom和Notion.AI,还多了Jasper.AI的名字。

不仅如此,公司核心技术Constitution AI也备受瞩目。

它主要围绕“语言模型如何决定它将涉及哪些问题以及它认为哪些问题不合适?为什么它会鼓励一些行动而阻止另一些行动?语言模型可能具有哪些价值?”展开。

为了解决上述问题,它让AI尽可能遵循很多原则。

原则条目有很多,包括联合国宣言、Anthropic从研究中自己发现的原则,DeepMind在Sparrow研究中提出的原则,甚至还借鉴了苹果的服务条款。

并且是通过AI反馈的方式,来评估输出,应对目前AI的缺点。具体体现在AI训练过程中,分为两个阶段:

第一阶段,模型被训练使用一套原则和一些过程的例子,来评估和修改自己的反应;

第二阶段,模型通过强化学习进行训练,使用基于原则集的AI生成的反馈来选择和输出更无害的内容。

图片

这一点与ChatGPT的的杀手锏RLHF(人类反馈强化学习)大相径庭,而Anthropic给出的解释是:

基于Constitution AI的强化学习,比从RLHF中强化学习得出的生成内容,更有用,且更无害。

并且,还更容易规模化。

在这套Constitution AI,迭代到2.0的Claude,确实在导入文件、上下文窗口理解等功能方面,比GPT-4更引人注目。

不过也不是完美的,比如GRE考试成绩上,Claude2就5局3败,输给了GPT-4。

平板电脑全球出货量

但不可否认,巨佬们在AI方面你追我赶的局面,让本普通用户切切实实感受了一波渔翁得利的快乐,嘻嘻嘻(狗头)。

速来自己肉测:

https://claude.ai


返回网站首页

本文评论
三维家登陆「三维家首登中国CAD&CG“奥斯卡”顶会 工业元宇宙重新定义制造业」
2022 年 8 月 23 至 25 日,由中国计算机学会(简称CCF)主办的第24、 25 届全国计算机辅助设计与图形学学术会议,在大连富丽华酒店隆重召开。作为中国计算机辅助设计与计算机图...
日期:09-11
平板电脑 笔记本 办公「平板电脑 笔记本」
随着科技的不断进步,电脑已经成为人们生活中不可或缺的工具。而现在,电脑的形态也在不断地变化,平板电脑和笔记本电脑已成为人们广泛使用的电脑形态之一。那么平板电脑和笔记本...
日期:05-29
Linux系统bug坑了AMD 20年 Intel处理器不受影响_amd的问题
在Linux系统上,人们经常能发现一些bug会导致现在的处理器性能大受影响,这一次发现的陈年bug甚至可以追溯到20年前,导致AMD现在的处理器性能在Linux中性能下滑,但Intel的处理器不...
日期:09-30
苹果公布第四季度财报 三个月狂赚1500亿人民币_苹果最新财报
中关村在线消息:近日,苹果公司了第四季度的财报。蔚来9月共交付智能电动汽车10628台苹果公布第四季度财报总净营收为901.46亿美元,与上年同期的833.60亿美元相比增长8%;净利润...
日期:11-01
微软发布《光环》联名版Xbox Series X:定制主题开机音效_xbox series x 音效
  在今天凌晨的科隆游戏展发布会上,微软正式发布Xbox Series X《光环:无限》联名版游戏主机。   为庆祝《光环》系列20周年与《光环:无限》,这款联名版Xbox Series X的设计...
日期:07-21
阿尔忒弥斯登月计划火箭「NASA定于9月3日重新发射“阿尔忒弥斯1号”火箭」
当地时间8月30日,美国国家航空航天局(NASA)“阿尔忒弥斯1号”任务经理迈克·萨拉芬表示,将于9月3日重新发射“阿尔忒弥斯1号”火箭。萨拉芬指出,在29日发现火箭其中一个发动机可...
日期:09-09
小米13 Ultra聘请演员张颂文担任影像大使
小米宣布,演员张颂文将担任小米13 Ultra的新影像形象大使。这款手机将于今晚发布,专注于成像,采用一英寸传感器,具有可变光圈和改进的背景虚化功能。重要性:天猫开心夜晚会小米...
日期:04-18
极氪回应将被吉利分拆上市:将以业务为先 确保7万辆年销量「极氪汽车吉利退股」
10月31日 消息:今日,吉利汽车公告称,已向香港联交所提交一份议案,内容有关建议分拆极氪并将其独立上市。小米13ultra今天最新官方消息iPhone14吧极氪方面就此回应称,“我们将根...
日期:11-01
元世界和元宇宙「元宇宙的魔法」
声明:本文来自于微信公众号 孟永辉(ID:menglaoshi0071),作者:南山,授权转载发布。毋庸置疑的是,元宇宙是具有巨大的魔力的。而元宇宙之所以会具有如此巨大的魔力,正是在于它的包容...
日期:09-11
智能录音笔科大讯飞_大屏AI录音笔开创者 讯飞智能录音笔SR系列全面升级
  ​5月27日,科大讯飞在京召开媒体沟通会,科大讯飞执行总裁胡郁、科大讯飞副总裁兼消费者事业群副总裁李传刚出席活动并共同宣布其消费者智能转写旗舰产品讯飞智能录音笔...
日期:07-14
施一公院士:中国造就最大留学潮,造福中国,推动世界发展「施一公谈留学生归国比例」
5月26日消息,2023年中关村论坛全体大会上,中国科学院院士施一公发表主题演讲。施一公表示,当下人们面对庞大而严密的知识体系,怎么样保持创新是一个大问题。他谈到,如果我们人类...
日期:05-27
限制消费者选择权!上海消保委:停车缴费强制关注公众号不合理
快科技6月8日消息,目前全国大部分的停车场基本都是自助缴费了,使用支持支付宝、微信支付很方便,不过,也有部分停车场缴费时必须关注它的公众号才行。米家空气净化器max增强版除...
日期:06-09
iPhone 14销量暴跌!苹果也要卖不动了「苹果14还会降价吗」
iPhone 14销量暴跌几乎已经是板上钉钉的事情,首销当天就直接让黄牛亏钱,也是闻所未闻的。由于苹果“挤牙膏”式的升级操作,大大低于消费者对iPhone 14入门机型的预期,导致绝大部...
日期:10-11
云闪付1212全民回报节_云闪付年末答卷 12.12回报全民
  日前,中国银联宣布正式启动“12.12全民回报节”,亮剑年末消费季。活动期间,消费者可使用云闪付APP、银联二维码、银联手机闪付等银联移动支付产品,在超过40万家线下商户门...
日期:09-26
迅雷:第二季度营收7830万美元 同比增长41.9%(云业务带来新价值 迅雷连续七季度营收增长)
查看最新行情   讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41....
日期:08-17
百度资本宣布李晓洋担任百度资本CEO职务「百度 李晓洋」
  讯 8月26日凌晨消息,百度资本今日宣布李晓洋担任百度资本CEO职务,负责百度资本的投融资及全面管理工作。美的电压力锅打不开盖的原因是什么怎么修央行颁发的支付牌照华为...
日期:08-27
手机文件传输APP_安卓平台神器分享!点传APP,各种手机文件快速传输
  对于我来说,一个可以留在手机里的文件传输APP是什么样子?不占内存、传输速度快、流量消耗少、使用简单,还要有不俗的“颜值”,最好是身边朋友也在使用的。   最近,我在...
日期:02-11
美国所有航班都已停飞 电脑系统竟突发故障:官方给出恢复时间
据CCTV国际时讯报道1月11日最新消息:据多家美国媒体报道,美国东部时间11日清晨,美国联邦航空局发表声明称,由于断电导致的电脑系统故障,联邦航空局无法更新航行通告”(向飞行员或...
日期:01-12
被AI冲击的游戏公司,会上演“集体失业”吗?「游戏公司illusion」
声明:本文来自于微信公众号 DoNews(ID:ilovedonews),作者:李信马,授权转载发布。一年前,笔者曾采访过一位游戏领域的资深从业者,他讲过一个有趣的观点:如果要创业做游戏项目,先去找...
日期:06-09
手机行业格局「终于,手机行业到了比拼「价值观」的赛点」
声明:本文来自于微信公众号 真探AlphaSeeker(ID:deep_insights),作者:何文,授权转载发布。手机行业的坏消息一个接一个。国际数据公司IDC报告显示,2022年,中国智能手机市场出货量约2....
日期:02-22