您的位置:首页 > 互联网

ChatGPT最强竞品重磅升级,免费可用!第一手实测在此_chatld

发布时间:2023-07-12 23:39:34  来源:互联网     背景:

  • 衡宇 克雷西 发自 凹非寺
    量子位 | 公众号 QbitAI

在OpenAI祭出GPT-4的API和“最强插件”代码解释器后,竞争对手显然坐不住了。

就在刚刚,Anthropic旗下Claude发布第二代——没错,就是被外界评价为GPT-4最强竞品的那一个。

浅划一下这次更新动作的重点:

免费,不用排队,自己用邮箱注册即可登陆。

科技大佬们打起来真是妙啊,妈妈再也不用担心ChatGPT/GPT-4将我拒之门外后,打工或写作业时没有AI用了!



英伟达AI高级科学家Jim Fan火速尝鲜,并在推特上分享了自己的Claude2用户体验。



关于Jim Fan老师谈到的Things you should know,量子位挑了些重点:

  • 免费使用
  • Claude2(100K 上下文)比GPT-4-4K便宜了4-5倍
  • 实际可以支持20万token上下文,约15万个单词,输入一本书不在话下;不过现在只开放了10万token长度
  • 知识更新鲜,知识截止时间是2023年初,而GPT-4停在2021年9月;
  • 可以将多个文档导入后,询问文档之间概念的关系,支持txt、pdf多种格式(ChatPDF之类的应用,危⚠️)
  • 代码、小学数学能力,比初代Claude有所进步。



国内AI博主海辛也在微博上惊讶连连。

因为上传自己的简历后,Claude2分析出了她的MBTI人格:



除了他们,第一波冲进网页体验Claude2的网友们已经在激情分享了自己的体验感:

不错子,和GPT-4-32k比,Claude2的回答更个性化~



于是乎,量子位先冲了一波网页对话,来看我们的人肉测验——

咦,Claude更新了?注册一个试试

首先奉上最有节目效果的弱智吧Benchmark,给读者朋友们开开胃。

问的问题无外乎弱智吧的典中典,譬如“咖啡算不算豆浆”“数据线可不可以暂存数据”之类的。





看到Claude2一本正经地回答弱智吧问题,就会发现AI还是太单纯了,看不出人类的小心机。

不过正经地看,这些回答倒也没毛病。

上面的两个问题算Claude2顺利过关,那么如果提问一些更无厘头的问题呢?

问,玉皇大帝到底住在九重天的哪一层?

答,从立足点来看,玉皇大帝所在的天庭,应该处于平流层,因为“这更符合天庭圣洁的定位”。



当然,没有人能评判这个回答到底对还是错,但至少Claude2的这一通分析,还算有理有据。



开胃小菜就展示到这里,下面上正餐!

长文档是本次更新的一大亮点,这一点已经被推特网友们惊呼鹅妹子嘤了。

比如上传两个pdf,可以看到,Claude2可以从两个pdf文档中做出摘要,这两个文档一个关于“语言流变模式”,一个关于“对称性”,并且将文档内容分点列在对话框中:



此前,量子位就出过让初代Cladue-100k版本在20秒速通92页论文的攻略《白嫖GPT-4最强竞品!》。

不只是较大的文档,根据Claude2开放的10万token的上下文来看,一次性上传一本书让它读,也是小菜一碟。

对普通用户来说,现在不仅能够上传长文档,还可以用上传的文件构建自己的知识库,对Claude翻阅文档后进行回答,真的是非常实用。

以至于内心出现一个疑问,会不会在ChatGPT摊薄Jasper、Notion等公司的蛋糕后,Claude也要对ChatPDF类工具下手了?

最后,我们为大家奉上今天的餐后甜点:让Claude2来写个程序试试。

为了考验Claude设计算法的能力,我们选择了一种古典密码,让它试着写个解密程序出来。

这种密码叫做维吉尼亚密码,可以理解成二维的凯撒(位移)密码,其中包括密钥。



举个例子说明一下它的算法:

假如明文是B,密钥是C,B是字母表中第二个,那么从C开始数的第二个字母D就是密文。

如果数到了Z,就重新从A开始接着数,密钥长度不足时则进行循环。

解密自然就是把加密过程倒过来。

chattype

爱库存上市了吗

Claude输出了这样的代码(C++,下同):



光大集团采购平台

我们把“CHATGPT”用密钥“CLAUDE”进行了加密,密文是“ESANJTV”,并尝试用Claude给出的程序解密。

蔚来et5最新消息

一次就成功了,看来Claude的代码能力的确没让我们失望。



这个问题可能有些简单,我们再加大难度试试。

我们试着从LeetCode中找了一道中等难度的问题,人类解这道题的通过率大概是60%。

给定一个长度为n的整数数组 height 。有 n 条竖直的线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水(容器不能倾斜)。返回容器可以储存的最大水量。

这样说可能不那么容易想象,下面的这张图或许更加直观:



原题中给出的示例一共有9条线,高度分别为“1,8,6,2,5,4,8,3,7”,相应的最大水量是49。

我们给Claude2的Promot是酱婶儿的:

写一个C++程序解决这个问题,不要自己设定初始值,让用户输入:(接上面的问题)

Claude2给出了这样的答案:



我们没让Claude2专门调整输入和输出格式,所以没有提交给LeetCode,而是直接运行的。

用的数据也是上面提到的,结果表明,Claude2给出的代码至少在核心算法上是正确的。

(下图输入中的a是告诉CPU这一系列整数输入完了,可以替换成任意非数字字符)



看来这个问题也没能难倒Claude2。

除了代码,Claude2据称还拥有小学级别的数学水平。

那就顺便用经典的鸡兔同笼问题考一考它(这道题是ChatGPT出的):



三大运营商联合发布5G消息

反复尝试了很多次,虽然方程式列得没有问题,但Claude2解出的答案都是20(正确答案应该是40)。

看来计算这种事,对Claude2来说还是有点困难。

与OpenAI“撕”出来的AI公司

见识过Claude2的表现后,那就不得不提一下背后的公司Anthropic,毕竟真的有点意思。

Anthropic自称是一家AI安全公司,且具有公益性(PBC)。

眼下,它和OpenAI同样将重心放在生成式AI上。1月份,公司在市场上已经有50亿美元估值。

Anthropic由OpenAI前研究副总裁Dario Amodei带领10名员工创业,于2021年成立。



这里面既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐),可以说是带走了相当一批核心人才。

出走成立新公司的原因之一,自然是对OpenAI现状并不满意。

从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。

这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。

当然,还有一部分原因是这群人想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。

于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。



现如今,微软真的和OpenAI有了“深度绑定”的味道。

然而既狗血又八卦味十足的事情是,今年2月,谷歌CEO劈柴哥重磅宣布,斥资3亿美元,投的就是Anthropic。

之所以被外界抱以厚望,称呼Claude2为GPT-4最强竞品,不仅仅是因为Claude实测下来体验确实位于第一梯队,还因为背后实力强大的“爸爸们”:

今年5月,该公司表示筹集了4.5亿美元,使Anthropic筹集的资金总额超过10亿美元。

在谷歌入股之前,Anthropic就已经获得了多位大佬的投资,如Skype创始人Jaan Tallinn,Facebook联创Dustin Moskovitz,谷歌前CEO、现技术顾问Eric Schmidt等人。

现在,合作伙伴列表里除了Zoom和Notion.AI,还多了Jasper.AI的名字。



不仅如此,公司核心技术Constitution AI也备受瞩目。

它主要围绕“语言模型如何决定它将涉及哪些问题以及它认为哪些问题不合适?为什么它会鼓励一些行动而阻止另一些行动?语言模型可能具有哪些价值?”展开。

为了解决上述问题,它让AI尽可能遵循很多原则。

原则条目有很多,包括联合国宣言、Anthropic从研究中自己发现的原则,DeepMind在Sparrow研究中提出的原则,甚至还借鉴了苹果的服务条款。

并且是通过AI反馈的方式,来评估输出,应对目前AI的缺点。具体体现在AI训练过程中,分为两个阶段:

第一阶段,模型被训练使用一套原则和一些过程的例子,来评估和修改自己的反应;

第二阶段,模型通过强化学习进行训练,使用基于原则集的AI生成的反馈来选择和输出更无害的内容。



这一点与ChatGPT的的杀手锏RLHF(人类反馈强化学习)大相径庭,而Anthropic给出的解释是:

基于Constitution AI的强化学习,比从RLHF中强化学习得出的生成内容,更有用,且更无害。
并且,还更容易规模化。

在这套Constitution AI,迭代到2.0的Claude,确实在导入文件、上下文窗口理解等功能方面,比GPT-4更引人注目。

不过也不是完美的,比如GRE考试成绩上,Claude2就5局3败,输给了GPT-4。

但不可否认,巨佬们在AI方面你追我赶的局面,让本普通用户切切实实感受了一波渔翁得利的快乐,嘻嘻嘻(狗头)。

速来自己肉测:

http://claude.ai


返回网站首页

本文评论
零售圈有大动作 “真快乐”APP到底啥来头
  双旦刚过,大家还沉浸在新一年的欢快气氛中没回过神来,一波“新春福利”又安排上了——1月12日,“真快乐”APP抢先版开始悄然进入大众的视野。“真快乐”是什么?它又是怎么...
日期:07-10
东南亚tiktok在流行什么「从东南亚到欧美,淘金TikTok的正确姿势是什么?」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:云飞扬1993,授权转载发布。在之前的TikTok系列报道中,我们已经相继讨论了什么是TikTok,TikTok网红有哪些特征,以及包括主播、商...
日期:09-29
灿谷荣获2019中国新经济创新势力榜“最佳车主服务平台”大奖
  3月12日,由iiMedia Research(艾媒咨询)主办的2019出行超级沙龙在北京圆满落幕,同期举行“2019中国新经济创新势力榜”颁奖盛典,作为优秀企业代表,灿谷荣获“2019最佳车主服...
日期:12-22
小度q k「小度青禾学习手机首销在即 来京东618入手新机享30天无忧试」
5 月 31 日晚 8 点,京东 618 将全面开启,预售产品可以付尾款、等收货了。作为参与今年京东 618 的一份子,小度青禾学习手机也于 5 月 31 日晚 8 点在京东开启首销。该款产品在...
日期:05-31
奇妙的拜年方式增加了!人民日报新媒体中心喊你来玩“AI云拜年,舞福临门”活动
  它来了它来了,2021年春节就在全网呼喊“牛转乾坤”的期待中走来了!特别的新年,特别的时间,特别过大年怎么能让拜年“一般般”?当人们纷纷响应着过年不返乡的号召时,便...
日期:07-16
Gartner:2021 年全球智能手机销量预计增长 11.4%,达 15 亿部_2021年全球智能手机市场份额
  2月4日消息 国外研究机构 Gartner 发布了 2021 年全球智能手机销量预测。报告显示,今年全球智能手机销量预计达到 15 亿部,同比增长 11.4%。   Gartner 高级研究主任 A...
日期:07-16
抖音电商整治DIY电脑及电脑硬件类目 严重违规将清退店铺
12月14日 消息:日前,抖音电商发布了DIY电脑及电脑硬件类目治理公告。公告称,平台近期收到部分消费者针对部分商家违规销售翻新显卡/老库存板卡产品等产品的投诉反馈,经平台核查...
日期:12-14
收益率破1.4% 余额宝不香了?_余额宝收益0.33
;  9月8日,天弘余额宝货币市场基金7日年化收益率报1.3920%,短暂反弹之后再度跌破1.4%。以余额宝为代表的货币基金收益持续下滑,投资者选择“割肉”还是继续持有呢?阿里处罚口...
日期:09-10
为十年“降碳”浪潮递工具的人
  撰文/赵子坤  编辑/李原  今年以来,三藏科技CEO童甫明显感觉到,来做碳排放评估的企业类型更多样,需求也更紧迫了。腾讯手机管家检测病毒可信吗  来者不只有石化、建...
日期:10-03
联想乐Phone P700「联想乐phones1」
是中国电子巨头联想(Lenovo)推出的一款新型智能手机。该手机近期在市场上备受关注,因其出色的性能和极具吸引力的价格而备受赞誉。首先,具有先进的硬件配置。该手机配备了64位八...
日期:05-31
华为5g项目介绍「华为举办5G商业对话沙龙,携手运营商共促5G产业再升级」
华为举办5G商业对话沙龙,携手运营商共促5G产业再升级 通信产业网|2023-06-27 22:20:10作者:通文来源:通信产业网在2023 MWC 上海期间,华为举办“5G商业对话沙龙”,旨在面向国内外...
日期:06-28
上海东方有线被指霸王收费 不缴欠款不停机(东方有线 上家欠费)
  近日,家住汾西路的黄女士连续向本报维权热线反映东方有线收费不合理、账单收不到等问题。《IT时报》记者就此做了调查。   2010年3月,黄女士所在小区进行数字电视整体...
日期:07-22
iPhone销售额_iPhone第一季度:销售量占5% 全球利润占55%
5月18日消息,据国外媒体报道,Asymco分析师贺拉斯•德迪欧(Horace Dediu)17日发布了对包括苹果iPhone在内全球智能手机和手机制造商的数据统计图。第一季度的全球数据显示了苹...
日期:07-28
复联5还会出吗「复联6推迟上映!现用手机能看《复联5》」
中关村在线消息:10月12日,漫威新片《复仇者联盟6》宣布档期推迟,从原定的2025年11月7日变为2026年5月1日北美上映,晚了半年,离现在还有近4年。《复联6》的编剧为《洛基》《奇异博...
日期:10-13
元宇宙板块币「元宇宙火爆之下,区块链从理想照进现实」
声明:本文来自于微信公众号 孟永辉(ID:menglaoshi007),作者:孟永辉,授权转载发布。当人们一股脑地融入到元宇宙的赛道上,区块链总算是冷静了下来。现在,我们看到的是越来越多的「元宇...
日期:09-27
辛巴辛选集团捐赠100万元物资驰援大庆抗疫
  讯 9月9日下午消息,辛选集团创始人辛有志(网名辛巴)宣布捐赠100万元物资,全力驰援黑龙江省大庆市。目前,这批包括100吨大米在内的物资已在运输途中。机械革命code01缺点rog g...
日期:09-10
“2011网民常用软件评选”揭晓:生活服务类软件最具潜力(软件资讯网站)
  近日,由360软件管家携手《法制晚报》举办的“2011新春网民常用软件评选”活动结果揭晓,灵格斯词霸、多媒体格式工厂、酷狗音乐、植物大战僵尸、CCLEANER、360安全浏览器...
日期:07-26
特斯拉在美正式向其他品牌电动汽车开放超级充电站_特斯拉或开放充超级电站
3月1日消息,据外媒报道,当地时间周二下午,特斯拉宣布,正式向其他品牌的电动汽车车主开放部分美国超级充电站。非特斯拉电动汽车车主只需要下载特斯拉应用程序,并创建一个账户,然后...
日期:03-01
墨迹天气全新8.0版本如期而至,为你的生活保驾护航(墨迹天气中文官方网站 - 让气象赋能世界!)
  近日,全球天气服务类平台墨迹天气正式推出最新8.0版本,在延续上个版本的功能服务基础上,本次更新的墨迹天气以其强大的专业技术,和庞大的气象,将为用户提供全球任意经...
日期:09-07
世纪互联发行全球IDC新基建首单零票息可转债,市场超额认购
  2022年1月22日(北京),中国领先的运营商中立和云中立互联网数据中心服务提供商之一的世纪互联集团( Nasdaq:VNET)(以下简称“世纪互联”或“公司”)宣布,发行总额5.25亿美...
日期:07-10