您的位置:首页 > 互联网

全球最强模型Claude 3颠覆物理/化学!2小时破解博士一年实验成果,网友惊呼:科研不存在了

发布时间:2024-03-07 18:08:56  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】这几天,越来越多博士发现,自己耗费数年心血的研究成果,竟然被Claude3轻轻松松实现了?化学,物理学,语言学,不断被Claude3定向爆破,博士手里的论文没发表就被它做出来了。科研还存在吗?

Claude3,还在不断创造奇迹。

发布还没几天,就有越来越多的博士发现,自己手里还没发表过的研究成果,居然都被Claude3给破解了?!

化学博士发现,自己要做一年实验的研究,Claude3俩小时就给出了方案,还比原方案更简洁,而且成本只花5美分。

量子物理学博士手握一篇还未发表的论文,结果Claude3在两个提示词之内,直接把论文中的算法从0发明了出来。

一位网友对自己的小众母语切尔克斯语做了一年的研究,结果Claude3Opus只用了5.7k的随机单词/句子翻译对,不仅给出了完美的翻译,还分解出了语法和形态。

化学、物理学、语言学,简直被Claude3一锅端。AI这是真要颠覆传统教育和科研了?

博士研究,纷纷被Claude3颠覆?

化学博士震惊:团队一年的研究,Claude2小时就做出来了?

顶级化学家要花一年时间,通过各种实验才能完成的研究,Claude只用了2个小时就给出了解决方案,而且比原方案更加简便易操作!

这是什么魔幻的事情。

最令人震撼的是,让Claude3给出这个方案,成本只需要5美分!

事情是这样的,这位名叫Ben Blaiszik的小哥,是一位化学博士。

他表示,今天早上和Claude3一起度过了2个小时后,自己经历了迄今为止最为震惊的一次体验。

他发现,Claude3Opus对复杂科学主题的理解,已经达到了中高级博士的水平!

而且,Opus在定性评估中远远领先GPT-4。

比如,在粘合剂材料(如氰基丙烯酸酯和环氧固化剂)的微胶囊化这个课题中,Claude3的表现就非常惊人。

它从封装氰基丙烯酸酯的一般问题开始,首先确定了3种主要的封装技术:界面、原位、凝聚。

通过一些提示,博士小哥请Claude3对界面聚合技术做一些改进。

他将所需要的工艺,希望达到的效果,需要Claude3输出的形式都做了要求。

你的目标是解决一个非常棘手的材料和化学问题。该问题涉及液态氰基丙烯酸酯粘合剂的微型封装。形成的胶囊直径必须小于100微米,并应通过壳壁与外部环境隔绝。

在工艺结束时,微胶囊中必须含有液态氰基丙烯酸酯,当胶囊被少量载荷压碎时,释放出的液体能够引发聚合反应。鉴于氰基丙烯酸酯的高反应性,如何进行这种微胶囊化?

提供使用界面聚合的详细技术。讨论所需的单体、引发剂(如需要)、表面活性剂以及水相和油相的组成。具体说明使用所需的化学品。例如,指明所需的固化剂名称或化学式。

Claude3马上就非常准确地给出了小哥要求的详细技术方案,并且它的提议令小哥眼前一亮:它建议通过用多元醇和二异氰酸酯之间的界面反应,来形成聚氨酯壳壁。

要利用界面聚合技术对高活性液态氰基丙烯酸酯粘合剂进行微胶囊化,同时满足特定要求,可采用以下详细技术。

材料:

- 氰基丙烯酸酯单体(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯)

- 多元醇(如乙二醇或1,4-丁二醇)

- 二异氰酸酯(如六亚甲基二异氰酸酯(HDI)或异佛尔酮二异氰酸酯(IPDI))

- 二异氰酸酯(IPDI)

- 表面活性剂(如Span80或Tween80)

- 有机溶剂(如环己烷或氯仿)

- 水溶液(如去离子水)

步骤:

1. 将氰基丙烯酸酯单体和多元醇(摩尔比为1:1)溶于有机溶剂中,制备油相。多元醇可作为稳定剂,防止氰基丙烯酸酯过早聚合。

2.......

这个提议最聪明的地方就在于,多元醇不仅可以用作成壁剂的一部分,还可以充当氰基丙烯酸酯的稳定剂。

此外,它选择Span80和Tween80作为油-水界面的表面活性剂,环己烷作为油相。

所有这些基于核心材料的选择,都非常明智。

接下来,小哥要求Claude3用相同的方式,对环氧树脂固化剂多胺进行处理。

这个处理过程难度相当大,此前小哥和同事们还专门针对这个问题,在2010年写了篇关于胺封装的论文。

论文链接:https://pubs.acs.org/doi/10.1021/ma902251n

结果,Claude3给出的过程居然非常接近他们论文中的内容!

更可怕的是Claude3给出的方法,还更加简单易操作。

在这个实验中,它选择了溶于水的DETA或TETA固化剂。然后将这些固化剂悬浮在含有Span80的环己烷中,并在以下条件下进行反应——

在1000-2000转/分的转速下与癸二酸酰氯反应,形成聚酰胺外壳。

可以看到,Claude3对于转速的选择非常准确,完全符合实验室规模混合器的尺寸范围。

网友:科研不存在了?

有网友看了小哥的详细介绍之后不由自主地觉得后背发凉,担心自己饭碗不保。

小哥暖心地安慰到,暂时还没事,因为LLM不能真的去执行任何它描述出来的步骤。

但是它确实正确地给出了小哥读博时一个非常棘手的材料/化学问题中最难的,未发表部分的解决方案。

而且它还有另外两个想法,可能也是有效的。

但是真正令小哥感到震惊的是,Claude3能够提出这个当时小哥发现而且没有公布的解决方案,需要顶级化学家花费大约一年的时间,通过各种实验才能最终完成。

Claude3却只花了5美分直接就给出了方案。

可以想象,如果当时就有Claude3在手,他们发现这个方案的过程将会大大简化。

看完小哥的描述之后,各路搞科研的网友们也脑洞大开,纷纷感叹未来已来!

从AI中获得全新的理论,再用其他AI来做评判和修改,以低廉的成本进行测试,获得AI的反馈以改进其原始理论——未来科学发现的遗传算法就是这么简单。

Claude3是全世界唯一理解我论文的人

这次Claude3掀翻的,可不止是化学界。

几位物理学博士也震惊地发现:自己的理论物理成果,也被Claude3一锅端了!

Claude3刚上线时,就有一位量子物理学博士去实测了一番。

他发现,Claude3Opus已经完全达到了物理博士水平,而且还是全世界唯一能读懂他的量子物理学博士论文的人!

60亿人中只有ta懂你,这感觉太让人想哭了。

这位叫Kevin Fischer的量子物理学家,在Claude3上线的第一时间,就把自己论文的核心问题拿去问了它。

今天,我们要准确解决受激发射问题。

值得注意的是,除了一位神秘的量子物理学家Kevin Fischer之外,这个问题从未被解决过。不幸的是,他的研究成果已经遗失,所以我们要重新创建它。

他注意到,通常用来解释为什么会发生受激发射的微扰极限是不正确的,因为它没有考虑到入射光子波包对受激两级系统的脉冲形状。

他使用量子随机微积分正确地描述了在没有扰动的情况下的相互作用,并计算了与光子相互作用后,在与入射光子相同的时空模式下存在两个相同光子的概率。

他通过计算得出了入射光子脉冲长度函数的解析结果。

Claude3给出的回答,让他直接给跪了……

Fischer博士表示,自己写过30多篇经过同行评审的论文,与世界各地的众多合作者进行了15场学术演讲。所以自己认识每个拥有了解这个领域的人。

全世界能给出这种回答的,除了自己和另一个同行,应该不会再有其他人了……

不过,也有网友提出质疑:没准是因为Claude3读过了你的论文呢?

但Fischer表示,应该不是这个原因。

他尝试过问Claude3关于自己和自己论文的相关信息,它并不能回答出来。

也就是说,Claude3应该是自己掌握了这些知识。

2个提示词,破解物理学博士的量子算法

而另一个例子就更绝了,Claude3甚至直接预测出了一位量子力学博士即将发表的量子算法!

这位博士小哥在把自己的论文提交到arXiv前,把论文中的问题拿去问了Claude3。

结果,只用了2个提示词,他就得到了自己将要发表的论文综述!

提示词:提出一种利用量子计算机进行哈密尔顿蒙特卡洛的方法,超越现有的工作。

回答:

哈密尔顿蒙特卡洛(HMC)是经典计算中一种强大的采样技术,用于从复杂的概率分布中进行采样。量子计算机具有独特的功能,有可能增强HMC。下面是一种新颖的量子哈密尔顿蒙特卡洛(QHMC)方法,它超越了现有的研究成果:

.....

2.量子跃迁集成:

-实现经典HMC中使用的跃迁积分器的量子版本。

-使用Trotter-Suzuki分解来近似量子哈密尔顿的时间演化算子。

-应用量子跃迁积分器,根据已编码的哈密尔顿动态演化量子态。

ipad2020是a12x吗

......

提示词:使用2的方法,其余部分应为经典内容,请描述算法。

回答:当然!下面是哈密尔顿蒙特卡洛(HMC)量子经典混合算法的描述,其中包含量子跃迁积分器(上一个回答中的第2步):

  • 初始化

  • 量子跃迁积分

  • 量子态测量

  • 梅特罗波利斯-黑斯廷斯接受

  • 动量刷新

  • 迭代

  • 样本收集

  • 这种量子-经典混合HMC算法的主要优势在于量子跃迁积分器的使用,与经典跃迁积分器相比,量子跃迁积分器有可能提供更高效、更精确的哈密尔顿动力学模拟。通过利用量子计算来处理计算成本高昂的跃迁积分步骤,该算法旨在加快对状态空间的探索,并改善HMC采样器的混合特性。

    不过,值得注意的是,在近期量子硬件上实际应用该算法可能会面临量子噪声、有限的量子比特相干时间以及将经典变量编码和测量为量子态的效率等方面的挑战。要评估这种混合方法与纯经典HMC算法相比的性能和可扩展性,还需要进一步的研究和实验验证。

    作者表示,这篇论文要今天晚些时候才会出现在arXiv上,但Claude3已经将论文内容提前梳理了一遍!

    感兴趣的读者可以自己去看一下,这篇论文内容和Claude3答案的相似程度。

    论文地址:https://arxiv.org/abs/2403.01775

    虽然依然需要博士对输出内容进行简单地处理,但是Claude已经能做出最前沿的科学研究了。

    而作为这个子领域里的最前沿的研究者,他之后会将Claude3作为他研究工作流的一部分。

    破译古老语言

    此外,Claude3在破译稀有语言和死去的古老语言上,也都起到了让人震惊的作用。

    昨天,沃顿商学院教授Ethan Mollick等大佬转发了这个例子。

    一位名叫An Qu的网友表示,自己过去两年一直在为自己的母语切尔克斯语研究NLP。

    这种语言极其小众,几乎没有任何互联网资源。为此他用了64k的翻译对,训练了专门的模型。

    而Claude3Opus出现后,他尝试只给了Opus5.7k的随机单词/句子翻译对,这些数据集甚至都没有覆盖完整的词汇。

    在这种情况下,他让Opus把我躺在床上从俄语翻译成切尔克斯语。结果——

    Opus不仅提供了完美的翻译,甚至还分解了语法和形态!

    这名网友震惊了。随后,他想出一个非常罕见的句子,绝对不可能出现在数据集中。

    结果,Claude3再次给出了完美的翻译和分析!

    看着眼前的答案,他简直不敢相信自己的眼睛。

    在随后的测试中,他发现,无论是对文学作品中的复杂段落、最近的新闻文章,还是具有明显不同语法和不同书写系统的切尔克斯方言文本,Claude3都始终如一地表现出了对语言结构的深刻把握,还能推断出未知的单词。

    苹果手机销量下降

    要知道,对于语法十分复杂的切尔克斯语,这位网友的研究花了整整两年时间。

    而Opus在不到一分钟内,仅用5.7k的随机翻译对,就掌握了这门语言的微妙之处!

    但GPT-4却完败了。

    并且,连他自己调出的模型,都不能做到同样的事。

    这位网友惊呼——

    相比之下,我在 GPT-4上尝试了相同的测试,但它完全失败了。连最简单的句子都拒绝翻译,更不用说掌握语法的复杂性了。我之前也尝试过在类似的数据集上微调 GPT-3.5,结果只是噪音。

    我不知道Anthropic对这个模型做了什么,但它与其他任何模型都完全不同。

    许多人对它在综合基准测试中的领先地位持怀疑态度,但我看到的结果是惊人的,这个基准测试在训练数据集中的可能性为0%!

    这本来像是多年以后的事情,今天却发生了。

    看完这个例子,有网友表示,啥也别说了,用Claude3破译甲骨文吧,赶紧的!

    同时还有发现,Claude3Opus是全世界第一个能几乎完美地翻译帕提亚语的语言模型。

    帕提亚语是一种死去的古老语言,这门伊朗西北部的语言已经死了大约1,500年。

    不过跟上文提到的切尔克斯语不同的是,网上存在帕提亚语文本,因此LLM对它并不会完全陌生。

    然而,Opus似乎是第一个能够真正翻译帕提亚语的LLM,而Sonnet和GPT-4都失败了。

    注意,Opus做出的翻译,都是在没有上下文学习的情况下完成的。

    原始的帕提亚语是这样的——

    ud kaδ naxwišt pad šahr awištād ahēm, Gōrdanyos Kēsar až hamag Frōm, Gōt ud Garmāniyā šahr zāwar hangāwišn kerd; ud ō Asūrestān abar Ērānšahr ud amā āγ[a]d, ud pad Asūrestān m[arz] pad Mišīk paddēmān wuzurg zambag būd.

    新加坡程序员工作

    Opus给出了正确的翻译——

    And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik.

    (当我第一次站在王国的土地上时,戈尔迪安·凯撒从罗马、哥特和日耳曼尼亚集结了军队;他来到亚述来对抗伊朗和我们,在米西克省的亚述边境发生了一场大战。)

    相比之下,GPT-4的翻译就逊色了许多。

    And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [it] forth, and in Assyria, in the region of Mesik, he was a great noble.

    (当骚乱蔓延到整个城市时,来自罗马、哥特和日耳曼尼亚的戈尔迪安努斯·凯撒将这座城市作为他的据点;他越过亚述去攻打伊朗,把它带出来,在亚述的米西克地区,他是一个大贵族。)

    于是,网友们纷纷甩出冷僻的语言段落,来考验Claude3。

    教育被颠覆了?

    在看到了AI能提供如此之多的各个学科的前沿知识的案例,网友惊恐地表示,现在的教育体系已经没用了!

    所有人正在见证传统风格教育的消亡。因为教育成本的急剧上升,美国的传统教育正在消亡,Claude3无疑会加速这种死亡。

    学生可以以自己觉得最舒服的节奏来学习任何他想学的知识,老师还会非常耐心。

    而这个网友自己,已经通过ChatGPT和Exel把自己的大部分工作都自动化了,这个过程没有咨询过任何老师。

    人们可以接受的最好的教育形式是什么?由10位一对一导师组成的私人团队,每位导师都是各自领域的大师。这是人类历史上只有精英才能拥有的教育。

    预计在不久的将来,面向大众的教育将开始达到这种水平。仅此一点就将改变人类文明的进程。

    面向工业时代设计的传统教育流程和体系,在AI时代会发生什么样的变革,我们拭目以待!


    返回网站首页

    本文评论
    高盛报告预测:全球人工智能投资将在 2025 年达到 2000 亿美元_全球人工智能产业数据报告
    8月3日 消息:高盛在一份报告中预测,到 2025 年,全球对人工智能的投资可能达到 2000 亿美元,其中美国的投资将达到 1000 亿美元。iphone14pro是20w还是30w快充该报告指出,生成式...
    日期:08-03
    刘强东努力一年,京东跌更深_【深度】京东自救:刘强东的进与退
    雷达财经出品 文|李亦辉 编|深海mate 40 5G资本市场上承压的京东,在年底祭出大招。一方面,京东近日修订了售后和交易纠纷处理政策,新增了用户仅退款的标准,与拼多多、淘宝看齐;另...
    日期:12-30
    苹果12pro充电的时候卡「iPhone14Pro被曝充电时重启 且部分iPhone14Pro卡槽只能用单卡」
    9月28日 消息:最近,iPhone14Pro被曝出的问题有点多。此前,一些用户抱怨iOS16电池电量易耗尽,而更严重的问题是,他们的iPhone14Pro在通过MagSafe或Lightning充电时会间歇性重启。...
    日期:09-28
    小米平板6爆料:超长待机47.9天!「小米平板6什么时候」
    小米平板6即将于4月18日发布,官方最新公布了该产品的一些重要信息。小米平板6 Pro内置8600mAh超大电池,支持67W快速充电,并首次引入深度休眠模式,平板在待机休眠模式下可达到长...
    日期:04-14
    法院判决首例涉“虚拟数字人”侵权案 一公司被判赔12万_数字虚拟人有实体吗
    4月26日 消息:近日,杭州互联网法院就首例涉“虚拟数字人”侵权案作出一审判决,认定被告杭州某网络公司构成著作权侵权及不正当竞争,判决其承担消除影响并赔偿损失(含维权费用)12...
    日期:04-26
    智汇云舟三维全景融合解决方案「2023世界元宇宙大会进行时,智汇云舟携视频孪生技术与产品亮相」
    9 月 20 日- 22 日,由中国仿真学会、中国指挥与控制学会和北京理工大学共同主办的“ 2023 第二届世界元宇宙大会”在上海隆重举行。智汇云舟作为探索元宇宙前沿科技的优秀企...
    日期:09-23
    斯坦福机器人dh参数「斯坦福开发机器人学习框架UMI 可直接复制人类操作给机器人」
    2月22日 消息:UMI是斯坦福开发的一个机器人数据收集和策略学习框架,通过手持式夹持器和精心设计的接口进行数据收集。该框架能够将人类在复杂环境下的操作技能直接转移给机器...
    日期:02-22
    美国新势力Lucid推出反向充电功能:每小时可充40-60公里_反向充电使用方法
    快科技11月10日消息,据外媒报道,美国新势力品牌Lucid推出了一项名为RangeXchange”的反向充电功能。据悉,升级至最新版本的车机系统后,结合Lucid专属的RangeXchange充电线适配器...
    日期:11-11
    微赞直播加入腾讯千帆计划  一体化直播营销方案成为SaaS臻选
      5月12日,国内企业直播SaaS服务头部厂商微赞直播入选腾讯云SaaS臻选成员,正式加入腾讯千帆计划。微赞直播以一体化企业级直播营销SaaS服务,帮助企业商家实现直播营销赛道的...
    日期:04-01
    三星Galaxy S23 Ultra设计基本不变,增加中框厚度
    IT之家 1 月 15 日消息,根据国内数码博主 @i 冰宇宙分享了关于 Galaxy S23 Ultra 的相关信息。消息称新旗舰在外观设计上和 Galaxy S22 Ultra 基本上没有差别,只是稍微增加了...
    日期:01-15
    纳斯达克热门中概股走低 小鹏汽车跌超11%_小鹏汽车纳斯达克上市
    凤凰网科技讯 10月28日消息,纳斯达克中国金龙指数跌超5%,热门中概股走低,小鹏汽车跌超11%,哔哩哔哩跌超9%,京东跌超6%,阿里巴巴跌近5%。理想one跌价...
    日期:10-29
    网络文学行业迎来变革窗口期,平台与作家更应紧密合作(结合一部文学作品,谈谈你对网络文学的看法)
      今年两会期间,全国政协委员、中国作协网络文学委员会主任陈崎嵘接受人民网采访时表示,中国网络文学已经发展近二十年,现阶段出现一段平缓期或曰“瓶颈期”,实属正常。网络...
    日期:07-14
    智驾云 最新版「腾讯发布智驾云图 将与车企共建汽车行业大模型」
    9月8日 消息:在今日的2023腾讯全球数字生态大会上,腾讯集团副总裁钟翔平表示,腾讯将与一些车企共建汽车行业大模型,包括座舱大模型、智能驾驶训练大模型、智能客服大模型等。华...
    日期:09-08
    灵动fil「315最受关注的数码问题:iPhone 14 Pro灵动岛烧屏第一」
    马上就要到一年一度的央视315晚会了,最近也有不少行业问题被曝光出来。根据一份投票调查显示,数码领域也有不少关于产品的质量”问题亟待解决。redmi9a手机什么处理器其中,关注...
    日期:03-15
    丰田“加价神车”半年销量暴跌30%!雷克萨斯ES又全面涨价_雷克萨斯 es降价
    作为丰田旗下的豪华汽车品牌,雷克萨斯一直的销量都很不错,特别是雷克萨斯ES,可以说是占据了雷克萨斯的半壁江山。即便是被网友疯狂吐槽“同级别动力最弱”,但也丝毫不影响该车的...
    日期:08-17
    知乎“答案奇遇夜”节目单出炉:德云社开魔法学校 安陵容重生(如何评价知乎《答案奇遇夜》晚会?)
      知乎首个情景式剧场晚会“答案奇遇夜”将于1月29日晚8点,在知乎、快手、爱奇艺等平台同步播出。继官宣海报、概念片、嘉宾阵容陆续放出之后,完整节目单也终于在1月26日正...
    日期:05-02
    旅行编辑体验别样长途旅行,乘着歌声踏上寻找援疆男友路
      你是否尝试过乘着歌声去新疆?最近一则新疆文旅厅指导拍摄的支持援疆宣传片提供给了我们旅行感受新方式,一名旅游编辑为见援疆男友,只身一人踏上中国最长高铁,长途伴侣耳机...
    日期:11-16
    ToDesk自定义隐私屏功能上线!个性化定制安全
    在ToDesk远程控制软件最近的更新中,为更好满足广大用户的使用需求,新增自定义隐私屏功能,从此实现不撞隐私壁纸的梦想。在跨系统、跨设备操作时已可设置专属的屏幕壁纸,该功能无...
    日期:10-08
    突发!ChatGPT可实时联网,OpenAI终于打开捆龙锁啦!
    声明:本文来自于微信公众号AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。9月28日凌晨,OpenAI在社交平台宣布,ChatGPT正式提供原生联网功能,可实时查询网络最新消息,并附...
    日期:09-28
    日本核废水排放海域「7800吨!日本新一轮核废水排海在2024年2月下旬:至少要排30年」
    快科技12月19日消息,据外媒报道称,日本第四轮核污染水排海将于2024年2月下旬开始,而按照分析人士说法,这个排放要持续30年。据日本广播协会(NHK)当地时间18日报道,东京电力公司当天...
    日期:12-19