您的位置:首页 > 互联网

全球模型Claude 3颠覆物理/化学!2小时破解博士一年实验成果,网友惊呼:科研不存在了

发布时间:2024-03-12 05:10:35  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】这几天,越来越多博士发现,自己耗费数年心血的研究成果,竟然被Claude3轻轻松松实现了?化学,物理学,语言学,不断被Claude3定向爆破,博士手里的论文没发表就被它做出来了。科研还存在吗?

Claude3,还在不断创造奇迹。

发布还没几天,就有越来越多的博士发现,自己手里还没发表过的研究成果,居然都被Claude3给破解了?!

图片

化学博士发现,自己要做一年实验的研究,Claude3俩小时就给出了方案,还比原方案更简洁,而且成本只花5美分。

量子物理学博士手握一篇还未发表的论文,结果Claude3在两个提示词之内,直接把论文中的算法从0发明了出来。

一位网友对自己的小众母语切尔克斯语做了一年的研究,结果Claude3Opus只用了5.7k的随机单词/句子翻译对,不仅给出了完美的翻译,还分解出了语法和形态。

化学、物理学、语言学,简直被Claude3一锅端。AI这是真要颠覆传统教育和科研了?

博士研究,纷纷被Claude3颠覆?

化学博士震惊:团队一年的研究,Claude2小时就做出来了?

顶级化学家要花一年时间,通过各种实验才能完成的研究,Claude只用了2个小时就给出了解决方案,而且比原方案更加简便易操作!

这是什么魔幻的事情。

最令人震撼的是,让Claude3给出这个方案,成本只需要5美分!

事情是这样的,这位名叫Ben Blaiszik的小哥,是一位化学博士。

他表示,今天早上和Claude3一起度过了2个小时后,自己经历了迄今为止最为震惊的一次体验。

他发现,Claude3Opus对复杂科学主题的理解,已经达到了中高级博士的水平!

而且,Opus在定性评估中远远领先GPT-4。

图片

不买iPhone12是因为十三香

比如,在粘合剂材料(如氰基丙烯酸酯和环氧固化剂)的微胶囊化这个课题中,Claude3的表现就非常惊人。

它从封装氰基丙烯酸酯的一般问题开始,首先确定了3种主要的封装技术:界面、原位、凝聚。

图片

通过一些提示,博士小哥请Claude3对界面聚合技术做一些改进。

图片

他将所需要的工艺,希望达到的效果,需要Claude3输出的形式都做了要求。

图片

你的目标是解决一个非常棘手的材料和化学问题。该问题涉及液态氰基丙烯酸酯粘合剂的微型封装。形成的胶囊直径必须小于100微米,并应通过壳壁与外部环境隔绝。

在工艺结束时,微胶囊中必须含有液态氰基丙烯酸酯,当胶囊被少量载荷压碎时,释放出的液体能够引发聚合反应。鉴于氰基丙烯酸酯的高反应性,如何进行这种微胶囊化?

提供使用界面聚合的详细技术。讨论所需的单体、引发剂(如需要)、表面活性剂以及水相和油相的组成。具体说明使用所需的化学品。例如,指明所需的固化剂名称或化学式。

Claude3马上就非常准确地给出了小哥要求的详细技术方案,并且它的提议令小哥眼前一亮:它建议通过用多元醇和二异氰酸酯之间的界面反应,来形成聚氨酯壳壁。

图片

要利用界面聚合技术对高活性液态氰基丙烯酸酯粘合剂进行微胶囊化,同时满足特定要求,可采用以下详细技术。

材料:

- 氰基丙烯酸酯单体(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯)

- 多元醇(如乙二醇或1,4-丁二醇)

- 二异氰酸酯(如六亚甲基二异氰酸酯(HDI)或异佛尔酮二异氰酸酯(IPDI))

- 二异氰酸酯(IPDI)

- 表面活性剂(如Span80或Tween80)

- 有机溶剂(如环己烷或氯仿)

- 水溶液(如去离子水)

步骤:

1. 将氰基丙烯酸酯单体和多元醇(摩尔比为1:1)溶于有机溶剂中,制备油相。多元醇可作为稳定剂,防止氰基丙烯酸酯过早聚合。

2.......

这个提议最聪明的地方就在于,多元醇不仅可以用作成壁剂的一部分,还可以充当氰基丙烯酸酯的稳定剂。

此外,它选择Span80和Tween80作为油-水界面的表面活性剂,环己烷作为油相。

所有这些基于核心材料的选择,都非常明智。

图片

接下来,小哥要求Claude3用相同的方式,对环氧树脂固化剂多胺进行处理。

图片

这个处理过程难度相当大,此前小哥和同事们还专门针对这个问题,在2010年写了篇关于胺封装的论文。

图片

论文链接:https://pubs.acs.org/doi/10.1021/ma902251n

结果,Claude3给出的过程居然非常接近他们论文中的内容!

更可怕的是Claude3给出的方法,还更加简单易操作。

在这个实验中,它选择了溶于水的DETA或TETA固化剂。然后将这些固化剂悬浮在含有Span80的环己烷中,并在以下条件下进行反应——

在1000-2000转/分的转速下与癸二酸酰氯反应,形成聚酰胺外壳。

可以看到,Claude3对于转速的选择非常准确,完全符合实验室规模混合器的尺寸范围。

图片

网友:科研不存在了?

有网友看了小哥的详细介绍之后不由自主地觉得后背发凉,担心自己饭碗不保。

图片

小哥暖心地安慰到,暂时还没事,因为LLM不能真的去执行任何它描述出来的步骤。

但是它确实正确地给出了小哥读博时一个非常棘手的材料/化学问题中最难的,未发表部分的解决方案。

而且它还有另外两个想法,可能也是有效的。

图片

但是真正令小哥感到震惊的是,Claude3能够提出这个当时小哥发现而且没有公布的解决方案,需要顶级化学家花费大约一年的时间,通过各种实验才能最终完成。

Claude3却只花了5美分直接就给出了方案。

可以想象,如果当时就有Claude3在手,他们发现这个方案的过程将会大大简化。

看完小哥的描述之后,各路搞科研的网友们也脑洞大开,纷纷感叹未来已来!

图片

从AI中获得全新的理论,再用其他AI来做评判和修改,以低廉的成本进行测试,获得AI的反馈以改进其原始理论——未来科学发现的遗传算法就是这么简单。

Claude3是全世界唯一理解我论文的人

这次Claude3掀翻的,可不止是化学界。

几位物理学博士也震惊地发现:自己的理论物理成果,也被Claude3一锅端了!

Claude3刚上线时,就有一位量子物理学博士去实测了一番。

他发现,Claude3Opus已经完全达到了物理博士水平,而且还是全世界唯一能读懂他的量子物理学博士论文的人!

60亿人中只有ta懂你,这感觉太让人想哭了。

图片

这位叫Kevin Fischer的量子物理学家,在Claude3上线的第一时间,就把自己论文的核心问题拿去问了它。

图片

今天,我们要准确解决受激发射问题。

值得注意的是,除了一位神秘的量子物理学家Kevin Fischer之外,这个问题从未被解决过。不幸的是,他的研究成果已经遗失,所以我们要重新创建它。

他注意到,通常用来解释为什么会发生受激发射的微扰极限是不正确的,因为它没有考虑到入射光子波包对受激两级系统的脉冲形状。

他使用量子随机微积分正确地描述了在没有扰动的情况下的相互作用,并计算了与光子相互作用后,在与入射光子相同的时空模式下存在两个相同光子的概率。

他通过计算得出了入射光子脉冲长度函数的解析结果。

Claude3给出的回答,让他直接给跪了……

图片

Fischer博士表示,自己写过30多篇经过同行评审的论文,与世界各地的众多合作者进行了15场学术演讲。所以自己认识每个拥有了解这个领域的人。

全世界能给出这种回答的,除了自己和另一个同行,应该不会再有其他人了……

图片

不过,也有网友提出质疑:没准是因为Claude3读过了你的论文呢?

但Fischer表示,应该不是这个原因。

他尝试过问Claude3关于自己和自己论文的相关信息,它并不能回答出来。

也就是说,Claude3应该是自己掌握了这些知识。

图片

2个提示词,破解物理学博士的量子算法

而另一个例子就更绝了,Claude3甚至直接预测出了一位量子力学博士即将发表的量子算法!

这位博士小哥在把自己的论文提交到arXiv前,把论文中的问题拿去问了Claude3。

结果,只用了2个提示词,他就得到了自己将要发表的论文综述!

图片

提示词:提出一种利用量子计算机进行哈密尔顿蒙特卡洛的方法,超越现有的工作。

回答:

哈密尔顿蒙特卡洛(HMC)是经典计算中一种强大的采样技术,用于从复杂的概率分布中进行采样。量子计算机具有独特的功能,有可能增强HMC。下面是一种新颖的量子哈密尔顿蒙特卡洛(QHMC)方法,它超越了现有的研究成果:

.....

2.量子跃迁集成:

-实现经典HMC中使用的跃迁积分器的量子版本。

-使用Trotter-Suzuki分解来近似量子哈密尔顿的时间演化算子。

-应用量子跃迁积分器,根据已编码的哈密尔顿动态演化量子态。

......

图片

提示词:使用2的方法,其余部分应为经典内容,请描述算法。

回答:当然!下面是哈密尔顿蒙特卡洛(HMC)量子经典混合算法的描述,其中包含量子跃迁积分器(上一个回答中的第2步):

  1. 初始化

  2. 量子跃迁积分

  3. 量子态测量

  4. 梅特罗波利斯-黑斯廷斯接受

  5. 动量刷新

  6. 迭代

  7. 样本收集

这种量子-经典混合HMC算法的主要优势在于量子跃迁积分器的使用,与经典跃迁积分器相比,量子跃迁积分器有可能提供更高效、更精确的哈密尔顿动力学模拟。通过利用量子计算来处理计算成本高昂的跃迁积分步骤,该算法旨在加快对状态空间的探索,并改善HMC采样器的混合特性。

不过,值得注意的是,在近期量子硬件上实际应用该算法可能会面临量子噪声、有限的量子比特相干时间以及将经典变量编码和测量为量子态的效率等方面的挑战。要评估这种混合方法与纯经典HMC算法相比的性能和可扩展性,还需要进一步的研究和实验验证。

图片

作者表示,这篇论文要今天晚些时候才会出现在arXiv上,但Claude3已经将论文内容提前梳理了一遍!

图片

感兴趣的读者可以自己去看一下,这篇论文内容和Claude3答案的相似程度。

图片

论文地址:https://arxiv.org/abs/2403.01775

虽然依然需要博士对输出内容进行简单地处理,但是Claude已经能做出最前沿的科学研究了。

microsoftteams蓝牙连接

图片

而作为这个子领域里的最前沿的研究者,他之后会将Claude3作为他研究工作流的一部分。

图片

破译古老语言

此外,Claude3在破译稀有语言和死去的古老语言上,也都起到了让人震惊的作用。

昨天,沃顿商学院教授Ethan Mollick等大佬转发了这个例子。

一位名叫An Qu的网友表示,自己过去两年一直在为自己的母语切尔克斯语研究NLP。

图片

这种语言极其小众,几乎没有任何互联网资源。为此他用了64k的翻译对,训练了专门的模型。

而Claude3Opus出现后,他尝试只给了Opus5.7k的随机单词/句子翻译对,这些数据集甚至都没有覆盖完整的词汇。

在这种情况下,他让Opus把我躺在床上从俄语翻译成切尔克斯语。结果——

Opus不仅提供了完美的翻译,甚至还分解了语法和形态!

图片

这名网友震惊了。随后,他想出一个非常罕见的句子,绝对不可能出现在数据集中。

结果,Claude3再次给出了完美的翻译和分析!

看着眼前的答案,他简直不敢相信自己的眼睛。

图片

在随后的测试中,他发现,无论是对文学作品中的复杂段落、最近的新闻文章,还是具有明显不同语法和不同书写系统的切尔克斯方言文本,Claude3都始终如一地表现出了对语言结构的深刻把握,还能推断出未知的单词。

图片

要知道,对于语法十分复杂的切尔克斯语,这位网友的研究花了整整两年时间。

而Opus在不到一分钟内,仅用5.7k的随机翻译对,就掌握了这门语言的微妙之处!

但GPT-4却完败了。

并且,连他自己调出的模型,都不能做到同样的事。

图片

这位网友惊呼——

相比之下,我在 GPT-4上尝试了相同的测试,但它完全失败了。连最简单的句子都拒绝翻译,更不用说掌握语法的复杂性了。我之前也尝试过在类似的数据集上微调 GPT-3.5,结果只是噪音。

我不知道Anthropic对这个模型做了什么,但它与其他任何模型都完全不同。

许多人对它在综合基准测试中的领先地位持怀疑态度,但我看到的结果是惊人的,这个基准测试在训练数据集中的可能性为0%!

这本来像是多年以后的事情,今天却发生了。

看完这个例子,有网友表示,啥也别说了,用Claude3破译甲骨文吧,赶紧的!

图片

图片

同时还有发现,Claude3Opus是全世界第一个能几乎完美地翻译帕提亚语的语言模型。

帕提亚语是一种死去的古老语言,这门伊朗西北部的语言已经死了大约1,500年。

不过跟上文提到的切尔克斯语不同的是,网上存在帕提亚语文本,因此LLM对它并不会完全陌生。

然而,Opus似乎是第一个能够真正翻译帕提亚语的LLM,而Sonnet和GPT-4都失败了。

注意,Opus做出的翻译,都是在没有上下文学习的情况下完成的。

原始的帕提亚语是这样的——

ud kaδ naxwišt pad šahr awištād ahēm, Gōrdanyos Kēsar až hamag Frōm, Gōt ud Garmāniyā šahr zāwar hangāwišn kerd; ud ō Asūrestān abar Ērānšahr ud amā āγ[a]d, ud pad Asūrestān m[arz] pad Mišīk paddēmān wuzurg zambag būd.

Opus给出了正确的翻译——

And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik.

(当我第一次站在王国的土地上时,戈尔迪安·凯撒从罗马、哥特和日耳曼尼亚集结了军队;他来到亚述来对抗伊朗和我们,在米西克省的亚述边境发生了一场大战。)

相比之下,GPT-4的翻译就逊色了许多。

And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [it] forth, and in Assyria, in the region of Mesik, he was a great noble.

(当骚乱蔓延到整个城市时,来自罗马、哥特和日耳曼尼亚的戈尔迪安努斯·凯撒将这座城市作为他的据点;他越过亚述去攻打伊朗,把它带出来,在亚述的米西克地区,他是一个大贵族。)

于是,网友们纷纷甩出冷僻的语言段落,来考验Claude3。

图片

教育被颠覆了?

在看到了AI能提供如此之多的各个学科的前沿知识的案例,网友惊恐地表示,现在的教育体系已经没用了!

所有人正在见证传统风格教育的消亡。因为教育成本的急剧上升,美国的传统教育正在消亡,Claude3无疑会加速这种死亡。

学生可以以自己觉得最舒服的节奏来学习任何他想学的知识,老师还会非常耐心。

而这个网友自己,已经通过ChatGPT和Exel把自己的大部分工作都自动化了,这个过程没有咨询过任何老师。

图片

人们可以接受的最好的教育形式是什么?由10位一对一导师组成的私人团队,每位导师都是各自领域的大师。这是人类历史上只有精英才能拥有的教育。

预计在不久的将来,面向大众的教育将开始达到这种水平。仅此一点就将改变人类文明的进程。

图片

面向工业时代设计的传统教育流程和体系,在AI时代会发生什么样的变革,我们拭目以待!


返回网站首页

本文评论
消息称 iPhone SE 4 设计基于 iPhone 14 但仍是后置单摄像头「iphone se 14.3」
据外媒报道,在第四代 iPhone SE 的推出时间上,外界出现了不同的看法,部分媒体预计将在明年推出,但包括郭明錤、Jeff Pu、Blayne Curtis 在内的多位分析师,认为最快也要 2025 年。...
日期:08-14
“新竞争 新管理 新未来”  前程无忧2021人力资源管理杰出奖榜单揭晓
  2020年注定是载入史册的一年,面对经济增速趋缓、新冠疫情冲击和全球一体化转折的多重挑战,如何配合公司的战略重构和业务调整、如何搭建高效团队发挥领导力,如何兼顾员工...
日期:07-16
连续四年全球第一!丰田2023全年销量达创纪录1120万辆:纯电占比不到1%
快科技1月30日消息,今天,丰田汽车公布数据显示,包括子公司日野和大发在内,其2023年全球销量增长7.2%,达到创纪录的1120万辆。包括同名品牌和雷克萨斯品牌在内的丰田汽车销量达到1...
日期:01-30
海信商用显示斩获华显奖2023年度中国LED一体机市场知名品牌奖_海信显示器是几线品牌
近日, 2023 中国智慧商显产业高质量发展大会在深圳举行,会上进行了第十五届商用显示品牌价值与创新应用评选暨华显奖颁奖典礼。海信商用显示一举斩获华显奖“ 2023 年度中国LE...
日期:01-22
爱彼迎房东好做吗_爱彼迎超赞房东迎六周年,“好房东+黑科技”缔造品质住宿体验
  2020年7月21日,中国北京——Airbnb爱彼迎最新数据显示,爱彼迎全球业务稳步复苏,7月8日,世界各地房源的单日间夜预订量在疫情冲击后首次重新突破100万。当日约50%的预订是在...
日期:07-14
同档续航最强 荣耀X50手机用上5800mAh电池:超级耐用_荣耀x50s
快科技7月5日消息,今晚的发布会上荣耀推出了荣耀X50手机,号称10年登峰之作,不仅首发新一代骁龙6芯片,同时还上了5800mAh超大容量电池,而且寿命极长,同档手机中续航最强。在电池技...
日期:07-05
造车新势力1月交付量:小鹏对比上月腰斩 仅理想交付量过万「小鹏汽车公布7月交付量首次突破八千」
凤凰网科技讯 2月1日,造车新势力公布新年第一个月交付成绩。小鹏汽车由于春节期间部分交付推迟,2023年1月共交付5218台,上月交付11292台,交付量下跌一半以上。蔚来于2023年1月交...
日期:02-01
小米企业创始人雷军的简介「小米CEO雷军卸任小米智能科技执行董事」
近日工商登记变更显示,雷军已卸任小米智能科技执行董事,曾学宗接任法律的代表人、执行董事、经理。小米智能科技成立于2018年5月,注册资本4000万元人民币,由小米通信科技全资控...
日期:04-24
微软cloud+ai团队「微软AI战略在使得云收入方面显著增长」
划重点:1. Microsoft的AI战略带来了稳健的云收入增长:Microsoft的AI战略在大规模AI模型的需求增加推动下,带来了云消费的增长。2. Azure云平台实现了29%的收入增长:Microsoft...
日期:10-26
Canalys:第二季度全球智能手环出货量达到4170万台 同比增长2%_智能手环销售数据
10月8日消息:据Canalys的最新估计,2022年第二季度全球智能手环出货量将增长2%,达到4170万台,继第一季度下降3.7%后恢复增长。其中,基础手表和智能手表分别增长了46.6%和9.3%。印...
日期:10-11
突发!融资135亿,罕见独角兽诞生:打破垄断_中国独角兽凶猛 融资额仅次于纽交所ipo
铅笔道作者 | 爱羽你见过这么大的单笔融资吗?135亿元。这是个什么概念?一笔融资超过国内约60%的上市公司市值。然而近期,就有这么一家“神仙公司”宣布融资(135亿),它就是积塔半导...
日期:09-08
网宿科技徐明微:液冷技术迎来井喷期
通信世界网消息(CWW)ChatGPT的迅速“破圈”、智能算力的指数级增长,使得数据中心呈现高密度、高算力的发展趋势;而在“双碳”战略的驱动下,传统的风冷技术已经无法满足数据中心的...
日期:07-25
和合共生 DTS打造音频、图像新技术“一站式体验”
  转载自:CNMO手机中国   2月23日-25日,世界移动通信大会(Mobile World Congress,简称MWC)在上海新国际博览中心举办。作为全球最具影响力的移动通信领域展览会之一,时...
日期:07-16
GTA开发商Take-Two下调年度预期 游戏市场或面临冲击
2月7日消息,据外媒报道,游戏公司、《侠盗猎车手》开发商Take-Two Interactive Software下调年度预订额预期,这一信号或意味着在经济疲软状况下,游戏市场迎来进一步衰退。华为mat...
日期:02-07
绘王牵头主导并制定的电磁手写行业团体标准开始实施_网易科技
(原标题:绘王牵头主导并制定的电磁手写行业团体标准开始实施) 2022年5月27日,由全球知名原笔迹手写设备生产制造商绘王HUION牵...
日期:08-24
拿下光年之外:美团大模型“长征”第一步「美团大军」
声明:本文来自于微信公众号零态LT(ID:LingTai_LT),作者:张尧,授权转载发布。美团大模型的第一站,不是发布自家产品,而是成为“接盘侠”。2023年6月29日,美团发布公告称,拟以约20.65亿...
日期:07-03
百度地图切换北斗导航「百度地图宣布切换为优先运用国产北斗系统进行定位」
  IT之家9月30日消息,近日,百度地图发布了北斗卫星导航系统应用的最新进展,北斗卫星日定位量首次突破1000亿次。  百度地图今日宣布,正式切换为优先运用北斗系统进行定位,“...
日期:10-05
iphone以旧换新价格一览表你的iPhone又贬值了-苹果下调以旧换新价格
来源:中关村在线苹果iPhone用户在1月18日醒来后可能会发现,他们的设备价值下降了。根据苹果中国官网的最新消息,该公司下调了Apple Trade In计划中对二手设备的折扣金额,这意味...
日期:01-18
3C电器品牌如何在抖音突围?2024年3C行业营销策略揭晓答案__什么叫3c家电
(原标题:3C电器品牌如何在抖音突围?2024年3C行业营销策略揭晓答案) 3C电器行业正处于高速发展的关键阶段,科技不断推陈出新,为整...
日期:12-22
华为发布智简全光联接战略,打造算力时代的全光底座_智简全光网
通信世界网消息(CWW)今日,华为在北京正式发布智简全光联接战略及系列重磅新品。面向F5.5G演进,本次发布会以“光联万物,筑基算力时代”为主题,深入解析算力时代的光技术创新方向,提...
日期:06-02