您的位置:首页 > 互联网

AI颠覆数学研究!陶哲轩借AI破解数学猜想,形式化成功惊呆数学圈

发布时间:2023-12-07 00:43:14  来源:互联网     背景:

声明:本文来自于微信公众号新智元(ID:AI_era),作者:新智元,授权转载发布。

历时三周,陶哲轩成功地用AI工具完成了形式化多项式Freiman-Ruzsa猜想证明过程的工作。他再次呼吁数学研究者学会正确利用AI工具,网友惊呼:以后的数学论文不需要人类可读了?

用AI工具辅助研究数学的项目,再一次被陶哲轩跑通!

三周前,他曾发布一篇博文,记录下自己使用Blueprint在Lean4中形式化多项式Freiman-Ruzsa猜想的证明过程。

就在昨天,他激动宣布:将多项式Freiman-Ruzsa猜想的证明形式化的Lean4项目,在三周后取得了成功!

小米雷军新浪微博主页

现在,依赖关系图已经完全被绿色所覆盖,Lean编译器也报告说,这个猜想完全遵循标准公理。

陶哲轩表示,在整个团队中,自己贡献的代码大概只有5%。这个结果很鼓舞人心,因为这意味着数学家即使不具备Lean编程技能,也能领导Lean的形式化项目。

他发现,项目中在数学上最有趣的部分,形式化起来比较容易,而技术上看起来最显而易见的步骤,却最耗时。

而使用Blueprint将项目分解成难度小到中等的部分,效果很好,这就让大量并行工作成为可能。

这样,许多贡献者就可以处理特定的子任务,而无需理解整个证明过程,甚至可以完全不了解相关的数学领域知识。

就在几分钟前,Lean成功证明了PFR猜想,且没有留下任何悬而未决的问题(后文将会提到的sorry)。这意味着,这个项目的所有主要目标,都已经圆满完成。

与此同时,他在三周前也就是11月18日的那篇博客也被网友翻出,引发热议。

果然,AI加持数学研究颠覆力量的后劲,得需要数月的时间才能让人们认识到。

而只有在最前线的研究者,才能在第一时间切实感觉到这种巨大力量的冲击和震撼。

陶哲轩呼吁:数学家们一定要学会用AI了

有网友向陶哲轩提问:这是否意味着,有越来越多的证明是人类不可理解,但机器可解决的?

陶哲轩表示,恰恰相反,如果证明的形式化变得更加主流,并且更多地得到AI辅助,那完全有可能创建出既人类可读、又能被机器阅读的证明。

PFR证明的blueprint就证明了这一点——既人类可读,每个证明步骤还带有形式化的理由,还能得到一个依赖关系图,来可视化整个论证的全局结构。

当然,陶哲轩也提醒道,不要把计算机辅助证明和不能提供理解/偶然成立的证明搞混了。

比如对于有限单群分类的超过10000页的证明,几乎百分百是由人工生成的,但一个由计算机协助处理的替代证明,在某些方面看更令人满意。

跟网友经过几轮讨论后,陶哲轩做出以下总结——

Blueprint本身就是一种编程语言,可以看作一种Lean的伪代码。

许多数学家都应该将写作风格从标准数学英语/LaTex,转换为Blueprint/LaTex。

网友:以后研究都不需要人类可读,AI懂就行了

网友表示,陶哲轩对于各种研究工具随意掌握的程度,几乎可以称得上是可怕。

我在研究生阶段对数学的尝试,就就好像一个穴居人本来在摇晃一辆普通的独轮车,忽然眼前出现了一辆直升机,上面的人向我伸出手,告诉我来试试看,一点也不可怕。

自从听说四色定理以来,我一直很清楚,形式化是数学的未来。但我没有预料到的是,陶哲轩如此从容不迫,形式化才刚刚获得牵引力,他就能用AI完成几乎所有的数学写作。

形式化,是指从基本公理和规则中真正推导出证明中的每个陈述。而陶哲轩在这篇博文里,把需要死记硬背的劳动都抽象出来,交给了机器。

他的工作表明,形式化才刚刚开始在主流数学中受到关注。

已经有人开始畅想:很可能会有一段时间,大多数证明只是在Lean或类似系统中完成,再也没有人需要费心写一篇人类可读的论文了。

数学,将变成一种编程!

一位数学硕士表示,现在自己的研究步骤有三步——

1.理解自己想证明的东西,通过阅读或者与人交谈;

2.用纸笔绘制出包含要点的草图;

3.将校样输入到LaTeX中,让自己要交的作业变得人类可读。

是的,如果我们只是要训练或微调AI来产生答案,然后编写一个循环来反馈,直到编译器正确输出,那我们自己并不需要真的理解。

用这种方法,我们还能生成更多的训练示例,可以手动检查结果是否符合要求,做上注释。而训练,可以提高初始答案的准确性。

PFR猜想的形式化过程

以下是陶哲轩发在博客上的形式化过程,感兴趣的读者可以挑战一下。

11月,陶哲轩与Yael Dillies和Bhavik Mehta启动了一个合作项目,目的是利用Lean4对自己之前关于Freiman-Ruzsa(PFR)猜想的预印本论文进行形式化。

项目虽然启动不到一周,但进展相当顺利,大部分文件都被形式化了。

这个项目得益于Patrick Massot的Blueprint工具,这个工具让团队能够编写与Lean形式化紧密相关的、人类可读的证明蓝图。

在Blueprint中,有一个陶哲轩特别喜欢的功能,那就是自动生成的依赖图。它可以提供形式化进度的大致快照。截至当时,依赖图的样子如下:

在依赖图的图例中,不同的气泡(表示引理)和矩形(表示定义)被赋予了不同的颜色。

简单来说,绿色的气泡或矩形表示那些已经被完全形式化的引理或定义,而蓝色的则指那些已准备好进行形式化的引理或定义(这意味着它们的陈述已经形式化,但证明还没有,同时所有相关的前置引理和证明也是如此)。

而陶哲轩团队的目标,就是将所有通向pfr气泡的底部气泡,都变成绿色。

点击依赖图底部的pfr气泡时,可以看到以下内容:

图中,Blueprint显示出一种人类可读的PFR语句形式,还附带了这个语句的人类可读证明,该证明依赖于项目中的其他语句:

注意,pfr气泡是白色的,但有一个绿色边框,这意味着PFR的陈述已经在Lean中正式化,然而证明并没有。

证明本身还没有准备好被形式化,是因为一些先决条件(特别是entropy-pfrTheorem6.16)甚至还没有形式化的陈述。

单击依赖关系图中PFR陈述下方的Lean链接,就可以进入相应的Lean文档:

这就是Lean中的典型定理的样子。在冒号之前有许多假设,例如:

G是一个属于顺序2的有限初等阿贝尔群(这就是团队选择形式化有限场向量空间的方式);A是G的非空子集;A+A的基数<k倍a的基数。< p="">

冒号后边的陈述是结论:A可以以c+H的和的形式包含在G的子群H中,以及在最多

的基数的集合c中。

聪明的读者可能会注意到,上面的定理似乎缺少一两个细节,例如,它没有明确断言H是一个子群。

这是因为pretty printing模式抑制了定理陈述中的一些信息,只要单击来源链接,就可以看到了。

可以看到,H需要具有G加法子群的类型。

该定理底部有一个明显的sorry,这意味着尚未为该定理提供证明,但最终意图当然是用实际证明,来代替这个sorry。

填补这个sorry现在还很难做到,所以需要寻找一个更简单的任务。

下面是一个简单的中间引理ruzsa-nonneg,它出现在证明中:

该表达式

指的是X和Y之间的熵Ruzsa距离,它是一个实数。

气泡是蓝色的,带有绿色边框,这意味着陈述已经形式化,证明也准备好形式化了。

Blueprint依赖关系图表明,这个引理可以从前面的一个引理中推导出来,称为ruzsa-diff:

uzsa-diff也是蓝色的,边框是绿色的,所以它与ruzsa-nonneg具有相同的当前状态:陈述是形式化的,证明也准备好形式化了,但证明还没有用Lean编写。其中,

是X的香农熵。

通过观察Lemma3.11和Lemma3.13,我们可以清楚地看到|H[X] - H[Y]|显然是非负的。

因此,即使我们还不知道如何证明Lemma3.11,但假设Lemma3.11成立,并补全Lemma3.13的证明,应该是轻而易举的事。

Lemma3.11的形式化如下:(sorry表示Lemma目前还没有证明)

同时,Lemma3.13的形式化为:

现在,我们要试着把后一个sorry填上。

在PFR github仓库的本地副本中,陶哲轩用编辑器(Visual Studio Code,扩展名为lean4)打开了相关的Lean文件,并导航到rdist_nonneg的sorry处。

随附的Lean信息视图就会显示Lean证明的当前状态:

在底部,可以看到我们需要证明的目标。

接下来,在证明这个说法时,需要运用一系列战术来改变目标和/或假设。

第一步是加入应用Lemma3.11所需的因子2。

现在,我们有了两个目标(和两个sorry):一个是证明

等价于

;另一个是证明

在填上第一个sorry之后的状态如下(删去了一些无关的假设):

这里可以使用一种非常方便的linarith策略,它能解决任何可以通过现有假设的线性运算得出的目标:

成功之后可以看到,状态报告显示这个分支已经没有需要证明的目标了。所以,我们继续剩下的sorry,也就是证明

:

在这里,我们将尝试引用Lemma3.11。为此,陶哲轩添加了几行代码:

于是,我们又有了两个子目标,一个是证明约束

(可以称之为h),另一个是就从h推导出前一个目标

对于第一个目标,需要调用正在编码Lemma3.11的diff_ent_le_rdist引理。

其中一种方法是尝试使用exact? 策略,它会自动搜索,看目标是否可以立即从现有的引理中推导出来:

于是,陶哲轩点击了建议的代码(系统会自动将其粘贴到正确的位置)。结果成功了,只留下最后的sorry:

这里,陶哲轩通用使用了exact?策略,并按照它的建议建立匹配了边界

:

在补全最后一个sorry时,陶哲轩再一次尝试了exact?,想知道如何把h和h'结合起来才能达到预期目标,结果成功了!

可以看到,所有的下划线都消失了。也就是说,Lean已将其视为有效证明。

通过省略几个中间步骤,我们可以将这个证明压缩得相当紧凑:

现在证明完成了!

我们最后得到的,基本就是一个单线证明,考虑到Lemma3.11和Lemma3.13是如此接近,这也是合情合理的。

然后,陶哲轩将所有内容推送回Github主版本库。

Blueprint的重建需要相当长的时间(约半小时),依赖关系图现在以绿色显示 ruzsa-nonneg:

因此可以说,PFR的形式化更接近完成了。

不过,虽然ruzsa-nonneg现在被涂成绿色,但还没有这个结果的完整证据,因为它所依赖的引理ruzsa-diff不是绿色的。

从这一点上看,证明仍然是局部完成的。

陶哲轩表示,希望在未来的某个时候,前身结果也能被证明,那时,就可以说PFR猜想的结果,得到了完全的证明。

参考资料:

https://news.ycombinator.com/item?id=38528582

https://terrytao.wordpress.com/2023/11/18/formalizing-the-proof-of-pfr-in-lean4-using-blueprint-a-short-tour/


返回网站首页

本文评论
马志强:五大特色打造青云SD-WAN产品核心优势
7月27日,Cloud Insight Conference 2018云计算峰会在北京举行。青云QingCloud宣布全面战略升级,打......
日期:09-25
支付宝集五福在哪里扫福字「2023年支付宝集五福最全攻略 扫这些福字3分钟集齐五福」
1月10日凌晨,2023年支付宝集五福活动正式拉开帷幕。从当日00:00至1月21日22:00,只要集齐五福,就可在21日22:18拼手气分享5亿现金红包。截止目前,已有376万人完成此任务,迅速如火...
日期:01-12
新晋AIGC独角兽!英国AI初创公司Synthesia估值达10亿美元
6月14日 消息:据最新消息,合成媒体的人工智能平台Synthesia已经筹集了9000万美元,使其估值达到10亿美元。本轮融资由Accel领投,包括Nvidia和其他投资者,如Kleiner Perkins,GV,Firs...
日期:06-14
毫米波5G速度_不仅支持毫米波,网速还拿下全球第一!联发科M80 5G 基带来了
  近日,联发科正式发布了第二代5G基带M80,相较于上一代的M70,加入了对毫米波技术的支持,完整支持了毫米波(mmWave)和Sub-6GHz两种5G频段。M80基带在5G网速表现上也相当给力,最...
日期:07-16
南京大学才女瞒着家里当主播 竟发现榜一大哥是自己爸爸「南京大学男神」
6月19日消息,昨天是父亲节,直播领域也出现了一件关于父爱的小插曲,非常应景。apple tv为啥不在中国发布据报道,南京大学才女鲁韦彤是新起步的小主播,直播间的榜一大哥不断与她积...
日期:06-19
吉利CEO:不会跟风“彩电、冰箱、按摩椅”  网友:建议试驾理想
近日,吉利汽车集团CEO淦家阅在新春寄语中表示,造车的表面功夫”做足比较容易,但吉利认为只有更多在看不见的地方”长期创新,挑战极限,才能造出用户真正需要的好车。淦家阅表示,汽...
日期:01-29
再次领跑! 杭州移动5G分流比突破70%_杭州移动流量套餐介绍
通信世界网消息(CWW)激情的盛会,欢乐的海洋。10月8日,当数字人“弄潮儿”熄灭火炬,踏浪而去,为期16天的杭州亚运会圆满落下帷幕,在一片意犹未尽的感叹与欢呼声中,现场数万人同时举起...
日期:10-15
苹果应用商店不好使了怎么办「iPhone又中招!苹果App Store应用商店崩了:重启也没用」
快科技4月27日消息,前不久,国内iPhone用户遇到了苹果自带天气App崩溃,问题主要是数据不更新、天气小组件无数据Bug等,且天气App崩溃多次,影响用户日常使用。今日,又有不少iPhone用...
日期:04-27
华为P60系列发布时间定了 影像大升级「华为发布P60系列」
中关村在线消息:今日微博博主曝光了华为P60系列的相关消息,据悉新机将会采用经典的万象双环设计,并且在影像性能方面进行大幅升级,准备升级大底传感器。据悉华为P60系列的发布时...
日期:10-15
交通运输部:加快推进网约车合规化,开展平台抽成“阳光行动”
  1 月 28 日消息,据交通运输部微信公众号消息,1 月 27 日,交通运输新业态协同监管部际联席会议召开 2022 年第一次全体会议,总结 2021 年工作情况,研究部署 2022 年工作安排...
日期:07-17
AI遭“围剿”!欧洲、中国之后,美国考虑对ChatGPT等工具进行审查
(原标题:AI遭“围剿”!欧洲、中国之后,美国考虑对ChatGPT等工具进行审查,OpenAI、微软、谷歌积极回应) 每经记者 蔡鼎 每经编辑 高...
日期:04-11
贾跃亭又交车!全球最大美国万圣节服装供应商集团创始人喜提FF 91
快科技10月1日消息,贾跃亭又交车了,这也是自该车量产以来交付的第四辆新车。据法拉第未来官方,就在今日,FF向FFIE长期投资人、全球最大的美国万圣节服装供应商的集团创始人交付...
日期:10-01
中国铁路每年盈利多少「中国国家铁路9个月净利润121亿:创两大惊人纪录」
中国国家铁路集团有限公司披露,前三季度整体经营结果好于预期,实现营业总收入9080亿元,同比增加1258亿元,增幅为16.1%,其中运输总收入完成7317亿元,同比增加2002亿元,增幅为37.7%。fa...
日期:11-01
特斯拉总裁马斯克人工智能「特斯拉前 AI 高级总监宣布回归马斯克创立的 OpenAI」
2月9日消息:特斯拉前AI高级总监Andrej Karpathy在推特上发文表示,自己将再次加入OpenAI。这是一家最初由特斯拉CEO马斯鹕共同创立的人工智能初创公司。Karpathy称,「我将再一...
日期:02-09
市监局回应12.4万保时捷遭抢购后下架:规模较大 正加紧调查_保时捷断货
只需12万出头就能买到价值百万元的保时捷Panamera(帕拉梅拉),你信吗?近日,一则百万保时捷卖12.4万被抢购下架的消息引起网络关注。对此,银川市场监管局工作人员今日表示,已获悉此事...
日期:02-01
驾特斯拉Model X车祸后 林志颖露面:已恢复状态「特斯拉Model Y的实车上路了」
今天中午,林志颖发文几年自己的48岁生日,今年也刚好是他本人出道30周年,同时还晒出了自己今天切蛋糕的照片。第四届数字中国建设峰会设立平台这是自从7月22日车祸以来,林志颖首...
日期:10-18
智能音箱声渐默「智能音箱互动」
声明:本文来自于微信公众号“光子星球”(ID:TMTweb),作者:熊 星,编辑:吴先之,授权转载发布。无论有屏无屏,智能音箱的2022年注定要在寒冬中结束了。IDC数据显示,2022年上半年中国智...
日期:01-07
雅虎出售传闻满天飞 巴茨被炒引发高层地震
  一份来自ipad的邮件揭开了雅虎这场高层地震的序幕。上周,被誉为“硅谷铁娘子”的雅虎前CEO卡罗尔·巴茨突然向全体员工发送邮件,称自己已被雅虎董事会解雇。随后,雅虎公司...
日期:07-22
日本国内正掀起生成式AI发展浪潮「日本国内正掀起生成式ai发展浪潮的原因」
6月13日 消息:据外媒报道,日本国内开发自动创建内容的生成人工智能的举措正在如火如荼地进行,不少公司正在努力赶上在推出生成性人工智能服务方面领先于外国竞争对手。xbox se...
日期:06-13
“酷开圈”联动大屏+小屏  酷开网络开辟OTT行业价值新蓝海_酷开多屏互动
  近年来一直高举高打、突飞猛进的OTT大屏市场,近期发生了一件看似平淡无奇的小事:   拥有超过6000万OTT用户的酷开网络,近日正式上线“酷开圈”,一个同步聚焦企业、员工和...
日期:06-16