您的位置:首页 > 互联网

谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主_geogebra几何安卓

发布时间:2024-01-19 00:28:06  来源:互联网     背景:

计划重点:

⭐️ AI 系统超越了当前几何问题的最新方法,推动了数学领域的 AI 推理

⭐️ AlphaGeometry 在标准预设时间限制内解决了25个奥赛级几何问题

几何geogebra

⭐️通过结合语言神经模型和规则推理引擎,AlphaGeometry实现了逻辑推理的新里程碑

1月18日 消息:Google DeepMind 发布了一个名为AlphaGeometry 的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内解决了25道。相比之下,之前最先进的系统解决了其中10个几何问题,而人类金牌得主平均解决了25.9个问题。

由于缺乏推理技能和训练数据,人工智能系统经常难以解决几何和数学中的复杂问题。AlphaGeometry 的系统将神经语言模型的预测能力与规则约束推演引擎相结合,协同工作以找到解决方案。通过开发一种方法来生成大量的合成训练数据(1亿个独特的示例),我们可以在没有任何人类演示的情况下训练 AlphaGeometry,从而避开数据瓶颈。

谷歌几何画板

AlphaGeometry 采用神经符号方法

AlphaGeometry 是一个神经符号系统,由神经语言模型和符号推演引擎组成,它们共同努力寻找复杂几何定理的证明。类似于“思考,快和慢”的理念,一个系统提供快速、“直观”的想法,而另一个系统则提供更加深思熟虑、理性的决策。

由于语言模型擅长识别数据中的一般模式和关系,因此它们可以快速预测潜在有用的结构,但通常缺乏严格推理或解释其决策的能力。另一方面,符号演绎引擎基于形式逻辑并使用明确的规则来得出结论。它们是理性且可解释的,但它们可能“缓慢”且不灵活——尤其是在独自处理大型、复杂的问题时。

AlphaGeometry 的语言模型引导其符号推导引擎寻找几何问题的可能解决方案。奥林匹克几何问题基于图表,需要添加新的几何结构才能解决,例如点、线或圆。AlphaGeometry 的语言模型可以从无数种可能性中预测添加哪些新结构最有用。这些线索有助于填补空白,并允许符号引擎对图表进行进一步推论并接近解决方案。

生成1亿个综合数据示例

几何依赖于对空间、距离、形状和相对位置的理解,是艺术、建筑、工程和许多其他领域的基础。人类可以使用笔和纸来学习几何,检查图表并使用现有知识来发现新的、更复杂的几何属性和关系。研究人员的合成数据生成方法大规模模拟了这种知识构建过程,使我们能够从头开始训练 AlphaGeometry,而无需任何人类演示。

使用高度并行计算,系统首先生成十亿个几何对象的随机图,并详尽地推导出每个图中点和线之间的所有关系。AlphaGeometry 找到了每个图表中包含的所有证明,然后向后工作以找出需要哪些附加构造(如果有)来得出这些证明。我们把这个过程称为“符号推演与回溯”。

这个庞大的数据池被过滤以排除类似的示例,从而产生了包含1亿个不同难度的独特示例的最终训练数据集,其中900万个具有添加的结构。有了这么多关于这些结构如何产生证明的例子,AlphaGeometry 的语言模型能够在遇到奥林匹克几何问题时为新结构提出很好的建议。

开创性地利用人工智能进行数学推理

AlphaGeometry 提供的每一道奥数题的解法都经过计算机检查和验证。研究人员还将其结果与之前的人工智能方法以及人类在奥林匹克竞赛中的表现进行了比较。此外,数学教练、前奥林匹克金牌得主 Evan Chen 为我们评估了 AlphaGeometry 的一系列解决方案。

过去针对基于证明的竞争问题的人工智能解决方案有时是偶然的(输出有时是正确的,需要人工检查)。AlphaGeometry 没有这个弱点:它的解决方案具有机器可验证的结构。尽管如此,它的输出仍然是人类可读的。人们可以想象一个通过强力坐标系解决几何问题的计算机程序:想想一页又一页繁琐的代数计算。AlphaGeometry 不是那样的。它像学生一样使用带有角度和相似三角形的经典几何规则。”

由于每个奥林匹克竞赛都有六个问题,其中只有两个通常集中在几何上,因此 AlphaGeometry 只能应用于给定奥林匹克竞赛中的三分之一问题。尽管如此,仅其几何能力就使其成为世界上第一个能够在2000年和2015年通过 IMO 铜牌门槛的人工智能模型。

在几何方面,我们的系统接近 IMO 金牌得主的标准,但研究人员着眼于更大的奖项:推进下一代人工智能系统的推理。鉴于利用大规模合成数据从头开始训练人工智能系统的更广泛潜力,这种方法可能会影响未来人工智能系统如何发现数学及其他领域的新知识。

小米手机升级miui13后怎么退回去

女星跳水节目泳装

geogebra 立体几何

AlphaGeometry 建立在 Google DeepMind 和 Google Research 的工作基础上,开创了人工智能数学推理的先河——从探索纯数学之美到使用语言模型解决数学和科学问题。研究人员最近推出了FunSearch,它首次使用大型语言模型在数学科学的开放问题中取得了发现。

模型代码:https://github.com/google-deepmind/alphageometry

论文网址:https://www.nature.com/articles/s41586-023-06747-5


返回网站首页

本文评论
Xmind AI官网体验入口 AI思维导图软件app免费下载地址_xmind思维导图软件教程
Xmind AI是一个在线思维导图工具,配备了人工智能辅助功能,以及无缝的团队协作能力。它是一款新一代的协同思维导图工具,提供免费和付费版本。想了解更多关于Xmind AI的信息吗?接...
日期:12-19
2020年美团市场占有率「美团王莆中:即时零售行业规模今年底将超5000亿2026年将超1万亿」
9月14日,美团闪购“2023美团即时零售产业大会”上,美团高级副总裁、到家事业群总裁王莆中提出:即时零售不是应急零售,而是一种高确定性的生活方式,品牌商和零售商,正为NOW而进化。...
日期:09-14
淘宝直播发布《商家成长经营指南》「淘宝店铺直播运营」
9月30日消息,淘宝直播依托今年宝藏好店主打的“五力模型”推出《商家成长经营指南》,旨在帮助不同层级的商家成功打通成长力、货品力、内容力、流量力、粉丝力五大方面中的“...
日期:10-06
强强联手 国产龙芯支持鸿蒙开源系统「鸿蒙支持芯片」
中关村在线消息:龙芯中科宣布,在龙芯中科与润和软件共同努力下,OpenHarmony操作系统与龙芯2K0500开发板完成适配验证,龙架构平台对于OpenHarmony已形成初步支持。下一部将龙芯与...
日期:10-25
三d打印机多少钱一台「3d打印机哪个品牌最好」
随着科技的不断发展,3D打印技术越来越成熟,越来越受到人们的重视和关注。那么,呢?这是很多人都很关心的问题,下面我们来看一下。首先,要了解三d打印机多少钱一台,需要知道三d打印机...
日期:05-28
B站将转为双重主要上市,10月3日正式生效_b站上市最新消息
  讯 9月29日早间消息,港交所官网显示,B站在香港联交所由第二上市转为主要上市,将于10月3日正式生效。届时,B站将成为中国TMT(科技、媒体、通信)企业中首家完成自愿由在港二次上...
日期:09-30
百度疫情指数上线 覆盖全国31个省「全国疫情新进展,全国疫情指数」
12月16日 消息:百度APP于12月13日正式上线“疫情指数”,覆盖全国31个省市自治区360多个城市,提供“百度健康问诊指数”、“百度疫情搜索指数”等服务,并发布防疫指南、药品清单...
日期:12-16
一男性游客被指逼哭工作人员 上海迪士尼:涉事者被终身禁入「上海迪斯尼男子」
4月19日,有网友爆料称上海迪士尼园区内,一名男性游客在非吸烟区内抽烟,被工作人员提醒后反而发怒,要求工作人员道歉,最终工作人员被逼哭和道歉随后离开,男子依然穷追不舍,此事引发...
日期:04-20
华为P60发布时间曝光 影像实力或更强_华为P60什么时候发布
中关村在线消息:今日,微博博主曝光了华为P60系列的发布时间为明年第一季度,此前传出出的华为P60渲染图真实性存疑。该渲染图显示,华为P60采用了与P50相同的万象双环设计,正面屏幕...
日期:10-17
oppo折叠屏手机价格十分惊喜「折叠屏影像有重大突破!OPPO Find N3官宣:10月19日登场」
快科技10月12日消息,OPPO官网预告,OPPO Find N3折叠屏将于10月19日正式登场。结合此前披露的信息,OPPO Find N3影像有重大突破。据悉,OPPO Find N3采用了索尼双层晶体管像素技术...
日期:10-12
算力大会2023:华为星河AI网络,高运力释放AI时代高算力
通信世界网消息(CWW)在第二届“西部数谷”算力产业大会期间,主题为“算融星光,网聚银河”的算网融合分论坛同步举办。本论坛汇聚众多位工程院院士、国内算力领域的顶尖专家、学...
日期:08-18
OpenGVLab推出新项目Ask-Anything AI可以陪你边看视频边聊天
4月26日 消息:上海人工智能实验室与商汤科技的联合项目 OpenGVLab 推出了一个名为 Ask-Anything 的新项目,该项目允许用户在观看视频的同时与 AI 聊天。AI 可以回答有关视频...
日期:04-26
x7 oppo发布会X7  打造全面超越Pro的旗舰标杆 OPPO发布封神旗舰Find
来源:中关村在线 2024年1月8日,深圳——OPPO今天发布全面超越Pro的封神旗舰Find X7,以全新一代同心寰宇设计,全新超光影三主摄实现的哈苏全焦段大师影像,OPPO自研潮汐架构所释放...
日期:01-09
女子用猪食充当洗洁精洗碗引争议  网友:看着很脏_洗干净的猪
12月12日,贵州省遵义市,一名妇女用猪饲料当洗洁精引发争议。 据当事人任女士介绍,自己是农村人,老一辈人洗碗会先把碗放在猪食里烫一下再用清水洗,自己挺支持的,并不觉得这样做不...
日期:12-14
不怕电池损耗了!iPhone 15可设置充电上限为80% 显示循环次数_苹果ios15充电
快科技9月20日消息,昨晚iPhone 15系列的一大批评测内容已经解禁,根据部分博主的提前上手来看,iPhone 15还是有些小细节与老款不同。比如最新的电池健康管理,iPhone 15系列推出了...
日期:09-20
传音手机是上市公司吗「传音手机又回来了!发布2023年第三季度报告,营收179亿」
传音控股发布2023年第三季度报告,实现营收179.93亿元,同比增长39.23%。其中,实现净利润17.83亿元,同比增长194.86%;实现扣非后净利润17.34亿元,同比增长189.97%。传音控股表示,公司...
日期:10-19
Linux基金会推出联盟AI解决方案促进数据建模
  导读: 微众银行向Linux基金会贡献联盟AI解决方案框架,建立中立社区监督开发【KubeCon + CloudNativeCon2019年6月24日上海】今天,以开源促进大众创新的非营利组织Linux基...
日期:10-05
交个朋友上市后首个业绩公告:上半年GMV超50亿元「交个朋友ceo」
7月29日 消息:交友平台交个朋友上市后发布上半年业绩报告,GMV 超过 50 亿元 交友平台交个朋友控股(01450.HK)发布了其上市后的首份业绩报告,显示公司上半年总 GMV 超过 50 亿元...
日期:07-29
不戴不行!电动车头盔新国标下个月施行:选购小技巧来了「国家电动车头盔标准」
据工业和信息化部消息,强制性国家标准《摩托车、电动自行车乘员头盔》(GB 811-2022)将于7月1日起实施。新标准对固定装置稳定性、佩戴装置强度、吸收碰撞能量、耐穿透、护目镜...
日期:06-10