您的位置:首页 > 互联网

,周鸿祎解释大模型为什么不识数 答不上来“9.9和9.11谁大”

发布时间:2024-07-18 18:19:27  来源:互联网     背景:

【】7月18日消息,这两天又一件事吵得沸沸扬扬:包括ChatGPT 4o、谷歌Gemini Advanced、Claude 3.5 Sonnet在内的很多SOTA大模型王者在回答“9.9和9.11谁更大”的问题时纷纷翻车。这让大家大跌眼镜,人工智能还是人工智障的说法再次卷土重来。

360创始人周鸿祎对该热门话题也发表了自己的观点,他认为:“不要低估大模型未来发展的潜力,但是不要高估大模型现在的实力“,”不要因为这个事就对大模型表示失望。这恰恰说明了其实大模型跟人的大脑是非常像的,它并不是万能的。”

同时,周鸿祎还解释了大模型为什么不识数、并给出了解决大模型不识数问题的解决方案。

大模型为什么不识数?

周鸿祎认为,大模型现在还是有很多的缺点,不认识“9.11和9.9谁大”,就是一个典型的例子。

“看了几个大模型输出的答案,差不多都在胡言乱语,为什么呢?”周鸿祎简单解释了为什么大模型会认为9.1比9.9大。

他认为:第一个问题:“其实大模型的全称叫大语言模型,它首先解决的是对人类自然语言理解的问题。所以大模型把9.9和9.11并没有当成一个数字来看,而是把它们分成了两个token。没有经过专门特别的提示和训练,大模型是不懂阿拉伯数字,也不懂数学,所以大模型是按照一个文字的逻辑来进行对比。所以9前面是一样大的,那么11比9要大,所以就得出来9.11比9.9要大。”

周鸿祎还举了个例子:这就好比你小时候上私塾只学了四书五经,一点数学算数都没学。那出一个这样的小数题你当然就不会了。

自主品牌投诉排行榜

第二个问题就是对提示词的依赖。也就是说你跟人工智能提要求的时候,如果都是聊天机器人的界面,你的说法不一样,那大模型的反应是不一样的。就好像一个问题换了种问法,有时候大模型就很聪明,有时候大模型就很笨。这恰恰说明了通过自然语言跟大模型来交流交互,在有些情况下是一种非常不靠谱的方式。比如也有人说换一种问法大模型就会了,比如说把9.9和9.11放在前面,再问谁大谁小,而不是先问谁大谁小,然后把9.11和9.9放在后面。

怎么解决大模型不识数的问题?

“这也恰恰说明了光靠大模型是解决不了企业政府的很多实际的工作和生产上的问题,需要和其他技术相结合“,周鸿祎认为,其实解决这个问题也很简单,有三种做法。

第一种方法,就是要教会大模型数学,就要把很多数学知识进行专门的训练。就像我们小学上了语文之后,还要学算数一样。有了这样专门的训这样的专业模型,就可以正确的回答这个问题。

第二个解决问题的方法,是像360AI搜索一样,就利用搜索和知识推理相结合。

  

周鸿祎称,刚才试看了一下360大模型的回答,实际上也是不准确的。但是跟360AI搜索结合在一起,通过全网搜索类似的答案,再加上大模型的理解,相当于是现找答案,然后现教大模型,那么答案就是对的。这也就是搜索增强或者知识对齐。

第三种方法实际上调用API。比如说如果大模型能够识别这是一个数学题,但是它不会解。没关系,利用函数调用的方式去调比如说一个数学网站的API,比如说有很多类似的这种数学网站,可以准确的告诉你9.9和9.11谁大谁小。

还有一种最简单的做法,为什么大模型现在都要学编程呢?因为编程就好比是大模型给了一个计算器,那你出了一道数学题,虽然我不会回答,但是如果我手上有个计算器,那我就能回答。所以有了大模型会懂得调pythons语言,用pythons来写一个程序,让pythons来比一下9.11和9.9谁大。当然了,编程的程序结果如果是对的那也会得出正确的答案。

最后,周鸿祎给出了三点总结:

第一,大模型对自然语言的理解是它的基础。很多数学物理化学的这些专业知识他并不了解,这个很正常。大家不要惊讶,要学习这些知识还需要专业的模型训练。

第二,利用搜索可以把人类拥有的解题的经验和知识的推理相结合,实际上是一种可以单独用大模型更有效的一种方法。

第三,大模型作为一个聊天机器人,实际上直接在业务和工作上直接用是不现实的,一定需要给他增加各种能力的补强。比如说它能调用其他的工具,能自己编程序来算。实际上人类也是这样,如果给了人类一个很复杂的一堆数据,让人类凭着自己的头脑去总结数据的规律,人类也往往回答不正确。但是人类如果会编程序,或者手边有一个什么计算软件,那么用这个计算软件和工具就可以帮助人类得到正确的答案。所以大模型也需要外部工具的帮助。

”所以不要因为这个事儿对大模型表示失望。这恰恰说明了其实大模型跟人的大脑是非常像的,它并不是万能的。人今天之所以能做很多工作,人本身是得到了很多第三方工具的帮助,包括计算机,包括计算器。“周鸿祎强调,”希望不要因为这个事儿丧失你对人工智能的信心。“ 


返回网站首页

本文评论
Adobe Firefly生成式AI工具已在旗下多个应用中正式上线_adobe firework
通信世界网消息(CWW)Adobe宣布,经过数月的测试,其Firefly生成式AI模型已经在Adobe Creative Cloud、Adobe Express和Adobe Experience Cloud等多个应用中正式上线。这意味着之前...
日期:09-14
【评测】搭载13代酷睿i7标压U,吾空凌云X14轻薄本商务办公闭眼入_吾空s17r
今年7月份吾空推出了23年的首 款14英寸轻薄笔记本凌云X14锐龙版,在性能输出这块可谓是表现惊艳,受到大家的一致好评。于是,趁着双11大促销售旺季,吾空又给大家带来了一款搭载英...
日期:11-11
院士专家任高级顾问,龙蜥生态日见成熟_龙蜥所有形态
近日,由开放原子开源基金会指导,龙蜥社区主办,阿里云、浪潮 信息、Arm、Intel、中兴通讯、统信软件等 24 家理事单位共同承办的,主题为“云智融合·共筑未来”的2023 龙蜥操作系...
日期:12-20
媒体泄密小米汽车实车拍摄照片,或将面临三百万元罚金!_小米汽车你敢开吗
(原标题:媒体泄密小米汽车实车拍摄照片,或将面临三百万元罚金!) 财联社12月18日讯(记者 孙煜)凤凰科技消息,近日,网络上出现了小米汽...
日期:12-18
独立开发变现周刊(第96期):一个课程学习网站,月收入2.6万美元
声明:本文来自于微信公众号 凯凯而谈(ID:web-bear),作者:凯凯刘,授权转载发布。目录1、TTime: 一款开源简洁截图、划词翻译软件2、Memberstack: 轻松在你的网站上集成会员服务3...
日期:07-21
李国庆称ChatGPT替代不了阅读 后者可以安慰心灵_李国庆与妻子
4月23日 消息:据《中国企业家》杂志消息,在4月23日的一次读书活动中,当当网创始人李国庆分享了他的观点。最新家用电器新科技百度互联网医院平台李国庆认为,ChatGPT无法取代阅...
日期:04-23
让自驾出行不再繁琐 华为 Hicar为你带来无感连接体验
就在上个月,笔者刚提了辆新车,挂牌之后就在家附近开了几圈上手。虽然正常驾驶已经没有问题,但功能不多,操作还复杂的车机系统反而让我花了更多的学习成本,各种二级菜单层层叠加,没...
日期:12-23
男子放巨型风筝反被带上天 没有任何安全设备_放风筝把人带飞视频是真的吗
近年来,各地风筝文化十分流行,不断创新出各种花样,比如大小不一的巨型风筝,看起来十分壮观。但需要注意的是,这些巨型风筝同样也非常危险。据报道,3月26日在河北,一名男子放飞了一...
日期:03-27
雅芳“起死回生”,借力天猫实现中国区一季度营收大涨20%,全力准备天猫618
  【天极网IT新闻频道】屡次被传退出中国的雅芳,近期发布了2019年一季度财报。   报告期内,雅芳收入11.869亿美元,同比下跌14.8%,净亏损3270万美元,较去年同期加剧了50%。就...
日期:12-15
美团外卖会员、神券合并,已削减93%营销类弹窗消息_网易科技_美团外卖会员券到期时间怎么算的
7月25日消息,美团外卖宣布将于8月1日正式将平台“会员”、“神券”两大营销体系合并升级为“神会员”。同时美团外卖还将进一步削减弹窗、push等APP营销类消息推送,减少对用户...
日期:07-26
美的厨卫产品「美的厨卫:打造5G工厂, 实现全流程互联互通」
通信世界网消息(CWW)“以前工厂里的机器人基于Wi-Fi网络,容易出现丢包现象,故障率较高,联通5G专网部署之后,极大地降低了信号时延,稳定性也更高了。”美的厨卫企业数字化负责人介绍...
日期:09-18
华为云获BSI颁发“2019年度安全突出战略贡献奖”
  近日,国际公认的权威标准组织——英国标准协会(BSI)为华为云颁发了“2019年度安全突出战略贡献奖”,以表彰华为云在安全可信领域的突出贡献。   华为云代表在现场接受...
日期:12-18
opensky元宇宙「一文读懂元宇宙开发平台statter network(STT)」
在科技愈发内卷的时代,从AI到元宇宙、Web3无不充斥着激烈的竞赛。作为区块链+元宇宙领域的大热门项目,Statter Network(STT)主网上线已接近一年,在过去数年的建设中statter已经成...
日期:05-18
腾讯、信通院牵头发布物模型系列标准,引领数据中心智能化运维
通信世界网消息(CWW)近年来,数据中心作为算力基础设施发展成效显著,产业链上下游多方合力、多措并举带来布局不断优化、运营能力稳步提升、赋能价值逐步显现,有力支撑了我国数字...
日期:01-09
6720站长论坛正式开通“站长问答区”
  6720站长交易网开通一个月以来,得到众多站长朋友的支持与帮助,为了更好的服务广大站长,6720站长论坛于5月25日正式开通站长问答专区,分类问答版块区别于其他传统站长问答版...
日期:07-29
LLM4Decompile官网体验入口 AI代码反编译工具免费使用下载地址
LLM4Decompile是一个开源项目,旨在创建并发布第一个专门用于反编译的LLM(大型语言模型),并通过构建首个专注于可重编译性和可执行性的反编译基准测试来评估其能力。该项目通过编...
日期:03-18
模型未发API先至!Stable Diffusion 3 API 发布  性能比肩 Midjourney v6
4月18日 消息:Stability AI 最近宣布了一个激动人心的消息:其开发者平台API现已支持最新版本的Stable Diffusion3(SD3)及其增强版本Stable Diffusion3Turbo。这一发布标志着St...
日期:04-18
这届年轻人“断亲”或已成常态 90后/00后几乎都不走亲戚:原因无奈
亲戚往来,是维系中华传统亲情文化的重要纽带,但是这一届的年轻人,断亲”已经成为常态,走亲戚越来越少。2022年,南京大学社会学院副教授胡小武调查发现,18岁以下的被调查者基本不怎...
日期:05-14
消失的汽车,找车的人_消失的车卖亏的房
文|《中国企业家》记者 任娅斐编辑|姚赟头图来源|视觉中国“他们要是不说,我都不知道这是个车,找了半天,现在就要清这个车。”蒋勤说道。站在河岸边,顺着蒋勤所指的方向,发现河道边...
日期:08-11
去年太空行业私人投资下降近六成 SpaceX没受影响_spacex占了多少市场
1月20日消息,总部位于美国纽约的Space Capital最近发布2022年度太空投资报告。报告显示,去年太空行业的私人投资下降58%。Space Capital将整个太空行业的投资下降归因于宏观经...
日期:01-20