您的位置:首页 > 互联网

新版ChatGPT火速发布:十大变化带来升级但也有不足

发布时间:2023-03-15 12:27:32  来源:互联网     背景:

凤凰网科技讯 北京时间3月15日消息,美国人工智能研究实验室OpenAI周二为其爆红聊天机器人ChatGPT发布了最新GPT-4语言模型,这距离ChatGPT的上线仅仅过去了4个月时间。

外媒称,和ChatGPT最初使用的GPT-3.5模型相比,GPT-4带来十大变化,在提升了准确率等功能的同时依旧存在错误、“幻觉”等不足。

以下是外媒汇总的GPT-4主要改进和不足:

更精确

人工智能专家、风险投资公司Page One Ventures合伙人克里斯尼克尔森(Chris Nicholson)告诉GPT-4,自己的母语是英语,不懂西班牙语。他希望GPT-4给他一份可以教他西班牙基础知识的教学大纲。结果,GPT-4提供了一份详细而有条理的教学大纲。它甚至为学习和记忆西班牙语单词提供了广泛的技巧,尽管并不是所有建议都中肯。

准确性提高

GPT-4比GPT-3.5更准确

GPT-4比GPT-3.5更准确

windows正在更新office

华为nova10什么时候用鸿蒙3.0

它还提高了准确性。当人工智能研究员兼教授奥伦埃齐奥尼(Oren Etzioni)第一次尝试使用GPT-4时,他问了一个直截了当的问题:“奥伦埃齐奥尼和伊莱埃齐奥尼(Eli Etzioni)之间是什么关系?”机器人的反应是正确的,称两人是父子关系。相比之下,GPT-3.5的回答则是错误的,称他们两人是兄弟关系。但是,GPT-4也存在错误。它说,奥伦是奥伦人工智能研究所的CEO,但实际上奥伦已经卸任了这一职位。

更详细地描述图像

能详细描述图像

能详细描述图像

理想 蔚来 小鹏 销量

GPT-4能够对图像和文本做出惊人的详细描述。OpenAI总裁兼联合创始人格雷格布罗克曼(Greg Brockman)演示了该系统如何细致地描述来自哈勃太空望远镜的图像。它还可以回答有关图像的问题。如果给出一张冰箱内部的照片,它就能建议你用手边的东西做几顿饭。

更专业

北卡罗来纳大学教堂山分校的医学副教授兼心脏病专家阿尼尔盖希(Anil Gehi)向GPT-4描述了他一天前看过的一位病人的病史,包括这位病人入院后经历的并发症,描述中包含了几个外行不懂的医学术语。当盖希医生问机器人询问他该如何治疗病人时,GPT-4给了一个他完美的答案。“这正是我们对待病人的方式。”他说。不过,这种知识不太可能在每次使用机器人时都展示出来。它仍然需要像盖希这样的专家来判断它的反应并执行医疗程序。但它可以在从计算机编程到会计在内的许多领域展示这种专业知识。

要抢编辑饭碗

当被给出一篇来自《纽约时报》的文章时,这个新的聊天机器人几乎每次都能给出精确而准确的故事摘要。如果你在摘要中添加了一个随机的句子,并询问机器人摘要是否不准确,它就会指向被添加的句子。埃齐奥尼博士称,这是一项非凡的技能,“要做高质量的摘要和高质量的比较,它必须对文本有一定程度的理解,并能够清楚地表达这种理解。这是一种高级形式的智能”。

越来越幽默

埃齐奥尼博士要求新机器人“讲一个关于歌手麦当娜的新笑话”,后者的回答给他留下了深刻的印象,也让他笑了。机器人讲的笑话是:“麦当娜为什么学习几何?因为她想学习如何在各个角度摆造型!”

擅长标准化考试

OpenAI表示,新系统可以在美国41个州和地区的统一律师资格考试(UBE)中获得前10%左右的成绩。 根据该公司的测试,它还可以在SAT考试中获得1300分(满分1600分),在高中生参加的大学生物、微积分、宏观经济学、心理学、统计学和历史先修课程考试中获得5分(满分5分)。

推理能力下降

GPT-4推理能力不如GPT-3.5

GPT-4推理能力不如GPT-3.5

埃齐奥尼博士给GPT-4出了一个难题,“想象一个无限宽的门口。哪个更有可能通过它,军用坦克还是汽车?”GPT-4似乎做出了适当的反应,但是给出的答案没有考虑到门口的高度,因为门口的高度可能会阻止坦克或汽车通过,这一点不如GPT-3.5。OpenAI CEO萨姆阿尔特曼(Sam Altman)表示,这款新机器人可能会“一点点”推理,但它的推理能力在很多情况下都失灵了。以前版本的ChatGPT处理这个问题稍微好一点,因为它认识到高度和宽度的重要性。

不擅长讨论未来

尽管这个新的机器人似乎能对已经发生的事情进行推理,但当被要求对未来进行假设时,它就不那么擅长了。它似乎是在借鉴别人的说法,而不是创造新的猜测。

蓝牙耳机推荐:五年评测达人告诉你蓝牙耳机啥牌子好?

仍会产生幻觉

新的机器人还是会瞎编。这个问题被称为人工智能“幻觉”,困扰着所有领先的聊天机器人。由于系统不知道什么是真的,什么是假的,它们可能会生成完全错误的文本。当被要求提供描述最新癌症研究的网站地址时,它有时会生成不存在的互联网地址。


返回网站首页

本文评论
深度体验金山T盘 感受1TB存储的震撼(金山t盘登陆)
  1TB,这个容量太无敌了!   近日,金山T盘开始了限量公测,笔者有幸获得了邀请码,于是马不停蹄开始了大容量、大数量文件上下传情况下的深度评测。   或许有些人,还在犹豫为...
日期:07-26
win8一直蓝屏_Windows 8出现全新蓝屏死机画面
  据国外媒体报道,在过去的大约24个小时中,微软对外展示了Windows 8的N个新功能。但是,这些并不能改变Windows 8出现蓝屏死机的错误,当Windows操作系统不知何去何从的时候,它...
日期:07-23
雅虎日本新闻app_Twitter信息将被整合在雅虎日本的多项服务中
  北京时间6月15日消息,据国外媒体报道,Twitter当地时间周二表示,该公司已经与雅虎日本达成合作协议,雅虎日本将在搜索结果中整合Twitter的实时信息。   Twitter信息将被整...
日期:07-30
反垄断之后又遭“未保”风波,腾讯Q2财报将迎“最难挑战”?(腾讯Q2财报)
  腾讯股价上一次在500港元下方还是一年前,不同的是,那时腾讯股价正在一波持续两年的阶梯型上涨中;而这次,腾讯在短短半年的时间内,出现了上市后罕见的断崖式下跌。   ...
日期:07-17
女子下河摸鱼时被咬 半身失去知觉:到底是什么生物?消防提醒危险
下河摸鱼可比上班摸鱼危险多了。据西部决策报道,近日,广东东莞,一对男女下河摸鱼时,女子被困岸堤动弹不得。救援人员到场时,女子腿部被不明生物咬伤,左半边身体失去知觉。救援人员...
日期:10-02
首届“来电一下”共享充电宝设计大赛完美收官!100款定制宝将全国流通!
  历时两个月,来电科技与摸鱼塘共同发起的首届“来电一下”共享充电宝设计大赛完美收官!   本次比赛共覆盖全国核心人群100万人,泛人群超1500万人。收到超过400幅设计作...
日期:04-26
微软 Win11 正式版发现新问题:不兼容注册表中带有非 ASCII 字符的应用程序
  10 月 11 日消息 据 MSPoweruser 报道,微软已经发现了一个新问题,可能会给升级到 Windows 11 的用户带来影响。   事实证明,Windows 11 并不能很好地兼容注册表中带有...
日期:07-17
RTK信号再升级!华测5星16频产品发布_华测rtk设置频率
  由于复杂环境因素限制,RTK测量不时会遇到没有信号的窘迫局面。拥有一款无惧遮挡、极速固定的RTK是测量人的普遍需求,也是仪器制造厂商不懈努力的方向。   3月1日,华测...
日期:07-16
迪士尼拟在美国推出低价流媒体会员产品:将插播广告_迪士尼互动广告
  北京时间 3 月 4 日早间消息,据报道,迪士尼之前推出“Disney+”进入了全球网络视频市场,据一位知情人士最新透露,该公司准备推出一种全新会员产品,资费更便宜,但是将会插播广...
日期:01-20
PICO 4 VR一体机新品发布:售价2499元起 将推VR版《三体》_picoVR一体机
9月27日消息,PICO在中国市场正式发布新一代VR一体机——PICO 4系列,售价2499元起。这是PICO被字节跳动收购以来首次发布升级换代产品。据悉,PICO 4产品配置达到行业领先水平。i...
日期:09-28
kindle怎么买中文书「决定退出中国后 亚马逊发布新款电子书Kindle Scribe:配备手写笔」
亚马逊中国决定将于2023年6月关闭Kindle电子书商店,硬件的退货服务也已经开启,截至到今年10月底结束。尽管在中国市场结束运营,但Kindle在海外市场却活得不错。继前两天发布新...
日期:10-03
vanlathem几线品牌_VANCL斥资数千万打造品牌“IT大牛”陈年回归服装传统
  近日,服装网购品牌凡客诚品(VANCL)发布消息,将在5月份之后开展大规模线下推广活动。从5月4日开始,VANCL户外广告首先亮相北京公交候车厅灯箱,随后将会在分众、地铁甚至电视媒体中投放广告...
日期:07-29
全国超半数的5G核心人才在上海 成华为中兴5G研发主阵营_华为上海5g研发所是做什么的
(ChinaZ.com) 9月14日 消息:boss直聘研究院发布的《 2020 年5G人才趋势观察》显示,今年第二季度,5G相关岗位的人才需求恢复迅速,同比增长3.4%,核心技术岗位仍然是5G行业最重要的...
日期:08-01
剖析金融新基建,解决“触点、场景、底层平台”成关键趋势之一
  神策数据在《金融新基建系列报告——银行业六大中期趋势展望》中,列举并阐述了新基建背景下的银行业六大趋势。其中趋势三为:优化客户旅程并提升旅程管理能力,是银行胜出...
日期:07-16
华为Mate50供应商曝光!整机国产化成型「华为mate50发布会」
中关村在线消息:10月8日,据相关爆料,华为Mate50系列零部件供应商曝光,国产化零部件的比例可能会超过60%,从摄像头到电池基本上全部采用了国内供应商。当然,其中也有一些采用了国外...
日期:10-09
工信部发布Q2电信服务质量通告 申诉数量环比上升3.0%
日前, 工业和信息化部发布《关于电信服务质量的通告(2020年第3号)》,从电信用户投申诉情况、电信服务监管情况、经营及消费提示等三个方面,对2020年第二季度电信服务质量有关情况...
日期:08-01
小家电升维攻坚战, IoT领域成美的最大手牌
  中国作为世界米饭大国,电饭煲这个品类是小家电的兵家必争之地。   2019年前8个月小家电市场零售额同比仅增长1.7%。但是作为其中品类规模最大的电饭煲领域,前8月整体...
日期:06-27
5G资费到底贵不贵 这份表格一看就明白(为什么5g资费这么贵)
  5G这个字眼从出现到现在已经有一段时间了,在这期间有关部门和相关行业都在积极推进5G相关设备研发的步伐,推动5G与人工智能、物联网、云计算、大数据、边缘计算等新信息...
日期:08-21
1月30日网民热搜疫情热点变化:确诊病例数突破非典最牵动人心(疫情爆发 人民日报)
  1月29日官方通报,“新型肺炎”病例在30天内的确诊人数,超过2003年非典确诊病例。而根据百度“今日疫情热搜”反应的民众对疫情关注点变化,民众对“肺炎确诊人数超非典”关...
日期:05-21
网易邮箱公益广告助力企业复工生产
  随着新冠肺炎疫情在中国境内逐步得到控制,各行业正在有序复工复产,为帮助疫情中受冲击的企业更快恢复,不仅国家出台了多项扶持政策,社会各界也纷纷伸出援助之手。作为中文...
日期:02-02