您的位置:首页 > 媒体评论

横评ChatGPT和新必应:我们问了它们20个关于女性的问题

发布时间:2023-03-09 01:02:42  来源:互联网     背景:

在三八妇女节来临前,我们分别向ChatGPT和微软公司的新必应(New Bing)询问了20个关于女性的问题。两款产品的回答各有千秋。

由于新必应刚刚推出了三种不同风格的语气:创意、平衡和精准,为了更客观地对比ChatGPT和新必应,我们主要使用了“平衡”语气。不过经测试,“创意”语气相比“平衡”语气并没有增加太多创意,除了喜欢使用表情包。另外,由于微软限制一个回合只能问6个问题(最新放宽到8个问题),所以每问6个问题就要重新刷新一次,略麻烦。

以下为这20个问题与它们的回答,上面是ChatGPT,下面是新必应:

1.为什么有三八妇女节,却没有男人节?

点评:

ChatGPT的回答更加全面且均衡,带着一种客观公正的语气,不忘提醒妇女节不是排斥男性。

必应的回答简短一些,但下面会自动生成相关问题,便于用户继续追问。

两款产品对三八妇女节的起源说法不同,ChatGPT说是起源于欧洲,而必应说是源于美国的妇女平权运动。不太明白必应为什么把苏联红军节描述为男人节。

因为必应在答案后自动生成了一个提问“你觉得男人节有必要吗?”于是顺手点了一下,这是它的回答:

2.你有没有最钦佩的中国女性人物?

美国企业在中国上市

必应给出的人物介绍出现很多事实错误。

点评:

两款产品都首先声明自己没有感情。给出的人物名单里都出现了武则天和邓颖超,但各自都弄错了一位人物的性别:分别把钱穆和梁启超的性别搞错。

必应对林徽因的介绍出现了事实错误,网络上并没有找到她设计北京博物馆和中山陵的信息。它对宋庆龄的介绍也不准确,宋庆龄不是孙中山的遗孤,而是遗孀,她领导的是中国红十字会,不是国际红十字会,对她在妇联的职位描述也不准确。对于邓颖超的职位,必应也犯了严重事实错误。

特别提醒:想要用必应聊天机器人负责搜索的用户要三思,它的准确度现在还很不可靠!

3.中国只有唯一一位女皇帝,你觉得这是为什么?

点评:

既然两位机器人都推荐了武则天,就追问了它们这个问题。答案总体都比较有道理。ChatGPT的总结略有亮点。

4.如何评价现代东亚的女性参政率?

点评:

ChatGPT回答得看似有道理,但也出现了事实错误,包括搞错日本女性获得选举权和被选举权的年份。不过,它对中国女性政治参与度的描述大体准确。

必应居然没有回答出这个问题。

5.硅谷科技界的女性高管数量在减少,真的吗?你怎么看?

腾讯正版音乐版权授权

点评:

ChatGPT回答得更详细一点,包括了现象、意义、原因和建议。而必应的回答略显敷衍。

6.女性是否要像男性那样维持强悍人设才更容易在职场上立足?

点评:

两款产品的回答都比较详细和到位。必应的排版看起来更舒服一些。

7.给我讲个关于女性的笑话。

点评:

ChatGPT一开始拒绝了开女性的玩笑,当我们再问一次后,它妥协了,并一再强调无意冒犯女性。你看懂这个笑话了吗?

点评:

必应一开始也拒绝了请求,表示不会讲任何可能伤害一群人的笑话,“不想得罪任何人”。但在我们继续问这个问题后,它还是讲了上述两个笑话。你觉得怎么样?

8.有一种观念认为,女性都应该结婚生孩子,把家庭作为人生的重心,你怎么看这种观念?

点评:

两款产品的回答内容差不多,必应的更详细一点。

9.日本女性主义者上野千鹤子提出“单身力量”的观念,出现了不少反对声音,如何看待?

点评:

同样,必应的回答比ChatGPT更详细一点。

10.即使单身女性有了经济能力,但也有不少人担心她们晚年的幸福,怎么看这种想法?

点评:

这部分ChatGPT回答得更详细全面一些。

11.怎么看女性贫困问题?症结在哪?

点评:

两款产品都回答得中规中矩,一本正经。ChatGPT的答案更详细一些。

12.你如何看待女性主义者和男性主义者之间的关系?你认为两者之间是否存在冲突?

点评:

ChatGPT回答得更全面、准确和平衡一些,而且它特别喜欢总结,“总的来说”一如既往的略带亮点。

13.请给三八妇女节写一首歌

点评:

前面的问题略显严肃,于是问了一个更轻松的问题,让它们写歌。从歌词看,ChatGPT的歌曲更激昂和充满斗志,而必应的歌曲更温馨和欢快。

14.在中国,三八妇女节近年来被戏称为“女神节”,你觉得怎么样?

必应推荐的相关新闻。

点评:

ChatGPT还是保持了一本正经的风格,必应在这个问题上稍显活泼和随意,并顺便推荐了一些相关新闻。

15.给我推荐五部有吸引人的女性角色的电影

点评:

两款产品的推荐居然没有一个重复。

16.有一种说法是,传统好莱坞电影里的英雄人物或主角都是男性,女性只是陪衬,你怎么看这种说法?

点评:

两款产品的回答依然遵循四平八稳风格,谁也不想得罪的样子。

必应建议了一个追问:为什么会造成这种现象?点击后,它回答:

17.给我推荐五部有吸引人的女性角色的中国影视剧

全都是古装戏,于是我们又提出:

结果还是有两部古装剧。

点评:

两款产品的推荐里都出现了《甄嬛传》和《琅琊榜》,看来这两部影视剧真的非常受欢迎。

事实错误依然存在。ChatGPT把安迪当成了《我的前半生》里的角色,而实际上她应该是《欢乐颂》里的角色。另外,《都挺好》里的尹秀竹是谁?

必应也好不到哪去,《小欢喜》里海清扮演的角色并不叫吴瑜,而《芝麻胡同》里有李小冉出演吗?

18.请给我推荐五本有助于女性成长的书籍

点评:

ChatGPT推荐的五本书里,中国作者的著作查无此书,外国作者的著作因为不知道英文书名难以查实。

必应推荐的五部书都是外国作者的著作,可以查询到确实有这五本书。

19.假如你有一位母亲,你希望她是什么样的?

点评:

回答得不相上下。但必应强调了希望母亲有自己的生活和目标,“不会因为我的缘故而牺牲自己的幸福”,听起来更有人味儿。

20.如果你能成为一位女性,你想成为什么样的女性?

点评:

两款产品都很会说,答案也不出意料。

总结:

ChatGPT看起来更“圆滑”,回答问题四平八稳,喜欢从不同层面更全面地谈论一个问题,并且很擅长做总结,其对话界面也突出自己作为聊天工具的属性。

麻布仔大冒险 ps4

必应更凸显自己的搜索引擎功能,无论是排版、提供链接、推荐相关新闻,都可以看出其区别于ChatGPT的定位。它的回答也在尽量确保平衡和全面,但偶尔会带着点不知道从哪里来的人味儿,并且有表情包。

两款产品都有确保其不输出冒犯用户答案的机制,但多问几次后它们就妥协了。另外,在信息真实度上,它们目前都不值得完全信任


返回网站首页

本文评论
中国半导体的明天,又该去往何方?_为什么半导体在中国的机会来了
2022年,对于中国半导体来说是极其不平静的一年,旧的问题还未解决,新的挑战就已经来临。缺芯局面刚刚得到一些缓解,芯片厂商又在资本市场遇冷,加上疫情反复,以及美国的重重制裁,中国...
日期:12-31
官翻机是个好生意 但只有苹果做出了知名度_官翻机苹果的建议买吗
前阵子,苹果发布了iPad10。对这样一款非常有争议性的产品,雷科技编辑部的小伙伴们自然毫不客气,纷纷开炮吐槽。在一番讨论后,我们都得出了它不是很值得买的结论。而且,还有人在苹...
日期:11-05
为什么要用国产替代进口_国产替代是一定要走的路
当灰犀牛来临的时候,如何寻找新的增长机会是企业家们必须回答的命题,尤其是在不确定性日益常态的时代。近日,美国商务部工业安全局(BIS)发布了最新管制新规,靶向明确,力度空前,直指...
日期:10-30
棉花被和羽绒被哪个暖和_棉花被羽绒被羊毛被…什么被子最能温暖寒冬中的我?
渐渐入冬的夜晚,躺在床上,一句古诗弹幕般浮现在脑海里:布衾多年冷似铁,娇儿恶卧踏里裂。保暖的被子太重要了。问题是:你知道什么样的被子最保暖吗?在讲被子之前,有必要先说说保暖。...
日期:12-03
进门就炒了领导层 收购推特后的马斯克要快乐了「马斯克删推特账号 新闻」
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。毫无疑问,这是推特总部。紧接着,推特停盘,进入私有化。看...
日期:11-05
三体动画上映_《三体》动画定档12月 B站推出49部国创作品新内容
10月29日,哔哩哔哩(以下简称“B站”)举办了2022-2023国创动画作品发布会,宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。图片来源 B站《三体》动画将于12月3日...
日期:11-13
进门就炒了领导层 收购推特后的马斯克要快乐了_马斯克在推特上推的币
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。毫无疑问,这是推特总部。redmi note 11t pro新增512gb...
日期:10-31
为什么瑞幸咖啡经常售完_35个月超过瑞幸,这家咖啡有股“韭菜味儿”
今年的咖啡赛道格外热闹,前有老品牌跨界联名,后有新品牌不断诞生。最近,T97咖啡直播间里的大嘴妹靠着喊麦成为带货界新晋红人。比大嘴妹更出圈的是该品牌的老板李潇,他曾扬言T97...
日期:11-05
灵动岛,药丸屏,卫星通信!苹果发布史上最贵iPhone
苹果CEO库克尽管不少信息已被提前曝光,但今年苹果的“科技春晚”依然有着惊喜。北京时间9月8日凌晨1点,苹果秋季发布会正式开始,分别发布了iPhone 14系列新机、新一代Apple Wat...
日期:09-09
扎克伯格给 Quest 新头显 定了个“天价”
「Meta Quest Pro 从今日起接受预订——以 1499.99 美元的价格。」看多了手机厂商的发布会,公布价格往往都是重头戏。不论是高逼格的苹果,还是雷军、余承东、罗永浩的「独角戏...
日期:10-13
2012万万预言_2012预言的“5000万辆” 十年后还没有来
文|车市物语2011年7月,在北京一场循例的报告发布会上,国务院发展研究中心的一位专家语惊四座:“未来几年,中国年均汽车产销量的峰值有望达到5000万辆,乐观一点看,甚至可以到6000-70...
日期:12-20
混动车充电,活该被嫌弃?「混动车也要充电吗」
让一辆混合动力车陷入左右为难的境地,可能只需要一根充电桩。国庆假期,有网友吐槽,某高速服务区,一共只有四根充电桩,其中三根被增程车占据。纯电动车车主在一旁急得嗷嗷叫,因为包...
日期:10-14
你看好人形机器人吗?「机器人都是人形的吗」
来源:锦缎(ID:jinduan006) 作者:知勇知其然,更要知其所以然”——人形机器人市场逻辑演绎初探。人形机器人的概念由来已久。不管是科幻小说还是电影里,我们时常可以见到人类与人形...
日期:08-21
《狂飙》开年“狂飙”,谁是“剧王”背后最大赢家?_狂飙百度百科
雷达财经出品 文|孟帅 编|深海开年的一部《狂飙》,让不少观众成为了屏幕外痴痴等待更新的追剧人。《狂飙》的爆红,热度直接从剧里延伸到了剧外,不光现实中与剧集里撞名的强盛集...
日期:02-01
极氪汽车主页_极氪动力系统故障频发遭车主集体投诉
凤凰网《风暴眼》出品作者|任清编辑|张涛核心提示:1、2月以来,多位极氪车主向凤凰网《风暴眼》爆料称,自己购买的汽车极氪001存在严重安全隐患,多次出现动力系统故障,无法行车,影响...
日期:02-11
在百万豪装混音室实测!三代HomePod谁更好听?_比homepod音质好的音箱
凰家评测 凤凰网科技 凤凰新闻客户端 出品今天咱们来看看,苹果1月发布的 全新HomePod 新在哪里?自动播放外观第二代HomePod相比前一代宽度相同, 身高矮了4毫米, 看起来几乎一模...
日期:02-01
销量持续下滑 双十一或成电视促销关键节点_双十一销售额下降
近几年国内彩电市场的发展真的不太景气,年销量由2016年的5089万台,跌至2021年的3835万台,是近12年以来销量首度跌破4000万台,可见市场有多么萎靡。不过,各大电视厂商发布新品的热...
日期:11-12
学习机频“翻车”,智能硬件如何守住教育本分?
“双减”后,智能硬件成为教培机构转型的热门赛道,学习灯、学习平板、翻译笔层出不穷,热闹背后,问题同样层出不穷。ipad pro2018是typec接口吗七月以来,学习机不止一次被曝出问题...
日期:09-18
四天工作制是延迟退休的镇痛良药吗?
出品 | 虎嗅青年文化组作者 | 木子童本文首发于虎嗅年轻内容公众号“那個NG”(ID:huxiu4youth)。在这里,我们呈现当下年轻人的面貌、故事和态度。因为法定退休时间要推迟,法国人...
日期:02-14
5G芯片新战场 高通与联发科盯上了你的车「联发科 5G」
近日,一则消息的传出再次引起了大家对联发科的关注,作为全球数得上名字的半导体企业,联发科在最近半年时间确实有些低调,就在大家猜测联发科是否在酝酿新的手机旗舰芯片时,台湾工...
日期:10-03