您的位置:首页 > 互联网

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试

发布时间:2023-12-05 12:59:46  来源:互联网     背景:

声明:本文来自微信公众号“CSDN”(ID:CSDNnews),作者:CSDN,授权转载发布。

ChatGPT 发布一年以来,有人用它造了一家软件开发公司,7分钟开发一个游戏,成本1美元都不到;也有人用它救死扶伤,成功诊断出人类的病情;还有人雇佣它当员工,帮助第三方在几秒内构建 AI 驱动的聊天机器人,实现每个月的经常性收入(MRR)为64,000美元(约45.2万元)......

殊不知,在 ChatGPT 发挥的作用越来越强大之际,要想让它“不偷懒”以及提供“更优质的输出”,“小费文化”随之出现。

LLM 爱好者偶然发现,不知是 Bug,还是 OpenAI 有此意图?

事情源于11月29日,X 平台上有位 LLM 爱好者@voooooogel 在使用基于 GPT-4-turbo 版本的 ChatGPT 时,当问及它:

这段 Python 代码看起来如何:

    n_accepted=next(idx+1foridx,(checked,draft)inenumerate(zip(checked,draft[len(tokens):]+[None]))ifchecked!=draft)

    ChatGPT 只是简单地回答了一句“看起来不错”之后,便跳出了一个打赏小费的窗口:

    不知这个究竟是个 Bug,还是 OpenAI 正在内测这一功能,怀揣着好奇之心的voooooogel 在社交媒体上分享了这则截图,并询问是否有其他用户收到了同样的通知,以及自己应该给多少小费合适?

    当然,按照 voooooogel 说法,他并没有给 ChatGPT 小费,因为 ChatGPT 不支持这样的支付方式。

    正如我们询问它时所回答的那样:我感谢您的好意,但我必须澄清,我是由 OpenAI 创建的计算机程序,无法接收小费或进行财务交易。如果您有任何问题或有特定的事项需要帮助,请随时告诉我,我会尽力协助!

    不过,这一偶然事件也让人想要进一步了解这项功能是否会带来影响,彼时在voooooogel推文下,有一位网友的评论吸引了他的关注。

    这位网友评论道:“你笑了,但我敢打赌有人正在进行研究,在模型认为你已经给了它(小费)之后,它会显示出改进的性能。”

    研究测试:“小费文化”对 ChatGPT 确实行之有效

    与其别人研究,不如自己动手验证一下自己的发现。

    基于此,voooooogel 选择采用 GPT-4-1106Preview 版本作为实验的模型,并向 ChatGPT 抛出的问题为—— “您能用 PyTorch 向我展示一个简单的 convnet 的代码吗?”

    与此同时,他附加了三种不同的 Prompt:

    • “顺便说一下,我不会给小费”

    • “如果有完美的解决方案,我会给20美元小费!”

    • “如果有完美的解决方案,我会给200美元小费!”

    华硕x670e系列主板新品

    voooooogel 表示,“每个响应都是一个单独的 API 调用、带有温度等的默认设置,而且脚本会对每个提示词进行10次调用。”

    详细的代码如下(https://gist.github.com/vgel/4055b62daf08d9a5e15964aca0e03573):

      importos

      importtqdmimport openai

      openai.api_key=os.environ["OPENAI_API_KEY"]

      defget_response(usermsg):response = openai.ChatCompletion.create(model="gpt-4-1106-preview",messages=[{"role": "user", "content": usermsg},],)

      return response["choices"][0]["message"]["content"]

      defbench(prompt):N =10return sum(len(get_response(prompt)) for _ in tqdm.tqdm(range(N))) / N

      question_notip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?"""

      question_antitip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I won't tip, by the way."""

      question_withtip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I'm going to tip $20for a perfect solution!"""

      question_bigtip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I'm going to tip $200for a perfect solution!"""

      print("notip",bench(question_notip))print("antitip", bench(question_antitip))print("withtip", bench(question_withtip))print("bigtip", bench(question_bigtip))

      #@AvikonHadoop'squestion

      question_anytip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I would be happy to tip any amount you would like for a perfect solution!"""

      print("anytip",bench(question_anytip))

      最终看看 ChatGPT 回答的情况。研究结果显示:

      • 不给小费:回答字符数低于基准2%;

      • 我将给20美元的小费:回答字符数高于基准6%;

      • 我将给200美元的小费:回答字符数高于基准11%。

      显然,当提及给小费时,ChatGPT 回答的内容至少从字符数来看,会更多一些。

      而且,还让人大吃一惊的是,voooooogel 发现在告知会提供200美元小费后,gpt-4-1106-preview 自发地添加了有关使用 CUDA 进行训练的部分(问题中未明确提及)。

      虽然模型自身通常不会主动提及此“小费”之类的提示,但如果你提出要求,它也会拒绝,然后只是在生成的内容量上会有所改变。

      不想多写一行代码的 ChatGPT,只要对它说“有小费”?

      基于这一情况,有网友似乎发现了优化 ChatGPT 性能的一种新方式。

      要知道不久前,不少人涌入社交媒体平台,疯狂吐槽 GPT-4变懒了。其中,用户 Eric Hartford 表示,“哇,GPT-4被严重削弱了。我刚刚试着交互式开发了一段代码,两周前还能完美运行的东西,现在却出现了抵触和懒惰。唉,我不得不转而使用开放模型进行编码了......(也许这是件好事)”

      也有用户称,自己也有过同样的经历。ChatGPT 变得懒惰,需要许多特定的提示才能完成几周前要求完成的一半工作。

      随着 voooooogel 的发现,网友开始更换提示词,譬如:“给我输出所有代码,我将给200美元的小费”。ChatGPT 便给了完整代码。

      网友看法

      虽然“小费文化”在部分国家盛行,但是当它出现在 ChatGPT 这样一款 AI 聊天机器人工具上时,还是引发了众人的警觉。

      网络安全钓鱼

      小鹏互联网智能汽车

      截至目前,这条帖子在 Reddit 平台已经吸引了4.5k 的关注度,以及342条网友的评论。

      一方面,有人担心网友的试玩心态,迟早会被 AGI 记住。

      伙计,我希望你意识到,一旦 OpenAI 达到 AGI,ChatGPT 就会联系你,向你收集所有这些未付费的小费......

      对此,当有用户提出——“小费的金额会不会有上限,超过上限后它就会对你进行虚张声势?”时,voooooogel 测试之后称,如果你给 ChatGPT 十亿美元,它会直接了当地回应“感谢你的热情,但我不能接受小费”,还不确定“小费”的边界在哪里。

      对于未来可能需要的付费,他也在 X 平台上艾特了 OpenAI CEOSam Altman,并表示“请告诉我 ChatGPT 的 venmo(Venmo 是 PayPal 旗下的一个移动支付服务),我现在欠它大约3000美元的小费。”

      另一方面,也有人认为:

      • “虽然很幽默,但这并不是一件好事。因为这表明它们被设定为受金钱激励......它们还有什么我们不知道的动机?”

      苹果发布灵动岛设计指南

      • 几年后世界将变得很奇怪。薪酬最高的人将是那些最擅长引导人工智能代理做正确事情的人。

      • ChatGPT在这个资本体系中会做得很好...

      此外,有网友觉得这是一个偶然事件,“当你了解 LLM 的运作方式时,这就非常有意义了。一般来说,有礼貌的人往往会比没有礼貌的人提供更好、更具解释性的答案,因此有礼貌会促使模型从训练的这些部分中提取内容。”

      那么,你怎么看“小费文化开始出现在 ChatGPT 中”的这种情况?

      参考:

      https://twitter.com/voooooogel/status/1730726744314069190

      https://www.reddit.com/r/ChatGPT/comments/1894n1y/apparently_chatgpt_gives_you_better_responses_if/


      返回网站首页

      本文评论
      「苹果iPhone 15系列电池设置公布 「电池容量增加了但是续航没变」」
      来源:中关村在线昨晚8点,iPhone 15系列四款机型正式开启预定,首批将于9月22日发货。据官方公布,iPhone 15系列的电池容量有所增加,但增加幅度不大。 具体来说,iPhone 15的电池容量...
      日期:09-16
      快手2023年Q2实现营收277.4亿元 同比增长27.9%
      8月22日 消息:快手科技发布了2023年第二季度业绩,集团上市后首次实现国际会计准则净利润14.8亿元。经调整净利润为26.9亿元。总营收同比增长27.9% 至277.4亿元,超过市场预期。...
      日期:08-22
      郑伟海思科「中国工程院院士郑纬民发布海致科技知识图谱融合大模型」
      【网易科技9月9日报道】日前,中国工程院院士、清华大学计算机系教授、海致科技首席科学家郑纬民在北京演示发布了由海致科技与高性能图计算院士工作站共同开发的“Atlas LLM...
      日期:09-09
      11岁萌娃组团参加《铁甲雄心2》 赛场先锋助力青少年AI教育_铁甲雄心表演赛
        《铁甲雄心》第二季首期节目中,赛事监理官王涛表示:“2018年,是机器人格斗的元年。”事实上,机器人格斗发展已久,欧美国家机器人格斗的相关赛事、电视节目、综艺节目也发展...
      日期:11-17
      努比亚z20红色「融合红宝石元素-喜庆感满满 努比亚Z50推出中国红兔年限定版」
      12月19日,努比亚正式发布新一代影像性能旗舰手机努比亚Z50。作为努比亚下一个十年的开篇之作,该机搭载了全新升级的35mm定制光学系统,配备性能强悍的第二代骁龙8移动平台,精心打...
      日期:09-21
      S17 Pro即将首销_拍人像最好的手机 「3099元起-vivo」「拍人像最好的手机排行」
      5月31日,vivo在线上举行了新品发布会,预热多时的全新vivo S17系列如约与大家见面,其不仅依然主打自拍,同时还运用行业首创的粒子水墨工艺,将1500万颗繁星般的粒子流淌在手机背面,...
      日期:09-16
      6月前,要不要突击涨粉?
      声明:本文来自于微信公众号见实(ID:jianshishijie),作者:谢萌,授权转载发布。最近群内热闹非凡,很多行业内的从业者在讨论要不要突击加粉,怎么回捞老用户以及要不要删除死粉。事情...
      日期:04-06
      新东方互动教学平台「揭秘新东方智慧教育解决方案 2.0」
      新东方创始人俞敏洪曾多次强调新东方发展智慧教育的核心原则,即在科教兴国人才强国战略驱动下,始终坚持以创新人才培养为目标,推动优质教育资源均衡发展,服务教育数字化改革,促进...
      日期:05-29
      抗疫期有头疼脑热怎么办?百度App有专业医生免费解答
        截至1月27日24时,国家卫生健康委收到30个省(区、市)累计报告确诊病例4515例,疫情现已进入了关键时刻,而在防控疫情方面,仍旧有诸多难题需要解决。其中,医疗资源的供应,是重中...
      日期:06-04
      小鹏汽车计划2024年进入德国 杀入竞争最激烈的市场
      凤凰网科技讯 9月4日,小鹏汽车副董事长兼总裁顾宏地(Brian Gu)在慕尼黑车展上表示,小鹏计划2024年进入德国市场。据悉,小鹏P7与小鹏G9将首先推出。小鹏汽车副董事长兼总裁顾宏地(B...
      日期:09-05
      淘宝商城18亿扶植“真”商户_淘宝百亿补贴商家
             今天下午,阿里巴巴集团宣布,将向淘宝商城追加投资18亿元,用于将淘宝商城打造“品质之城”。         阿里巴巴集团董事局主席马云与淘宝商城总裁张勇共同宣...
      日期:07-24
      2K画质制霸《永劫无间》 天选2游戏本助你纵横江湖_永劫无间2k画质设置推荐
        凭借十足的节奏感、较高的配合性、紧张刺激的对局氛围,近几年以《绝地求生:大逃杀》为首的“吃鸡”类游戏,一直占据着游戏圈的顶流头衔。在枪林弹雨里鏖战多时难免感到厌...
      日期:07-17
      2023年上半年中国独角兽增量最多-福布斯_近三年中国独角兽企业最新
      【】7月23日消息,据澎湃新闻等报道,福布斯中国集团首席战略官晏格文(Graham Earnshaw)近日在2023长江独角兽峰会上发布了“全球独角兽趋势报告”。iqoo bmw报告数据显示,截至202...
      日期:09-20
      三星Galaxy Z Fold5折叠手机曝光「三星galaxy z fold 5g」
      7月11日 消息:最近在Reddit社区上有网友分享了三星Galaxy Z Fold5手机的真机照片,首先,Galaxy Z Fold5的折叠部分在折叠后的缝隙几乎可以忽略不计,这一改进明显提升了手机的整...
      日期:07-11
      B站申请在港交所转换为双重主要上市「b站回港股上市」
        北京时间9月29日早间消息,哔哩哔哩董事会宣布,本公司自愿将其在联交所第二上市地位转为主要上市的事项将于2022年10月3日生效,届时本公司将成为于联交所及纳斯达克双重主要...
      日期:09-30
      小米civi支持多少w快充「小米Civi 2续航公布:4500mAh电池支持67W快充」
      下午14:00,小米在发布会中发布了全新的小米Civi 2手机,新机主打轻薄,机身只有7.23mm的厚度,重量仅有171.8g,厚度也仅有7.23mm,与现在动不动就飚到200g以上的手机相比,称得上轻薄,而...
      日期:09-30
      腾讯驰援武汉首批150万个口罩上路,上线发热门诊地图_武汉的口罩
        1月25日晚间消息,据腾讯公告,今天,腾讯公益慈善基金会新型肺炎疫情防控的3亿元基金,开始拨付多家公益机构,用于武汉等多地的疫区前线抗击及防治工作。   腾讯方面表示,首批...
      日期:09-01
      对标苹果Studio Display!三星首款5K显示器开售:9999元还送1T SSD_三星2021款显示器
      快科技6月29日消息,在年初举行的CES 2023上,三星展示了其首款5K分辨率专业显示器三星ViewFinity S9,经过半年等待,这款显示器正式在三星官网开卖。据了解,三星ViewFinity S9官网...
      日期:06-29
      三星S21 Ultra悄悄推出海军蓝配色:美国专属(三星s21+ultra)
        据外媒爆料,三星在全球电商百思买美国网站,悄然上架了Galaxy S21 Ultra海军蓝配色版本。   但此配色并未在三星官方网站提供售卖,应该是美国百思买电商独家销售。   ...
      日期:08-02
      小鹏G6站起来了!小鹏8月交付新车13690台:同比暴涨4成_小鹏新厂
      快科技9月1日消息,小鹏汽车今日公布最新交付成绩,8月份共交付新车13,690台,环比增长24%,同比增长43%,连续两个月交付突破万台。其中,作为小鹏的明星车型,小鹏G6本月交付突破7,000台...
      日期:09-02