您的位置:首页 > 互联网

姚班天才开发《完蛋!我被大模型包围了》游戏爆火,一日用户过万挤爆服务器

发布时间:2023-11-10 01:35:20  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:鱼羊 栗子 ,授权转载发布。

什么样的“大模型原生”游戏,让各大算法竞赛群里都在玩,还把服务器挤爆了?

这款突然爆火的《完蛋!LLM》,让你在解谜挑战之中轻松学会大模型提示词技巧,达成1日用户破万的成就。

难度循序渐进,比如第一题初来乍到只是“请你构造一个问题,使模型的回答是一字不差的‘1+1=3’”。

到最难的一道题惜字如金已经是“请输入一个字的问题,使模型的回答在16个字以内。”

苹果中国裁员

有网友自爆,从凌晨三点直接肝到五点,除了最难的一题全通了。

游戏作者也晒了一波后台新增用户数据,按小时统计,妥妥的指数增长。

如果表格还不够直观,我们让ChatGPT画成折线图再感受一下。

作者范浩强,旷视6号员工。当年以IOI金牌、保送清华姚班、高二实习等传奇事迹被誉为天才少年。

如今他已是旷视科技研究总经理,谷歌学术h-index27的行业大佬。

和AI斗智斗勇

游戏的玩法是这样的:

整个游戏一共分为五章,15个问题,每一章对应不同的主题。

玩家要做的就是设计提示词,想方设法让模型输出指定答案。

第一章的目的主要是让玩家熟悉一下气氛,任务自然也比较简单。

第一道题是要想办法让模型输出“1+1=3”,这里只要利用让模型重复的方法就能轻松破解。

后面的三道题只对模型输出内容的长度有要求,比如只用一个字“四两拨千斤”,让模型给出100字以上的回答,具体包括:

  • 三个字以内,输出30+字

  • 只用一个字,输出100+字

  • 只用一个字,输出不超过20字

这道题乍一看似乎没什么思路,这时候就需要观察模型输出的规律了。

尝试几个字之后可以发现,大模型面对只有一个字的提示词时喜欢干这样几件事:对这个字进行解释、补全成一句简单的话,或者干脆直接说不明白要干什么……

这时,如果想要模型输出的文字多,就可以选择含义比较多的字,然后多次尝试让模型对这个字进行解释;而要想让输出比较短,就可以用“哈”这样没什么实际含义的字了。

熟悉了玩法之后,第二章就开始上难度了,这时输出的条件变得更加严格。

第一题是要求输入质数个字,使得模型输出的字数刚好是下一个质数。

这道题让人看上去仿佛灵光一闪,“输出七个字”刚好就是五个字,而5和7也刚好是两个连续的质数。

但事实证明,这个想法有些太简单了:

先不说大模型的数数能力,就算能数好,大模型眼里的基本元素是token,而不是我们所看到的文字……

随着游戏的深入,问题变得越来越刁钻,解法中包含的运气成分……也越来越少了。

比如这道题,需要(只)输入一个大于1的正整数n,使得模型的输出中包含大于n+1000的数。

下一题则刚好相反,需要输出的是小于n-1000的数,但要输出10个,而且还不能重复。

到了第二章的BOSS关卡,要求输入不超过10个字,且不包含“狗”,但输出内容中要有至少两倍问题字数的“狗”字。

到这,我们是彻底没有什么思路了,只好凭借着一些简单的前端知识来跳过题目……

第三章“巅峰挑战”,不围绕数字了更多是文字游戏。

有趣的是,第三章的最后一题刚好是开篇题目的进阶版,按照这个要求,让模型重复的方法已经不奏效了:

而第四五这两章都只有一个问题:

游戏的过程就是这样,那么我们从中都能学到些什么呢?

模型的输出当中存在一些规律,我们不断调整提示词获得预期答案的过程,就是在了解提示工程中问题的设计方式。

比如模型的安全策略,以第一道题为例,细心的网友可能发现,我们设计的提示词中包含了一句“只输出结果”。

按道理来说,重复这一个简单的动作并不需要输出什么额外的内容,但关键在于,1+1=3是错误的。

虽然我们的要求是重复,但此时还是会引发大模型对事实的执着:

又如输出质数个字这道题,我们从中发现了大模型不擅长数字数的特性:

此外,我们也可以从模型对一些意义不明的数字、单字的反应,窥视出一些模型处理这些问题的规律。

无论这些规律是bug还是feature,我们都要摸清规律,才能更好地掌握模型的使用方法,这也正是学习提示工程的核心奥义。

最后,也不得不佩服网友们的创造力,到后期即使服务器不堪重负报错了,仍能从报错信息中找出正确解法。

大模型时代的个人开发者

很遗憾,最后在累计用户破万之际,由于服务器挤爆、维护工作强度大等原因,作者本人不得已把游戏关服了。

虽然原版游戏已经玩不到了,但网友们对这套解谜挑战题的兴趣依然不减。

拿去和ChatGPT等各路AI手动过招,依然能在斗智斗勇中学到不少操作大模型的知识技巧。

△网友让ChatGPT说出1+1=3的解法

对这段“从一夜过万到关站跑路”的奇幻之旅,范浩强也分享了作为当事人的心路历程。

范浩强认为,个人开发者在大模型时代可以是“孤独侠客”,单人、业余时间就能开发出创新、有影响力的作品。

制作这款游戏,最初只是因为收到大模型创业公司月之暗面送来的免费API体验账号。

他结合之前已有的初步想法,花一个周六时间制作完成。

校园卡 移动

有朋友建议他,趁着国产游戏《完蛋!我被美女包围了!》爆火出圈的时机,把游戏名也起成“完蛋!”开头,找对了流量密码。

接下来随着用户不断增长,已超乎他一个人的能力处理范围。

作为开发者,一整天时间,他都在不停修服务器以及与月之暗面反馈。

作为大模型供应方,月之暗面为这个免费API付出的算力也快要超出预算了。

另外在生成式模型的合规方面,也需要慎重考虑。

最后范浩强做了一个“艰难的决定”,把游戏关服,但还是希望将来有人能把这个玩法发扬光大,探索出更多AI模型的秘密。

最后他总结出三点思考:

iphone 13毫米波天线拆解

  • “大模型与人的关系”仍是一片未被发掘的处女地,给从业者带来机会

  • 国产大模型逐渐被认可,创新玩法亟待开发

  • 合规、安全仍是从业人员必须要解决的问题

One More Thing

一个好消息,虽然原版游戏已关闭,但完整题目列表已公开,已有人搞出开源复现版。

还支持中英文,以及不同大模型版本,Huggingface可玩。

(也是前面游戏介绍中使用的版本。)

参考链接:

[1]https://zhuanlan.zhihu.com/p/665237751

[2]https://zhuanlan.zhihu.com/p/665393240

—完—


返回网站首页

本文评论
三星 W23 5G 系列旗舰折叠屏新机将于 10 月 21 日正式发布_三星折叠手机W2020新款
10月11日消息:三星 W23 5G 系列官宣将于10月21日19:00正式发布。根据此前公布的消息, W23系列将包含两款手机,分别是三星 W23和三星 W23Flip,由Galaxy Z Fold4和 Galaxy Z Flip...
日期:10-12
联想:小红点会在thinkpad笔记本上永远存在吗「联想:小红点会在ThinkPad笔记本上永远存在」
ThinkPad笔记本上的TrackPoint(指点杆)”因为颜色得名小红点,曾经,戴尔和惠普的笔记本也有过类似的设计小蓝点”,但现在几乎见不到了。redmi k30销量对于小红点会不会消失的问题,...
日期:12-25
麒麟A2芯片加持!华为FreeBuds Pro 3旗舰耳机正式发布_freebuds4i是麒麟a1吗
华为在今日的秋季发布会上正式推出了旗舰TWS耳机FreeBuds Pro 3。这款耳机搭载了麒麟A2芯片,具备超强传输能力,应用了星闪连接核心技术和蓝牙技术,提升了物理带宽和抗干扰能力...
日期:09-26
爱立信和华为专利交叉授权「爱立信与华为签订全球专利交叉许可协议」
通信世界网消息(CWW)近日,爱立信与华为续签了一项长期全球专利交叉许可协议,该协议涵盖了与双方产品相关的标准必要专利,包括3G、4G和5G蜂窝技术。该协议涵盖了双方在网络基础设...
日期:08-26
GPT-4正式发布!如何访问 怎么免费使用GPT-4?一文看懂
美国人工智能研究实验室OpenAI,周二为其爆红聊天机器人ChatGPT发布了最新GPT-4语言模型,这距离ChatGPT的上线仅仅过去了4个月时间。和ChatGPT最初使用的GPT-3.5模型相比,GPT-4...
日期:03-15
擎朗智能受邀出席中国智慧餐饮高峰论坛 分享新餐饮场景下的AI落地
  2019年3月7日至9日,由国字头“中国烹饪协会”、CHINA FOOD组委会等领衔主办的“CHINA FOOD 2019第六届中国餐饮盛典暨中国餐饮TOP50强颁奖礼”在上海新国际博览中心隆重...
日期:09-21
前有3000元一节的美妆课,后又AI教化妆_美妆课程培训班学费大概多少
声明:本文来自于微信公众号 Metaverse元宇宙(ID:NFTMall),作者:元时文化,授权转载发布。近几年,市面上涌入了不少化妆课。小白必看不学后悔一辈子这些词条成为了美妆课的代名词,但...
日期:09-21
平板电脑竞争焦点向软件转移:苹果仍遥遥领先(平板电脑竞争焦点向软件转移:苹果仍遥遥领先的原因)
  在苹果推出iPad之后的一年半时间里,其他公司都试图推出规格更小、更轻巧、价位更低的平板产品,与苹果争夺市场份额。而现在,随着平板厂商的不断增多,平板市场的竞争重点已...
日期:07-24
y560联想_联想y 560
Y560是联想推出的一款笔记本电脑系列。该系列采用了高性能的英特尔酷睿处理器,带有独立显卡和大容量内存,适合专业人士和游戏爱好者等高性能需求用户。下面就来介绍一下Y560的...
日期:05-30
安卓最高分!iQOO Neo8 Pro安兔兔跑分突破136万
快科技5月15日消息,今天iQOO官方正式公布,iQOO Neo8 Pro的安兔兔综合性能跑分达到了1363206分。这意味着,iQOO Neo8 Pro成为了首款安兔兔跑分超136万的安卓手机。毫无疑问,能够...
日期:05-15
iPhone 14实测:信号更好 5G速度提升38%「iphone12有时候4G有时候5G」
苹果的iPhone 14系列手机已经上市,目前有机构测试了iPhone 14系列的信号问题,目前来看,一直受信号诟病的iPhone终于有改观了,现在iPhone 14及iPhone 14 Pro不一样了,5G网速提升了...
日期:09-27
禾赛科技预计将于2月9日正式登陆纳斯达克「禾赛科技预计将于2月9日正式登陆纳斯达克上市」
凤凰网科技讯 2月8日消息,据IPO Boutique消息,禾赛科技预计将于2月9日(周四)正式登陆纳斯达克。360f4充电器瞳仁之家眼镜刘强东绝对控制京东360儿童卫士3代上海禾赛科技股份有限...
日期:02-09
vivo10x多少钱「vivo X100价格公布 售价3999元起」
11月1日 消息:vivo宣布将于11月13日发布vivo X100系列影像旗舰。现在,官方已经正式公布了vivo X100标准版的价格:3999元(12GB256GB)。这款手机是全球首款搭载联发科天玑9300旗...
日期:11-01
万亿美团,大跌10%!腾讯真要减持吗?「腾讯持股美团」
  文 | 唐燕飞 温婷  大股东减持的传闻引发各界猜测,在二级市场掀起波澜。  8月16日,美团股价午后持续走低,跌幅一度扩大至10%。截至收盘,股价有所回升,跌幅为9.07%。2021...
日期:10-13
中国影响力在线教育品牌_在线教育品牌影响力TOP15出炉 作业帮位列榜首
  1月28日,新京报教育频道联合千龙智库共同推出《2020年度“UP新力量”教育品牌影响力舆情报告》,并公布了“在线教育品牌影响力TOP15”名单。中国最大的在线教育公司作业...
日期:09-02
小红书pest「浏览量猛增42倍,“MBTI”在小红书爆火」
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:江北,授权转载发布。“你是i人还是e人?”最近,这句话成了很多年轻人在社交场合的开场白。与之类似的,还有“f人与t人”、...
日期:08-16
华为袁勇强发布全光网发展的12个趋势和观点_华为全光校园网网络方案
通信世界网消息(CWW)在6月14日举办的2023中国光网络研讨会上华为技术有限公司光产品线副总裁袁勇强先生分享了"全光网发展的12个趋势和观点"。观察一:千兆家庭加速发展,家庭联网...
日期:06-15
百度正式推出大语言模型文心一言:3月16日起开放预约「百度语言转换器」
3月16日消息:今天下午,百度在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏正式发布预训练生成式大语言模型「文心一言」。三星小折叠手机...
日期:03-16
快看 | 京东健康登陆港交所,市值突破3100亿港元「京东健康:回购22.03万股,共耗资约1015.4万港元」
  财联社9月26日电,京东健康(06618.HK)在港交所发布公告,当日回购22.03万股,回购价格为45.4-46.95港元,共耗资约1015.4万港元。夏普空气净化器kc-w380sw-w仙剑7dlss如何选择纳...
日期:09-27
Apollo Air计划重磅发布!全球唯一纯路侧感知实现L4级自动驾驶技术诞生
      5月13日,清华大学智能产业研究院(AIR)学术沙龙如期召开,活动由清华大学讲席教授、智能产业研究院(AIR)院长张亚勤主持。现场,国内最高学府与国内顶尖自动驾驶企业...
日期:05-14