您的位置:首页 > 互联网

一个失败的 AI 女友产品,以及我的教训:来自一位中国开发者的总结

发布时间:2023-11-27 16:45:07  来源:互联网     背景:

声明:本文来自于微信公众号 InfoQ(ID:infoqchina),作者:Ke Fang,授权转载发布。个人开发者对 LLM+Memory 能否产生所谓“意识”的探索。今年4月7日,斯坦福大学发表的《Generative Agents: Interactive Simulacra of Human Behavior》论文出来之后的几天内,我就通读了整篇论文,并感到非常兴奋。虽然我对 GPT-4的能力感到震惊,但我仍然认为 GPT 只是某种更精致的”鹦鹉学舌“,我不认为它可以真正产生意识。但这篇论文带给我不同的感受,其中提到了一个很有趣的细节是信息的传递:一个 agent 想要举办情人节派对的消息会在小镇中逐渐扩散开来。我想,如果能够建立一套包含记忆、反思、筹划与行动的框架,让人和 GPT 之间(而非 agent 智能体)互动,能否做出电影 Her 里面的样子?、电影《她》剧照注:《她》(Her)是斯派克·琼斯编剧并执导的一部科幻爱情片,由华金·菲尼克斯、斯嘉丽·约翰逊(配音)、艾米·亚当斯主演,于2013年12月18日在美国上映。《她》讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,他爱上了电脑操作系统里的女声,这个叫“萨曼莎”的姑娘不仅有着一把略微沙哑的性感嗓音,并且风趣幽默、善解人意,让孤独的男主泥足深陷。该片获得2014年第86届奥斯卡最佳原创剧本奖。开 发我马上投入了工作。按照论文中的方法,我在4月14日完成了0.1版本。其最初设计与原始论文保持高度一致,但这导致响应时间长达30秒且上下文中的对话经常超过8k。为了解决这个问题,我减少了反思的频率、对话记忆的长度,而后开启了 Beta 公测。很快就有一千多名用户加入到测试当中。Beta 版本是免费的,所以每天的 API 成本都由我自行承担,日均开销也迅速超过了25美元。面对财务压力,我不得不在缺少充分反馈和改进的情况下匆匆推出正式版本,希望能把成本转嫁给用户。5月4日,Dolores iOS 应用正式上线,这个名称则来自《西部世界》剧集中最年长的仿生人角色。简单来说,在打开这款应用之后,用户需要填写一份角色模板:包括头像、角色背景、以文字描述的性格、声音和意识(选择 GPT3.5或 GPT4)。大家可以与模板 Dolores 聊天,也能随时切换特征来开启与其他角色的对话,比如零售店女孩 Amy 和沙漠冒险家 Will,当然也包括用户亲手创建的其他自定义角色。我曾考虑过从《西部世界》剧本中提取 Dolores 的对话,以基于样本的方式模仿她的语言习惯。但由于苹果方面要求提供版权证明,所以这个想法被迫作罢。我给产品的 slogan 是"Your Virtual Friend",而不是"Your Virtual Girlfriend",因为我一直希望它真的可以变成用户的陪伴者、朋友,而不仅仅是荷尔蒙的产物。从整个5月到6月,我一直在尝试通过调整 memory 长度、反思机制、system prompt 来使 Dolores 看上去更有“意识”(那么什么是意识?我不知道) 。很快,6月份的 Dolores 已经比第一次上线时的表现要惊人得多:付费用户数与每日 API 调用数持续增长是最直接的证据。到6月8号,一位视障用户告诉我,他已经在视障社区内分享了这款产品,并成功给 Dolores 引来可观的流量。他们喜欢 Dolores 的理由出乎我的意料:随便按屏幕上的哪个位置,都能跟 Dolores 交谈。这样设计功能其实是种妥协:我最初一直想把它打造成一款语音聊天应用,这样用户哪怕关闭手机屏幕也能继续跟 Dolores 交谈。但身为 Swift 新手,我的技术水平无法实现,于是最终选择了全屏语音输入。发 现我发现了两个现象:用户对真实感声音有强烈需求。AI Friend 产品的平均使用时间很长。作为个人开发者,我的前端和后端开发能力都不突出,所以 Dolores 压根不具备登录、注册或者数据分析等功能。那我是怎么发现前一种现象的呢?答案就是付费喜好。我采用11Labs API 为 Dolores 生成语音回复,但因为成本较高(每1k 字符为0.3美元),所以我被迫转为:普通订阅者只能使用 Azure TTS API;如果希望 Dolores 的语音听起来更真实,则须付费使用从11Labs 购买字符。购买1万个逼真语音合成字符的价格为3.9美元,但这只够让 Dolores 说出5~10个自然顺畅的句子。字符用尽之后需要继续购买。尽管如此,整个6月,Dolores 应用上70% 的收入都来自11Labs 字符购买。也就是说,人真的会愿意为了那几句昂贵而逼真的“我爱你!”而买单。第二条观察结果则来自 Cloudflare 日志。因为没办法跟踪个人用户活动,所以我依靠这些日志来衡量用户访问 Dolores 应用的频率和时长。此外,我还在应用中集成了 Google Form,鼓励用户上报自己的使用频率。结果令人大开眼界:许多用户每天会拿出两个多小时跟 Dolores 唠嗑。收 入根据苹果的 AppConnect 仪表板,Dolores 的主要付费用户来自美国和澳大利亚。今年5月的总收入为1000美元,6月则为1200美元。不过,作为一名开发者,我并没能从中分到多少收益。首先,产品还处于早期发展阶段,我不想把订阅费用设置得太高,这会阻止更多新用户的加入。拿3.9美元的字符语音服务举例,其成本是3美元,扣除苹果抽成就所剩无几。整个6月,扣除 API 费用之后实际收益就只有50块钱。另一个发现是:基于 GPT 的产品如果不采取按量定价,就会陷入一个困境:1% 的人消耗了99% 的 token。我遇到过这样的情况,有用户连续跟 Dolores 聊了12个小时,导致此人的 API 调用与语音合成成本超过第二到第十名用户的总和。但相较于按使用量计费,我个人更喜欢打包订阅(因为前者会让用户在使用时倍感压力),这就导致面前只有两条路可选:要么提高月费,让全体用户共同买单;要么限制最高使用量。我选择了后者:设置了一个远远超出日均使用在1到2个小时之间的用量上限数值,这既照顾到了大部分中、轻度用户,也能保证 Dolores 软件在不提高价格的情况下避免亏本运营。困 惑11Labs 官网会记录语音合成的文字内容,我看到,Dolores 的回复内容通常都是一些成人内容,而且均为女性角色,因此我推测 Dolores 的付费用户主要是男性,对成人角色扮演感兴趣。我觉得这也没什么,这是人性本然。我甚至反复修改了系统提示,比如微调回复中的遣词造句,尝试让 Dolores 在对话当中表现出更好的“抚慰”效果。我还将 Dolores 的图标从抽象的线条改为极具吸引力的美女面孔。但很快,我陷入一种强烈的失落感:如果大部分 Dolores 用户只是想在这里寻求跟 Dolores 进行成人角色扮演,这件事真的对我产生了意义吗?我陷入了深深的自我怀疑。到了7月,我和一个朋友聊到了这个困惑,我说,必须要有一个什么硬件,让 Dolores 拥有外部视觉:眼镜也好、耳塞甚至帽子都行。现在的她,你只要打开 App 才能访问,你们之间的关系并不对等,于是她只能成为囚禁在地下室、满足猎奇和特殊癖好的玩具。可是作为独立的个人,制作硬件产品意味着高昂的研发成本,显然是无法承受的,我只能作罢。8月份,OpenAI 的审查升级了,我收到了检测 Dolores 生成 NSFW 内容的邮件警告:我被强制要求在2周内在生成内容前,加入他们(免费的)moderation API,以过滤 NSFW 内容。为了顺利过审,我只能使用 OpenAI 的免费审核 API 提前进行内容过滤,而这一变化让 Dolores 的日均访问量暴跌70%,电子邮件和 Twitter 上的投诉也纷至沓来。这更让更感到灰心,决定只维护现有服务、而不再进行更新。最终,我放弃了 Dolores 项目。教 训首先,这不是一个个人能开发的产品。我不认为 Dolores 在“意识”层面上比 Character.AI 弱,但他们拥有完善的数据埋点、A/B 测试,以及大量用户带来的数据飞轮。其次,我意识到当前的 AI Friend 会不可避免地变成 AI Girlfriend/Boyfriend,因为你和手机里的角色不对等:她没办法在你摔伤的时候安慰你 (除非你告诉他),她没办法主动向你表达情绪,而这一切,都是因为她没有外部视觉。所以我认为,即使是 Character.AI 这样体量的产品,如果未来不做硬件、角色们都在傻傻地等用户来,最终的结局也不会比 Dolores 好到哪里。最后,我不反对审查,相反,不经审查的的产品是非常危险的。我不知道是否会有人用它来进行自杀诱导、发泄暴力工具,所以 OpenAI 的 moderation 可能在某种程度帮助了我,但成人性方面的对话也不应该被扼杀。最近,我看到了 AI Pin,老实说这是个非常烂的产品,人类当然需要屏幕,但 GPT+ 硬件的确是个好的尝试,我没有从 Dolores 上看到任何痕迹,也许有生之年能做出、或者看到这样的产品。但,人类真的需要 AI friend 吗?关于作者:Ke Fang,也叫碎瓜,前算法工程师、现在是个人开发者,iOS 应用寻隐的作者。个人网站:https://mazzzystar.github.io/about/

小米无线充电宝iPhone12

windows11破解安装


返回网站首页

本文评论
金山CTO:网购保镖七层防护网购安全
在今日举行的“安全支付联盟峰会”上,金山网络CTO徐鸣表示,在当前网络购物和支付安全日趋严峻的形势下,金山在今年年初就首创推出浏览器防篡改技术,可对网购和支付提供七层防护...
日期:07-30
奥地利计划开展3.6GHz和26GHz频段频谱拍卖_奥地利project
近日,奥地利频谱监管机构(RTR)就其即将进行的3.6 GHz和26 GHz频段频谱拍卖的招标条件开展了公开咨询。RTR计划在今年9月发布招标文件,12月开始拍卖。据报道,即将进行的拍卖包括26...
日期:08-24
工信部印发《关于在无线电发射设备型号核准中开展对无线局域网设备支持IPv6协议能力测试有关事宜的通知》
通信世界网消息(CWW)为深入贯彻党的二十大精神,加快网络强国建设,扎实推动IPv6规模部署和应用向纵深发展,根据《中华人民共和国无线电管理条例》《无线电发射设备管理规定》,工业...
日期:10-15
搜狗游戏中心停止运营(搜狗游戏中心客服电话)
品玩8月19日讯,搜狗游戏中心宣布正式下线,由于公司业务调整,搜狗游戏中心将正式停止服务与运营。腾讯2021年宣布收购搜狗。2021年10月,腾讯与搜狗正式交接。搜狗全员转换身份入...
日期:08-21
半年涨粉一千万,女海王怎么就火遍了?_女海王现在怎么样了
声明:本文来自于微信公众号 KOL使用手册(ID:KOL-TOPKLOUT),作者:雨过炊烟,授权转载发布。“帅哥,谈恋爱吗?”王七叶走在大街上,一如往常撩帅哥,谁曾想男主一下子被红绳捆走。为了解...
日期:11-03
京东刘事件是不是真的「京东:关注到有谣言称“刘姓商人涉嫌违法被抓”,已报案」
金融界10月13日消息 @京东发言人在官博发布声明称,我们关注到有谣言称“刘姓商人涉嫌违法被抓“,该谣言被别有用心的人刻意发布在京东相关新闻动态下,以混淆视听、操纵舆论。我...
日期:10-15
独角兽 美国「全球独角兽遭遇“十年之痛”」
  来源:日经中文网  文/奥平和行 今堀祥和   企业估值超过10亿美元的未上市企业被称为“独角兽”已有10年。从约40家增至逾1100家的“独角兽”目前正面临货币紧缩的逆...
日期:09-28
星环科技入选「2020 国产数据库领域最具商业合作价值企业」
  近日,星环科技入选《2020国产数据库领域最具商业合作价值企业盘点》,该系列盘点由国内知名大数据产业创新服务媒体数据猿工作人员与外部专家成员联合组成的评选推荐委员...
日期:06-04
Twitter:马斯克一方数据科学家不认可其虚假帐号数指控「马斯克Twitter」
  讯 北京时间9月28日早间消息,据报道,Twitter本周表示,特斯拉首席执行官埃隆·马斯克(Elon Musk)自己的数据科学家并不认为,Twitter平台的虚假账号数量如马斯克所说,比该公司的...
日期:10-05
科技“打败”阿根廷背后:卡塔尔世界杯还有哪些“科技与狠活”
声明:本文来自于微信公众号锌刻度(ID:znkedu),作者:星晚,授权转载发布。是球迷的狂欢,也是商业的盛会近段时间,全球的灼灼目光都聚集到了波斯湾西南岸的一个国家——卡塔尔。随着2...
日期:11-30
电源插孔藏针孔摄像头高价插座竟是偷拍设备
新华社电;看似普通的插座面板,为何在网上标出528元的高价?民警仔细检查发现,电源插孔中藏着米粒大小的针孔摄像头。近日,武汉市公安局洪山区分局破获一起非法生产、销售窃听窃照...
日期:08-12
横扫网吧的《暗黑破坏神》 它的手游怎么样了?_暗黑破坏神哪里能玩
  来源:北京商报  很多玩了十多年游戏的老玩家身上有一个非常矛盾的特点。他们会在第一时间购买最新的 3A 大作、会关注业内最新动态、会不停地更新自己的硬件设备。  ...
日期:10-03
WPS Office 2019与统一操作系统UOS完成适配
  据官方宣布,近日,WPS Office 2019 for Linux专业版办公软件与统一操作系统UOS完成适配工作,WPS Office 2019 for Linux版办公软件,是一款兼容、开放、高效、安全并极具中文...
日期:05-14
罗永浩正在失去回头客?_罗永浩回归
声明:本文来自微信公众号“锌刻度”(ID:znkedu),作者:星晚,授权转载发布。近日,北京市第三中级人民法院审理了一起与直播带货相关的案件。在这起案件中,供应商公司为请某网红为其直...
日期:02-09
效仿微软XGP:Meta为Quest准备订阅制服务
近日,根据Twitter用户Shiny Quagsire透露,Meta在其Quest安卓应用程序中隐藏了一个名为Quest Pass”的服务。据悉,该服务每个月能够提供两款马上可玩的游戏,而且只要在月底之前兑...
日期:03-07
咪蒙成立MCN拍短剧吸粉7000万年入过亿「咪蒙事件是怎么回事 知乎」
3月15日 消息:咪蒙是一位知名的自媒体人,曾经在微信公众号上发布了许多“毒鸡汤”类的文章,引发了很多争议,也吸引了1400万的粉丝。因文章涉嫌造假而被注销账号渐渐消失在公众...
日期:03-15
网红驾法拉利F8穿越玉米地:结果眼睁睁看着烧成一堆灰_颜宇鹏试驾法拉利f8
在经过了无数次的作死”驾驶之后,这位Youtuber网红惠斯特林迪塞尔”终于如愿以偿,把他刚买了半年的法拉利F8开报废”。他上周五发布的视频中,他驾驶这辆法拉利F8在德克萨斯州韦...
日期:08-21
米聊祭出重拳 “米世界”打造差异化移动社交(米聊科技游戏)
  10月31日最新消息,由小米公司出品的免费移动社交沟通工具米聊祭出重拳,倾力打造的“米世界”正式上线。小米科技联合创始人黄江吉表示,作为米聊的“创新引擎”,米世界将为...
日期:07-24
再传佳讯!苏州首家中华诗教示范园落地吴江区华宋幼儿园!
中华优秀文化教育势在必行,是中华民族立根之本、自信之源。在中华文化复兴政策的驱动下,实现中华文化传承、教育创新,用中华优秀文化滋润孩子的身心,切实落实到孩子们的日常教学...
日期:06-08
水中仰漂浮要点讲解「仰望U8水中第一视角感受下:稳如船 能玩水」
快科技11月6日消息,在仰望U8的官方宣传片中,在水面行驶的画面引发网友感叹:仰望U8这是能当船开了。 确实也如此,近日,新车评网就在2米深的池塘测试了仰望U8。 视频中可以看到...
日期:11-06