您的位置:首页 > 互联网

字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登「字节君 抖音号」

发布时间:2023-08-22 04:39:33  来源:互联网     背景:

克雷西 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

字节跳动版ChatGPT,现在人人可玩了!

网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。

并且无需排队,打开就能和这个名叫“豆包”的AI助手直接开聊。



是doubao.com不是douban.com噢~

消息一出,已经有不少胖友第一时间前往围(tiao)观(xi)。



我们也抓紧实测了一波~

与ChatGLM难分伯仲

先来看看豆包是怎么介绍自己的:



既然如此,我们就来试试这些“官方功能”靠不靠谱。

比如,我们挑选了几个有意思的错误机翻让豆包纠正,结果豆包给出的反馈还挺不错的:



尤其是“鸳鸯锅”的翻译,可以说是完胜Google和DeepL。



知识方面的话,当然要问一下“刁钻”的问题了:雷公电母放出的电是直流电还是交流电。

豆包的这个回答,可以概括成“不是直流电,而是直流电”,但前面说的还算可以吧。



抛开整活的话,豆包的开胃小菜的确给了我们一个不错的第一印象。

那么下面我们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。

具体的内容包括文案创作、逻辑推理、数学和代码四个方面。

文案创作方面,豆包说自己会撰写知乎、小红书等各种风格的文案。

我们不妨整个奇葩点的东西,看看它能不能创作得出来,比如……豆汁美式的小红书笔记。



文案搭配着emoji,连Tag都有了,看来豆包真的是懂小红书的。

不过你确定“醇香甘甜”这个词是用来形容豆汁的吗……

ChatGLM虽然写了很多,但是没审清题,把豆汁直接当成了豆浆……

(这么一看,豆包可能也理解成豆浆了,但是人家没直接说成豆浆啊)



看来豆包是有一定创作能力的,所以不妨再加大难度。

直接让它给“豆汁美式”的宣传片写个短视频脚本。



ChatGLM的版本细节则要丰富些,不过豆包的版本也算是五脏俱全了。



两者的文案创作水平不相上下,那么逻辑推理能力又怎么样呢?

我们找来了一道推理题目,这道题两位选手都没能做对(正确答案是甲3乙1丙2):



虽然都没做对,但是豆包的思路好像在往正确的方向上走了。

而ChatGLM的解答,反正我是没看懂。



这一环节对两者的表现也是很难评价,那么,马上进入一众大模型的噩梦环节——数学。

简单如鸡兔同笼这样的问题就不测了,我们直接上难度,拿一道高考题给他们试试。



△2023北京卷第16题

(图片我们没有输入,但没有图片也能解题;第一问是证明,我们也去掉了)

豆包使用的是纯几何方法,最后的答案是正确的,但很遗憾过程不对。

字节君 抖音号



△从红框开始出现错误

ChatGLM则使用了向量解法:



首先结果是错的,不过120倒是和60度互补,是出了些小问题吗?

但我们很快发现了华点:

这里不应该约等于就先不提了……两个正数相除你是怎么给约成个负数的……



标准答案是酱婶儿的,由于第二问要用到第一问的证明结论,所以把第一问的过程也放上来了:



如此看来,在数学修炼上,两位大模型选手都还有很大的进步空间。

那么面对大家喜闻乐见的代码问题,豆包又该如何应对呢?

先看比较基础的冒泡排序算法。



我们试着跑了一下(换掉了预设的数字),结果成功输出了答案:



接下来上LeetCode,我们先选了一个比较简单的把阿拉伯数字转换成罗马数字的题目。

豆包很快就生成了一段代码,还附带了解释:





而ChatGLM给出的代码是这样的(也附有解释):



运行的结果是豆包正确,ChatGLM错误:



不过稍微复杂一些的题目,他们就都做不对了。

除了设计算法,我们还想看看他们能不能用代码“画图”。

我们随机生成了两列数据,看看能不能搞个折线图出来:



结果用豆包的代码画出了这么个东西……



ChatGLM这边的情况嘛……好家伙,直接报错运行不了。



代码环节就先展示到这里了,用一句话说就是:都还得练。

看了这么多,想必读者朋友们已经有些累了,所以我们还准备了“餐后甜点”,来点轻松的内容。

弱智吧,开整!

Q1:萝卜到底能不能“开胃”呢?



“必要时寻求专业医生帮助”,这难道是在自己给自己做手术吗……

Q2:导盲犬禁止入内,是给盲人看得,还是给导盲犬看的?

豆包在A和B两个选项当中选择了C。



而问及“陨石为什么总砸中陨石坑”,豆包倒是说对了,只不过回答得有点复杂。



弱智吧的测评结果总结下来就是:AI还是太单纯,还没办法理解人类复杂的小心思。

字节跳动大模型开始发力

字节跳动选在这时候开放“豆包”测试,似乎有些令人意外。

但实际上,这个时间线倒推起来也不是无迹可寻:

在ChatGPT掀起狂澜的今年二三月,字节跳动就已有组建大模型团队的消息传出。

据36kr消息,其探索方向主要是语言和图像两类大模型,希望能将大模型与字节本身的搜索、广告等下游业务相结合。

但在当时,字节方面相关技术负责人的回应是:

技术中台在这些领域有探索,还很初期,不成熟。

此后的“百模大战”之中,字节跳动似乎并没有正式参战的意思,旗下云平台火山引擎,打出的也是“为大模型打造技术底座”、接入第三方大模型做大模型旗舰店商城的旗号。

直到6月份,字节跳动被曝开始内部测试一款AI对话类产品,代号“Grace”。

而Grace的网址“gracebot.cn”,现在会直接跳转到豆包官网。

虽然豆包本包并不承认自己就是Grace,但目前看来,豆包就是Grace的开放测试版本。



另外,“豆包”项目组的盆友向我们透露,豆包尚处于早期开发验证阶段。测试期还存在较多局限,生成的内容也可能不准确,欢迎测试用户们多提意见多反馈。

值得关注的是,最近,一个名叫BuboGPT的多模态大模型,在huggingface上上线了Demo。这一大模型背后同样有来自字节跳动的技术参与。

论文介绍,BuboGPT支持文本、图像、音频三种模态,能做到细粒度的多模态联合理解。

比如给它这样一张图片:



BuboGPT不仅能识别出青蛙和青蛙手里的班卓琴,还能总结出青蛙的具体动作、所处环境。

One More Thing

字节跳动终于出手,那么豆包这表现你给打几分?

话说回来,就在大模型渐渐走出每周都有新模发布的狂热期,国产大模型的先行者们,回答质量已经悄然进步了不少。

比如当初难倒众多大模型英雄汉的“爸妈婚礼不带我”问题,如今许多国产大模型都能回答得有理有据。



△上百度下讯飞

国产大模型的评判标尺,或许也已到了再上一个台阶的时候。

理想one总续航

所以,国产大模型百花齐放,是否也给到你新的惊喜了呢?欢迎在评论区与我们分享~


返回网站首页

本文评论
谷歌正在将生成式人工智能引入在线购物功能中「谷歌智能产品」
6月15日 消息:日前,谷歌正在将生成人工智能技术引入购物功能中,旨在比亚马逊等电子商务网站先行一步。据报道,这家Alphabet旗下的公司周三推出了一系列功能,旨在帮助人们了解衣...
日期:06-15
特斯拉中国召回超10万辆车:快看看有没有你的_特斯拉召回超28万辆汽车
终于,今天上午据市场监管总局公告,特斯拉即将召回进口Model S、Model X及部分进口和国产Model 3电动汽车。牵扯的车型如下,网友们快看看是否有你的车型搭载联发科g90的手机有哪...
日期:11-26
All in短视频?被传面临“生死大考”后,逛逛将改名“淘宝视频”
声明:本文来自微信公众号“新播场”(ID:New_bc),作者:场妹,授权转载发布。上线两年多、一直占据首页流量C位的淘宝逛逛,迎来了生死大考。近日,据媒体报道,淘宝逛逛被曝在年底之前被...
日期:06-29
2020中国国际电子商务博览会主题_2019年中国工业电子商务大会展位精彩预告!
  2019年11月14-15日,中国工业电子商务大会将在广州隆重召开,同期还将围绕工业企业电子商务应用、工业电子商务平台建设以及支撑服务等主题展示2019年中国工业电子商务...
日期:10-10
OpenAI联合创始人接受黄仁勋采访:GPT-4表现仍未达预期
近日,OpenAI联合创始人兼首席科学家Ilya Sutskever,与NVIDIA CEO黄仁勋进行了一次深度对谈。硅革命比芯片还重要在谈话中,Ilya Sutskever表达了自己对于GPT-4的看法。海尔技术...
日期:03-24
Intel游戏显卡半价卖 A380降至759「英特尔显卡2021」
近日intel的显卡有着很大的清仓活动,来自蓝戟的Arc A380 Index降到了仅仅759元,去年刚发布时还是1299元,基本相当于快半价了。百度2018年股价华为 氮化镓 超薄5g 进展Arc A380...
日期:06-03
惠普verizon平板8怎么样「惠普平板电脑推荐」
随着科技的快速发展,平板电脑已成为现代人生活中不可或缺的电子产品之一。惠普作为业内知名厂商之一,在平板电脑领域也有着出色的表现,下面就为大家介绍几款优秀的惠普平板电脑...
日期:05-30
iQOO 11S搭配200W快充 充5分钟玩3小时_iqoo160w快充
iQOO 11S定档7月4日19:00正式发布,今天官方宣称新机将会搭载200W超快闪充,充电5分钟,就能高帧玩王者3小时。仙剑奇侠传7音乐集iQOO 11S还搭载2K E6 144Hz全感屏,拥有517ppi,专业...
日期:06-29
GPT-4应开发者要求,使用SwiftUI开发出一款iPhone应用
IT之家 3 月 16 日消息,开发者利用 OpenAI 昨日推出的 GPT-4 大型语言模型,让其使用 SwiftUI 创建了一款 iPhone 应用程序。该应用程序的主要功能是,每天向用户推荐 5 部新电影...
日期:03-16
AMD:我们锐龙的大小核 很不一样!「锐龙cpu大小」
Intel 12代酷睿开始引入了异构混合架构设计,包括性能核、能效核,俗称大小核。有迹象表明,AMD锐龙也将会引入大小核设计,AMD CTO Papermaster也曾明确表示,未来的AMD消费级锐龙处...
日期:06-06
mqe手表价格_惊艳面世,Garmin京东预售MARQ系列高端智能腕表
  2019年,值成立30周年之际,Garmin宣布推出MARQ系列高端智能腕表。新一代产品MARQ系列,是Garmin在审视传统机械腕表市场发展后推出的智能产品,除了精湛独特的工艺和独具一格...
日期:04-16
特斯拉带路中国供应商攻入“美国后花园”「特斯拉签约的中国供应商」
特斯拉正在加快为墨西哥的超级工厂寻找当地零部件供应商。自从特斯拉宣布在墨西哥建设第三座海外超级工厂后,供应商察觉到这是一次前所未有,抱紧特斯拉大腿的好机会。前段时间...
日期:06-23
小米103c认证「面向全球!小米13T Pro手机通过EEC认证」
据海外数码博主 Mukul Sharma 的最新推文,小米公司已在全球范围内发布了小米 13T Pro 手机。该手机已通过 EEC 认证,型号为“23078PND5G”,但认证页面并未透露更多的配置信息。...
日期:04-15
漫长的季节李庚希「豆瓣9.3高分!《漫长的季节》今晚大结局 网友:封神之作」
5月1日消息,今晚,热播网剧《漫长的季节》迎来大结局,截稿前,该剧豆瓣评分涨至9.3分,成为近五年来评分最高的悬疑剧,超过7.2万人为本作打分,五星好评占了73.8%。有网友看后点评称:封...
日期:05-02
微博崩了!歌手李玟轻生去世 姐姐发声:数年前患上抑郁症_李玟个人介绍
7月5日晚,歌手CoCo李玟的二姐李思林发文称,李玟因抑郁症轻生,送医后没能救回。网友反馈,微博一度崩了,可能与此突发事件有关。小米12系列官宣本月28日发布百度百科上,歌手李玟的词...
日期:07-06
hp3050打印机驱动怎么装「hp3050打印机驱动」
HP 3050打印机驱动是指用于支持和控制HP 3050打印机功能的程序,它将安装在计算机中,并与操作系统交互。为了使打印机正常工作,计算机需要在安装打印机之后安装相应的驱动程序。...
日期:05-29
大学生30万开咖啡馆 2个月亏近3万:直言生意没想象中好做 还年轻_开个小咖啡馆赚钱吗
据钱江晚报报道称,短短两个月里,杭州19岁在校大学生小严的创业情绪如抛物线曲线那样,起起伏伏。扎克伯格创业分析9月初,小严与合伙人一起开起了一家咖啡店,店铺装修、购置咖啡机...
日期:11-01
爱奇艺自制东方武侠传奇剧《剑王朝》今日独家上线,VIP会员抢先看6集
12月6日,由李现、李一桐、刘奕君、姚笛、赵圆瑗、何润东、肖旭、李光复等主演的爱奇艺自制东方武侠传奇剧《剑王朝》在爱奇艺独家上线,每周五至周日20:00各更新2集,VIP会员抢...
日期:03-09
小鹏公布 Q2 财报,对抗特斯拉 Model Y 车型明年到_特斯拉财报2021q2
2022 年 8 月 23 日,小鹏汽车公布 2022 年 Q2 财报,而数据显示第二季度车型的总交付量为 34422 辆,连续四个季度成为新势力销冠。营收 74.36 亿人民币,同比增长 97.7%。然而第二...
日期:09-16
特斯拉已在国内注册Cybertruck商标
3月2日 消息:3月2日,据报道,在#特斯拉投资者日#日上,特斯拉首席设计师弗兰兹·冯·霍尔扎森(Franz von Holzhausen)表示,Cybertruck将在今年问世。小米线上线下销售模式oppo watch...
日期:03-02