您的位置:首页 > 互联网

文心大模型3.5勇夺三个冠军领跑,中文完爆GPT-4!国际权威报告7项满分「全班第一」

发布时间:2023-07-20 13:46:42  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

一觉醒来,好不热闹,Meta深夜投出重磅炸弹,Llama2既开源还能商用,简直让大模型领域变了天了。

在Azure上可部署,在Huggingface上可下载,Meta再次回到AI主战场,牛到不可思议。

短短一周内,硅谷是真卷起来了。Bing推出Bing Chat企业版,Anthropic发布GPT-4最强竞品Claude2,谷歌Bard也发布大量更新……

就在刚刚,小编也体验到了百度文心一言最新的文生视频、ChatFile插件等新功能。

现在,文案、视频,全都能交给它来解决——

根据自己生成的内容,文心一言可以分分钟输出一个视频,连视频配文都帮你贴心地写好。UP主们简直要笑疯!

据介绍,文字转视频的能力、直接生成视频的能力,目前是在百度内部测试。

IDC「AI大模型评估报告」,文心大模型全班第一

与此同时,国际权威IDC发布了业内首个大模型评估报告——《AI大模型技术能力评估报告,2023》。

报告中,IDC从多维度测评大模型的能力,将大模型分为三大层服务生态、产品技术以及行业应用。

每个指标有1分-5分五个层级,得分越高代表厂商大模型技术能力越强。

图片

值得一提的是,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。

这三个绝对第一,体现了百度文心大模型的基础技术深度和产业应用覆盖广度。

根据IDC的报告,百度AI大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

图片

从3月16日文心一言发布到5月,文心一言的「内核」文心大模型就升级到了3.5版本。

它实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强,插件机制等,模型效果提升了50%,训练速度提升了2倍,推理速度提升了30倍。

既然文心大模型3.5是文心一言的内核,那就让我们看看23年6月30日上线的V2.2.0版文心一言,究竟强在了哪?

文心大模型3.5,功能全面升级

这次,文心一言升级后最大的变化,就是全新的「插件」功能了。

图片

可以说,插件就像给大模型们上了一层buff,被禁锢的能力,瞬间就被释放出来。

比如GPT-4搭载的Code Interpreter就强到令人发指,甚至很多人说应该叫它GPT-4.5才对。

文心一言,当然也少不了强大插件的加持。

检索(热点实时追踪)

在搜索技术上,百度积累了大量优势。

「百度搜索」插件背后,是更强的搜索技术和更强的搜索底层架构。

而集成插件之后的文心大模型3.5,现在可以对互联网各个角落的信息了如指掌。

比如今天的爆炸性新闻,Meta发布了开源且免费商用的Llama2,还和微软云服务Azure、高通芯片都展开了合作。所以这对全世界大模型的格局会带来哪些改变?

文心一言指出,Meta在AI领域重新拿回了影响力,大模型的商业模式也被彻底改变。

图片

Meta此举对于OpenAI和谷歌的商业版图,会有何影响呢?

文心一言总结得全面又透彻——增加竞争压力、激发创新活力、扩大市场份额、加速行业变革。

图片

搜索和大模型的能力一结合,开了挂的文心一言,简直分分钟化身商业分析师。

文档(PDF/Word都可以)

除了联网,百度这次还给文心一言新加入了一款ChatFile插件。

在上传文档之后,用户只要用自然语言,就能对其中的内容进行问答检索和总结摘要。

而且,通过这种超长文档的回答,ChatFile可以大幅拓展模型处理文字的长度了。

在使用过程中,ChatFile会对文档的每一个段落都进行语义索引和向量化建库。

图片

最近,猎聘大数据研究院重磅发布了一份《AIGC就业趋势大数据报告2023》,都有哪些核心内容?上传文档,文心一言几秒就能帮你做出又快又好的总结。

图片

你还可以就文档细节,让它给你做个归纳总结。

美团股价大降

图片

或者让文心一言帮你总结一篇arXiv论文。

图片

有了文心一言的ChatFile插件,以后看论文,是省时又省力了。

更懂中国人的大模型

文心一言,显然是更适合中国宝宝体质的大模型。

无论是文言文,还是知乎、小红书这类社交媒体文案的创作,当然还是我们自己的中文大模型最擅长。

进化后的文心大模型3.5,直逼GPT-4

正在热映的「长安三万里」,为我们重现了一把大唐的极致浪漫。

年少意气风发的李白,命运几番浮沉。

他曾写下的「轻舟已过万重山」,也再次成为大家关注的焦点。

谪仙人李白写下这句诗时,究竟是怎样的心境?

图片

在诗词歌赋这类中国传统文化方面的表现,文心一言可谓是相当出色。

不仅对答如流,而且还能分析出诗句的含义和妙处。

甚至,还给难(kao)读(dian)的词语,标上了拼音。

图片

apple watch s6芯片

而GPT-4这边,堪称一个「缝合怪」。

一方面,通篇都没有原作曹操什么事,还把李白写的《赠汪伦》安在了陆游身上。

另一方面,诗句的补全更是离奇。前四句还好好的,然而从第五句往后,GPT-4就开始放飞自我了……

科技小米汽车充电站专利获授权

图片

再比如,北宋文学家欧阳修的《生查子•元夕》中,「月上柳梢头,人约黄昏后」描写的是哪个传统节日?

文心一言答:元宵节。

图片

GPT-4不仅误判成了中秋节,而且还替苏轼「写」了一首「临江仙·满江红」……

图片

此外,对于成语的理解,文心一言也相当拿手。

图片

正确与否,我们贴上来自「百度百科」的回答,就一目了然了。

图片

相比之下,GPT-4再一次陷入到了自己的幻觉当中。

图片

中文创作,全面发展

写起古诗来,文心大模型3.5也是完胜GPT-4。

比如以「思念无期」写一首藏头诗。

文心一言不仅完美藏了头,离别之苦、思君之愁的感觉也一并表达了出来。

图片

GPT-4写的藏头诗,相比之下可是逊色了不少。

图片

一句话:写诗,还得看咱们自己的大模型!

另外,文心一言不仅是一位「文学大师」,还是一位「文案高手」,可以根据不同平台的风格调性,创作贴合的文案。

用知乎体回答一下:「人生中拿到一副烂牌被自己打好了是种怎样的体验?」

「谢邀」俩字一出,张口就知是老知乎er了。

图片

最近,「特种兵旅游」、「夕阳红老年团游」都out了,现在流行的是Citywalk。那就请文心一言写一份北京的citywalk线路吧。

图片

经常上网冲浪的盆友们,你们是不是经常遇到这种文案,文采飞扬、意境绝佳,但就是不知所云。

有了文心一言,对方来一句,咱们来十句。讲不讲得通另说,要的就是一个气势。

图片

就在刚刚,2023年的暑期档电影票房已经超过了90亿元。

虽然不能亲自到影院,但会上网的文心一言,写起影评来是真不在话下。

图片

有人说,大龄程序员的归宿就是送外卖和开奶茶店。

图片

干到三十多卷不动了,带着50万存款回老家开一家奶茶店可行吗?文心一言帮你分析。

图片

玩梗,它是独树一帜

对于那些独属于中文互联网的热梗,文心一言就更加如鱼得水了。

在「百度搜索」插件的加持下,文心一言把最近流行的「白人饭」给解释得明明白白。

图片

面对同样的问题,GPT-4也必须开启一些「科技与狠活」,才能get到。

至于回答的质量,两个大模型可以说是不相上下。

图片

相比之下,无法联网的GPT-3.5,就一脸懵圈了。

图片

「哈基米」也算是一个洗脑了无数人的bgm。所以,这究竟是什么梗?

文心一言立马说出了「哈基米」的出处,其实在日语中,原音为はちみ。没想到,被网友用来给猫猫视频配音后,火遍全网。

图片

除了热梗,文心一言还很懂流行的emoji,比如常见的


返回网站首页

本文评论
各大电商平台数据分析_电商网站国内前15数据曝光 凡客、麦网上榜
  电子商务战火越演越烈,但是各家企业对自己的访问数量和成交转换率一直讳莫如深。   近日,记者从艾瑞方面获得一份独家数据,显示去年12月份国内访问量前15的电子商务网站...
日期:07-26
《中国机长》等国庆档大片叫座,手机观影当心中招木马病毒(中国机长免费播放电影)
  “我和我的祖国,一刻也不能分割,无论我走到哪里,都流出一首赞歌……”王菲翻唱的《我和我的祖国》飘过祖国大江南北,拉开了国庆主旋律电影的序幕。   今年国庆档三大...
日期:04-14
中国的基础科学研究为什么得不到壮大「为什么中国的基础研究难获诺贝尔奖?」
(原标题:为什么中国的基础研究难获诺贝尔奖?) 基础研究当下的根本困境实质上指向经费分配结构问题为什么中国的诺贝尔奖这么少?对...
日期:04-27
华为mate50 pro概念机「华为Mate 50 Pro全球开售:比国行贵1800元」
华为于9月底面向海外市场推出了Mate 50 Pro手机,目前新机已经在波兰市场开售,法国和德国预计将于11月开启销售。从目前的电商页面来看,8+256GB售价约为8599元人民币,比国行的679...
日期:10-17
李想:理想MPV不会是埃尔法“私生子” 开上街比法拉利还瞩目「理想one 李想」
快科技6月14日消息,网友日前曝光了理想首款MPV W01的路试谍照,车辆位于理想公司门口,整车被伪装涂装覆盖。macbook pro19款13寸有几个款式从图中可以看出,全新的理想W01在尺寸上...
日期:06-15
已证明被黑客积极利用,苹果公告两周前发布的 iOS 16.1.2 修复了 WebKit 零日漏洞
  IT之家12月14日消息,苹果官方确认两周前面向iPhone发布的更新修复了一个零日漏洞,并有证据表明该漏洞已经被黑客积极利用。  苹果公司在今天更新的支持文档中表示,11月30...
日期:12-14
播放2021年中小学生暑假安全教育「各地中小学生开启暑假生活 请网友收下这份安全指南」
暑假来临,对于中小学生们来说,这是一个充满乐趣的时光。在这段时间里,他们可以尽情地游玩、学习、探索和成长。然而,暑假也存在一些安全隐患,我们必须时刻保持警惕,确保孩子们度过...
日期:07-14
00后女生1万元游10城被吐槽穷游:虽质量不高但并非走马观花
5月9日消息,据梨视频报道,江苏南京的阿米同学即将大学毕业,她用平常攒下的1万元开启了一个人的毕业旅行,目前去了苏州、杭州、厦门等,计划用1个月游10个城市。有人质疑她穷游,无乐...
日期:05-10
深度操作系统 20.2.2 发布:全新应用商店上线,支持安卓应用(深度操作系统应用商店打不开)
  6 月 29 日消息 深度操作系统 20.2.2 现已发布,上线了全新的应用商店,支持安卓应用,系统支持安全启动,适配更多 GPU 型号及显卡,提升系统稳定性和兼容性,提升整体使用体验。...
日期:12-11
智慧云潮释放“魔都”新动能,华为云开启政企升级新篇章_产业云 华为 政府
  积极推动国际“经济、金融、贸易、航运、科技创新”五大中心建设,“东方明珠”上海在全球现代化发展中一直扮演着“领航者”的角色,12月4日,“上海·选择不凡 华为云城市...
日期:12-13
星际飞船进展顺利 马斯克:将要发射「马斯克发射宇宙飞船」
凤凰网科技讯 北京时间1月13日消息,马斯克发推文表示星际飞船即将发射。据悉,SpaceX计划未来用它来进行载人绕月飞行、前往火星等太空探索。马斯克曾经表示,非常有信心将其送入...
日期:01-13
微软推专门网站 建议用户放弃IE6
  3月5日消息,据国外媒体报道称,微软推出了一个名为“IE6 Countdown”的网站,说服尚未升级IE浏览器的用户放弃问世已10年之久的IE6。   IE6存在许多问题:它要求网站使用非...
日期:07-26
TYT泰永长征应邀出席首届国际智慧能源产业大会
近日,首届中国国际智慧能源产业高质量发展大会于武汉长江电气智慧能源产业园隆重举行,TYT泰永长征应邀参会。本届大会围绕“双碳”目标发展需要,汇集国内外院士、学者、行业专...
日期:05-19
AirPods Pro 2再翻车:用户反馈存在音频同步问题_airpods pro不同时响
自从苹果推出AirPods Pro 2以来,这款理论上应该是苹果目前最强TWS耳机的产品,就被各种让人摸不着头脑的问题环绕。蜂窝通信技术包括特斯拉自动驾驶fsdtiktok就是抖音吗?近日,又...
日期:10-13
2023微信公开课:视频号发布创作者增收计划 微信支付尝试刷掌「微信视频号有收入」
3月28日,在2023微信公开课PRO·微信之约上,微信方面发布了视频号对助力创作者、经营者提效增收的计划,以及微信支付、小程序等的各类新工具、新应用。关于视频号,微信方面表示,上...
日期:03-29
百度“互联网创业者俱乐部”一周年又添新举措_百度的创业团队和机制
  8月22日,“互联网创业者俱乐部”一周年庆典在北京拉开帷幕。作为由百度联盟发起,旨在帮助广大中小网站和互联网创业团队成长壮大的国内最大创业平台。   百度副总裁向...
日期:07-22
扎克伯格折戟元宇宙 美硅谷大厂又做起了微信梦
凤凰网科技讯 北京时间11月28日消息,美国社交巨头脸书创始人马克扎克伯格(Mark Zuckerberg)冒险押注元宇宙的策略已经尝到了苦果。他现在急需一针强心剂,并且把目光对准了微信...
日期:12-12
12306推出适老化无障碍功能_12306 网站适老化及无障碍改造相关功能今日正式上线运行
  9 月 1 日消息 据中国铁路公众号消息,9 月 1 日,铁路 12306 网站进行的适老化及无障碍改造相关功能正式上线运行,为老年人及障碍人士线上购买火车票提供更多便利,12306 手...
日期:07-17
小米12s Ultra降价1000 入手只要4999了_小米11 Ultra降价
小米13将在明晚发布,而目前并不会发布小米13 Ultra,所以高端旗舰仍然是小米12s Ultra,现在12s Ultra的新款旗舰入手只要4999元,影像旗舰正式降到4000多元。2018年充电桩数量小米...
日期:12-01
淄博小饼遭疯抢老板暴瘦20斤 小葱等“灵魂搭配”也供不应求「淄博小饼的做法」
淄博烧烤成为“美食宇宙的中心”,吸引了全国各地的食客蜂拥而至。小饼生产商生产压力大,供不应求。小饼生产商的生产车间不断扩容,生产方式也从最开始的半手工,到如今的全自动化...
日期:04-23