您的位置:首页 > 互联网

【首发评测】国产大模型真落地,我用这5个问题为难了它们,结果你意想不到

发布时间:2023-08-31 19:51:59  来源:互联网     背景:

出品|网易科技《智见焦点》

作者|赵芙瑶

编辑|丁广胜

大模型的风暴席卷全球,然而对于普通C端用户来说,国产大模型的内测邀请码却总是“一码难求”,即使开放申请体验,排队时长也难以预估。

然而就在今日,备受行业瞩目的首批大模型产品获批名单来了,当中既有百度、字节跳动、腾讯、华为、商汤等大型企业,也包含了具有科研院校背景的智谱AI、中科院等,同时创业公司百川智能、MINIMAX等也位列其中。

苹果128gb价格

也就是说,国产大模型人人可用的时代已经到来。

2022年12月,国家网信办、工信部、公安部联合出台了《互联网信息服务深度合成管理规定》,对深度合成技术作出规范,并规定从2023年1月10日起实施。2023年7月,国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》,希望促进生成式人工智能健康发展和规范应用。国内生成式AI的发展也紧跟政策步伐,此次11家公司首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务,无疑意味着市场格局的又一次生变。

Open AI之所以强势出圈,与其强大的数据集不无关系。曾几何时,对于许多国产大模型来说,中文语料库短缺的痛点一直存在。此前大模型也并未全面开放,中文数据无法像ChatGPT那样进行“几何级”的积累。

AI时代“百舸争流”,哪家大模型最先拿到了开放的名额,就相当于拿到了最先积累中文数据、占领市场份额的“船票”。

那么,这些大模型的水平究竟如何?网易科技就以下近期热点话题,对首批已开放的部分大模型展开了评测。

百度-文心大模型-文心一言

嵌入搜索引擎、插件可生成表格

文心一言是知识增强的大语言模型,2023年3月27日上线, 6月开放3.5版本内测。百度作为国内率先入场大模型的企业之一,李彦宏对于文心一言寄予厚望。从文心一言的回答来看,比较言简意赅,虽然并未进行强观点的输出,但是答案相对中规中矩。

此前ChatGPT的插件集十分火爆,此次令人惊喜的是,文心一言也更新了插件功能!包括览卷文档、E言易图以及说图解画。

近期正值财报季,上市企业们纷纷发布二季报,以折线图、柱状图的形式展现财务数据会更加一目了然。输入财报数据,并选中E言易图插件,就会生成柱状图,然而美中不足的是,E言易图并不能明白“在柱状图上标明数据”的指令。

至于“说图解画”插件,文心一言不知为何忽然建议使用英文进一步提问,或许是使用了英文数据集的缘故。

不过可圈可点的是,百度将文心一言的对话能力嵌入了搜索引擎,与New Bing类似,可以面向更多的用户群体,文心一言客户端也已经在App store上线。

商汤科技-日日新大模型-商量

To B To C两手抓

日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。

从商量·SenseChat的回答来看,回答连贯、逻辑流畅、较为专业、篇幅较长,并且有一些有价值的观点。更令人惊喜的是,其拥有“辩证思维”。例如给出蔚来造手机以及小米造车的分析时,商量能发现二者之间的异曲同工之处。

从其它回答来看,商量在回答问题时都会联网查询相关信息。但日日新的To B应用还暂未向公众开放,目前只能联系商务进行试用。

MINIMAX-ABAB大模型

有限速、不可输入过长文本

ABAB大模型,是Minimax推出的自研通用大模型。令人费解的是,其开放平台在当前阶段,体验用户(未充值)调用接口时会被限速,所以其生成答案的速度为所有大模型中最为缓慢,并且输入字符也有限制,所以只能将每个问题单独提问一遍。其页面UI设计让信息浏览也略有不便,不过生成的答案倒是没什么毛病。

一加科技刘作虎

中科院自动化研究所-紫东太初大模型

效果差强人意 理解能力还需提高

据官网介绍,紫东.太初是中科院自动化所与MindSpore社区联合打造的全球首个图、文、音三模态大模型。紫东.太初将文本 + 视觉 + 语音各个模型进行协同,可以完成跨模态检测、视觉问答、语义描述等下游任务。

首先是视觉问答,目前来看,紫东太初似乎完全无法理解指令。

以图生文方面,推理有错误,误判了桌上的物品。

以文生图方面,生成的图片较为模糊,不过好在理解了指令。

智谱AI -GLM-ChatGLM

多种模型可供选择

智谱AI是由清华大学计算机系技术成果转化而来的公司,希望打造新一代认知智能通用模型。今日其首款生成式AI助手“智谱清言”已在各大应用商店上线。这款工具基于智谱AI自主研发的中英双语对话模型ChatGLM2,与此同时,智谱AI官网也已开放其他大模型试用入口。

140万宝马x610年能卖多少钱

从ChatGLM-Pro的回答来看,要点明确,篇幅较为简洁,在内容丰富度上略微逊色。

字节跳动-云雀大模型-豆包

拟人化AI助手

豆包是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能。它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台,但 iOS 需要使用 TestFlight 安装。

豆包清晰、详细地回答了问题,同时具有逻辑性和连贯性,也有一定程度的创新性,提供了新的观点和信息。

百川智能-百川大模型

结构严谨 观点具有辩证性

百川智能,是王小川和茹立云联合创立的一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用。

从百川大模型的回答来看,其结构严谨,会一分为二的阐述观点并进行总结。

上海人工智能实验室-书生大模型-书生·浦语+

仍未开放 值得期待

目前,书生大模型的官网还未开放试用入口,只提供了一些此前的案例,所以目前还无法评判其对话能力。

结语

此次国内11家大模型企业首批通过《生成式人工智能服务管理暂行办法》备案,无疑标志着中国生成式人工智能服务将拥有更加规范的管理。该备案的通过,意味着这些生成式人工智能系统的合法性得到了确认,也意味着这些系统的服务质量将受到更严格的管理。

这对于全行业来说,都是一个积极信号,必将有助于推动生成式人工智能行业的健康、有序、快速发展,让大模型人人可用,让数据积累更加简单。


返回网站首页

本文评论
中国小伙巴黎卖刀削面:目标日进1千欧元「法国刀削面」
由于文化传统的差异,真正的中餐在海外很难打开局面,不过网名巴黎小郭郭Paris”的博主郭章龙最近在法国巴黎把山西刀削面给带火了。千元以内电竞显示器为什么京东火车票贵据悉,...
日期:10-27
微软终于让 Windows 11 和 Android 实现了文件共享!「win10和安卓传文件」
声明:本文来自于微信公众号CSDN(ID:CSDNnews)),整理 | 苏宓,授权转载发布。本周,微软最新推出了 Windows Subsystem for Android(WSA)的2305.40000.4.0版本更新。作为此次更新的一...
日期:06-15
PlayStation中国商店恢复服务_索尼周六开始恢复亚洲PlayStation网络服务
(小贝)北京时间5月28日消息,据国外媒体报道,索尼开始部分恢复日本和亚洲其它地区的PlayStation网络和Qriocity电影音乐服务。今年4月份,索尼在遭受黑客攻击,并导致超过1亿用户账...
日期:07-28
颜值绝了!首发骁龙8 Gen2“领先版” 24GB内存:红魔8S Pro真机首公布!「红魔手机处理器8核是什么意思」
据官方消息,红魔将在7月5日召开新品发布会,正式推出旗下最新机型——红魔8S Pro。今天上午,红魔官方首次公布了红魔8S Pro的真机图片,展示了这款新旗舰的外观。新机相比红魔8 Pr...
日期:06-28
兴趣岛(原千聊特训营)入驻国家级学习平台,助力终身教育发展
近日,兴趣岛兴趣学堂(原千聊特训营)正式入驻国家 级学习平台“国家开放大学终身教育平台”,包含《彩色铅笔时尚肖像插画绘》、《一学就会的手机调色课》、《零基础棒针编织学习...
日期:06-30
苹果正在测试M3 Pro芯片:拥有12个CPU核心和18个GPU核心「iphone3nm芯片」
自2020年苹果宣布推出M系列自研芯片,全面取代原有产品线的x86处理器后,对整个行业的发展产生了重大的影响。虽然此前有报道称,苹果因台积电生产方面的问题,不打算在今年发布M3芯...
日期:05-15
马斯克推特提醒「马斯克要求推特全员签奋斗保证书:不签字就拿钱离开」
11月16日消息,美国当地时间周三,推特新老板埃隆·马斯克(Elon Musk)向这家社交媒体公司的员工发出最后通牒:要么致力于帮助打造新的“硬核”推特,要么以领取遣散费的形式离开公司...
日期:11-19
京东快递宣布上线新功能:21点至24点一样可送货上门_京东快递24点前送到是真的吗?
今天,京东快递官方宣布,将在双十一期间,上线预约派送、验证揽派两项新的服务。通过新的预约派送功能,用户可以在未来七天内自由选择派送的时间短,且可以精准到2小时以内。同时,针...
日期:11-19
寒武纪:保持敏感度 紧跟智能算法未来发展趋势「寒武纪概念」
近日,寒武纪在投资者活动中表示:公司设计、研发的通用型智能芯片通过对各类智能应用和算法的计算和访存特点进行抽取和抽象,定义出一套适用于智能算法且相对灵活的指令集和处理...
日期:04-18
小米13 Ultra采用可变光圈技术、后置徕卡四摄
4月10日消息,小米13 Ultra将于本月正式发布,目前外观已经曝光的差不多了,跟上一代的差别很小。但对于后摄的具体配置,现在又有了新的消息,据数码博主爆料称,小米13 Ultra也将采用...
日期:04-11
华为确定参加MWC 展中或将发布华为P60手机_华为P60什么时候发布
CES已经开展,而手机方面,今年将在2月底的MWC(世界移动通信大会)上发布更多的手机新品,今年的MWC定于2月27日开幕,持续到3月2日。华为目前已经确定参展,目前有消息称在展会中华为将...
日期:01-05
索尼微单a7s拍视频「9000万像素!索尼新旗舰微单A7R5谍照曝光:告别单手操控」
根据此前爆料,索尼新一代旗舰微单A7R5将于10月26日正式发布。现在,Photorumors曝光了一张疑似索尼A7R5和A7R4的对比谍照,操控方式变化很大。从谍照中可以看出,索尼A7R5顶部的拍...
日期:10-17
2020手机市场调查分析_IDC预测5G在2020年会激发二手手机市场活力,转转质检服务领先行业
  2020年注定不平凡,2月13日,世界移动通信大会(MWC)33年来首次宣布取消,对于很多厂商来说,未能展示准备已久的5G产品,颇为遗憾。不过,同日下午,小米10系列手机线上发布会如期举...
日期:04-22
iQOO 散热背夹2 Pro:打造手机游戏的“冰点”体验_iqoo散热背夹缺点
日前,为更好地迎合广大粉丝朋友们夏日的玩机需求,iQOO在炎炎夏日即将到来之际推出了一款性价比高的散热背夹2 Pro,它兼顾制冷和快速散热两大作用,能够让用户在炎炎夏日依旧享受...
日期:04-19
知乎“向科学要答案”收官  浏览量达51亿「知乎最长答案」
7月15日,知乎“向科学要答案”活动收官。活动期间,知乎科学相关的专业讨论获得用户1822万多次赞同,相关科学话题的浏览量达51亿次。活动期间,共有84.2万内容创作者在知乎参与科...
日期:08-28
唯品会第二季度营收245亿元 Non-GAAP净利润16亿元(唯品会盈利模式分析)
讯 北京时间8月19日下午消息,唯品会(NYSE:VIPS)今日发布了截至6月30日的2022年第二季度财报。财报显示,唯品会第二季度总净营收为245亿元(约合37亿美元),而去年同期为296亿元。归属...
日期:08-20
2019数博会开幕在即,华为云携手中国数谷共建数字贵州(数字峰会贵州馆)
  黄果飞流,白练悬天;梵天净土,巍峨绵延。贵州之自然灿美,可谓动人心弦。   苗寨千户,依山傍水;布依米酒,风尘绝味。贵州之人文情怀,可谓多彩璀璨。   这颗云贵高原上的明...
日期:04-02
不到5000元体验最好 雷军:硬核米粉想要的其实小米13 Pro全有
今日消息,雷军表示,硬核米粉想要的其实小米13Pro全有,包括2K、LTPO、10bit、PWM 1920高频调光。还有徕卡影像:1英寸大底,75mm长焦,移动对焦镜组,以及安卓最大的X轴马达、最快WiFi、...
日期:12-19
“决战”MCN的大戏,轮到程十安了_程十安资料
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:楼星垂,授权转载发布。又一位顶流和MCN“闹分手”了。5月16日,媒体报道,@程十安 小红书账号被封,此时其拥有854万粉丝。随...
日期:05-24
面向全国开放K12教育资源,百度文库助力全国中小学校师生“停课不停学”
  随着新型肺炎的蔓延,教育部发文要求2020年春季学期延迟开学,全国各地高校、中小学和在线教育机构纷纷响应“停课不停教、不停学”号召,积极研究线上教学方式,保障开学后教...
日期:01-19