您的位置:首页 > 互联网

看懂网飞版三体!Reka Core登场:挑战GPT-4、Claude 3_网飞有三体版权吗

发布时间:2024-04-17 16:50:54  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】AI初创公司Reka最新推出的多模态语言模型Reka Core具备理解图像、音频和视频等多种模式数据内容的惊人能力,是继谷歌的Gemini Ultra之后的又一个令人瞩目的作品,性能上与GPT-4不相上下!

多模态语言模型又双叒叕上新了!

近日,由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka,推出了他们最新的多模态语言模型——Reka Core。

它被誉为该公司最大、最有能力的模型,在性能上与GPT-4和Claude3Opus不相上下!

Reka的首席科学家兼联合创始人Yi Tay兴奋地表示,过去几个月,该公司使用了数千台H100来开发Reka Core。

能够达到GPT-4或Opus的水平是研究团队中许多人的目标。

从头开始训练模型来与OpenAI的GPT-4和Claude3Opus相媲美无疑是一项壮举。

目前Core仍在改进,在后续的时间里,兴许会有更多有趣的内容陆续推出!

对于这个新推出的模型,网友们叫好声一片~

还有网友看了官方发布的视频后惊叹:这莫不就是传说中的AGI,有点迫不及待了!!!

Core是Reka语言模型系列中的第三个成员,由多个来源训练而成,包括公开数据、授权数据以及涵盖文本、音频、视频和图像文件的合成数据。

它能够理解图像、音频和视频等多种模式的数据内容。

最重要的是,尽管只用了不到一年的时间就完成了训练,但它的性能却可以媲美或超越人工智能领域领先的顶级模型。

虽然Reka Core的确切参数数量尚未披露,但该公司首席执行官Dani Yogatama认为它是一个非常庞大的模型(上一个模型Reka Flash有210亿个参数)。

Core还支持32种语言和128,000个词组的上下文窗口,这也就让该模型在处理长篇文档方面具备了极强的优势。

苹果music安卓版

可以说,Core是继谷歌的Gemini Ultra之后第二个涵盖从文本到视频等所有数据模式并且能够提供高质量输出的模型了。

此外,Yogatama还表示,研究团队正在训练Core以进一步提高其性能,同时也在开发下一个版本,并且表示该公司没有开源该技术的计划。

技术细节

训练数据

训练数据由公开可用和专有/许可数据集组成,其中包括包括文本、图像、视频和音频剪辑,获取数据的截止日期为2023年11月。

虽然并未对语料库的内容进行严格意义上的分类,但预训练数据中大约25%的数据是与代码相关的,30%的数据是与STEM相关。

其中约有25%的数据是网络爬取获得的并且约10%的数据跟数学相关。

总体混合率一般遵循优先考虑独特标记的原则,但会根据数量有限的小规模消融产生的信号进行人工调整

预训练数据中大约15%是明确的多语言数据,由32种不同的语言按分层加权组成。

除了这些明确加权的语言之外,为了让大多数语言都有基准性能,研究团队还在包含110种语言的维基百科上进行训练。

模型架构

Reka模型架构是一个模块化的编码器-解码器架构,支持文本、图像、视频 和音频输入。目前,我们的模型仅支持文本输出。

模型主要使用Pytorch在Nvidia H100上进行训练。

研究团队表示,尽管训练过程学习率非常高,但损失峰值很少,因此模型预训练过程相对比较顺利。

后训练(Post-Training)

经过预训练后,模型使用强正则化技术对多个epoch进行指令调整。

对于SFT,研究团队使用混合数据集进行训练,其中包括他们的专有数据和公开数据。

SFT之后,使用RLHF方法进行对齐。

此外,在后训练过程中,研究人员还考虑了工具使用、函数调用和网络搜索等内容。

性能亮点

在业界公认的关键评估指标方面,Core与OpenAI、Anthropic和谷歌的模型相比具有很强的竞争力。

考虑到它的模型大小和性能,从总体成本的角度来看,Core能带来巨大的价值。

Core拥有强大功能的同时,部署也十分灵活,由此开启了大量新的应用案例。

网飞三体版权费

在视频感知测试中,Core的表现远远超过其唯一的竞争对手Gemini Ultra(59.3分对54.7分)。

同时,在针对图像任务的MMMU基准测试中,Core以56.3的得分紧随GPT-4(56.8)、Claude3Opus(59.4)、Gemini Ultra(59.4)和 Gemini Pro1.5(58.5)之后。

即使在其他基准测试中,Core也能媲美行业领先模型。

例如,在知识任务的MMLU测试中,它获得了83.2分,紧随GPT-4、Claude3Opus和Gemini Ultra之后。

在推理的GSM8K基准测试和编码的HumanEval测试中,它分别以92.2分和76.8分击败了GPT-4。

下表总结了Core与目前市场上领先模型的比较。

模型能力

1. 多模态(图像和视频)理解

Core 不仅仅是一个前沿的大型语言模型,它对图像、视频和音频具有强大的上下文理解能力,是仅有的两个商用综合多模态解决方案之一。

2.128K上下文窗口

Core能够摄取并精确准确地调用更多信息。

3. 推理能力

Core在语言或者数学方面具有出色的推理能力,使其适用于需要精密分析的复杂任务。

4. 编码和代理工作流

深圳联通转移动

Core是顶级代码生成器。它的编码能力与其他功能相结合时,可以增强代理工作流程的能力。

5. 支持多种语言

Core是在32种语言的文本数据上进行的预训练,因此,它能说流利的英语以及好几种亚洲和欧洲的语言。

6. 部署灵活性

与Reka其他型号的模型(Flash和Edge)一样,Core可通过API、本地或设备部署,以满足客户和合作伙伴的部署限制。

网飞三体拍的怎么样了

参考资料:

https://venturebeat.com/ai/reka-releases-reka-core-its-multimodal-language-model-to-rival-gpt-4-and-claude-3-opus/

网飞版《三体》

https://x.com/YiTayML/status/1779895037335343521https://x.com/artetxem/status/1779895714438365284


返回网站首页

本文评论
鸿蒙harmonyos_鸿蒙HarmonyOS 3.0亮相 产业链投资机会来了?
华为鸿蒙Harmony OS 3.0正式亮相。   “今天我们鸿蒙Harmony OS 3.0来了。”7月27日晚间,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO余承东正式宣布Harmony OS 3.0...
日期:07-31
ai人工智能语音安卓下载「SpeakingAI免费软件app下载—Ai人工语音生成器」
Speaking AI是一款基于人工智能的语音生成器,可以将文本转换为真实的人声,支持中文和英文。它具备丰富的情感交流能力,可以逼真地模仿任何人的声音。该软件的创始人和团队成员...
日期:12-07
悠易互通斩获艾菲及金牌数字营销双项大奖
  9月25日,第十八届中国国际广告节在沈阳会展中心拉开帷幕。国内领先的受众网络数字营销公司——悠易互通一举摘得艾菲媒体实效奖、中国金牌数字营销公司两大奖项。悠易互...
日期:07-23
《新神魔大陆》手游X沱牌盲盒燃战上线!
  如今的消费者越来越注重生活的品质化、多元化,各大品牌都希望能营造出更具新鲜感的消费体验。跨界营销凭借出乎意料的玩法,不但能吸引受众的注意力,还能帮品牌收获大量的...
日期:07-14
苹果M3 Max有两种版本:14 40?还是16 40?「苹果m3相当于什么cpu」
快科技8月8日消息,最近有关苹果M3系列处理器的消息突然多了起来,包括M3、M3 Pro、M3 Max,都将升级为台积电3nm工艺,但规格上比较保守,至少核心数量不会大幅增加。此前说法称,M3 Ma...
日期:08-08
日经:华为或取代三星登上 4-6 月手机出货份额首位(华为手机出货量降至第五)
  北京时间 7 月 8 日上午消息,据《日经中文网》报道,在 4-6 月的全球智能手机市场上,三星电子很可能要将份额首位的宝座让给华为。   受到新冠疫情扩大的影响,预计 4-6 月...
日期:07-14
蔚来nomi2.0「蔚来NOMI GPT领航版开启招募 拥有多模态感知能力」
3月11日 消息:蔚来汽车官方宣布,备受瞩目的NOMI GPT领航版现已正式开启招募,标志着2024款蔚来汽车将迈入全新的体验升级阶段。据了解,NOMI作为蔚来汽车的智能助手,在过去的迭代...
日期:03-11
驿路星辰:未来同城配送靠谱吗?机会趋势要及时掌握(驿路星辰公司是不是真的)
  驿路星辰是做什么,配送行业这几年风生水起,不少入局者想从配送这个大蛋糕中分一杯羹,不过在配送行业中同城配送一直都是兵家必争之地,以本地区域为主,主打同城配送的平台都...
日期:09-08
亏电油耗4.55升 吉利银河L6动力信息曝光:纯电最远跑105km「吉利icon2020款银河限量版」
快科技7月18日消息,在工信部发布的《免征车辆购置税的新能源汽车车型目录(第六十七批)》中,吉利银河L6相关信息得到曝光。该车是吉利银河品牌第二款量产车型,定位于插电混动轿车,...
日期:07-19
英特尔推动半导体行业协同前进,加速迈向可持续未来_英特尔半导体美国有限公司
通信世界网消息(CWW)半导体在世界发展进程中扮演重要角色,当我们讨论不断发展的创新技术时,也必须认识到可持续发展对于半导体行业的重要性。同时,净零排放和绿色化学研究现正处...
日期:04-01
美国最高金融监管机构将对AI信贷业务制定新监管规则_美国金融监管政策
北京时间7月21日早间消息,据报道,美国最高消费金融监管机构正加强对银行在做出信贷决策时使用AI技术的关注,这表明金融机构即将面临新的限制。美国消费者金融保护局(CFPB)局长罗...
日期:09-19
据报道TikTok仍计划在美国推出直播带货服务_tiktok美国业务最新消息
TikTok可能终究不会放弃在美国的直播带货。根据《金融时报》的报道,该公司正寻求与合作伙伴TalkShopLive合作,在北美推出直播购物功能。TalkShopLive是一个位于洛杉矶的购物直...
日期:10-04
秒变大屏幕平板电脑-消息称三星今年将推出首款三折-折叠屏手机_三星折叠大屏手机 tb
3 月 26 日消息,三星有望在今年晚些时候推出三款高端智能手机。其中两款几乎被确认为 Galaxy Z Flip 5 和 Galaxy Z Fold 5 折叠屏手机。第三款设备预计将是 Galaxy S23 FE...
日期:10-05
护航数字通道安全,《公路交通行业云网端一体化安全技术白皮书》正式发布
通信世界网消息(CWW)3月28日,由交通运输部公路科学研究院、中国公路学会交通工程与信息化分会、云南省交通投资建设集团、华为联合编制的《公路交通行业云网端一体化安全技术白...
日期:03-29
Chrome OS 10 周年:谷歌宣布将增加手机电脑联动和隔空投送等新功能
  3 月 10 日消息 谷歌在其官方博客昨日发文,表示为庆祝 Chrome OS 诞生十周年,将会开启一波大更新,推出 Phone Hub、Nearby Share、Quick Answers 和新的截屏工具,并增强剪...
日期:07-16
北斗“小红车”亮相银川街头:能识别用户逆向骑行 是否戴头盔、带人
3月10日消息,500辆人民出行”共享电单车近日亮相银川街头,被市民亲切称为小红车”,小红车”能够充分运用北斗智慧进行智能骑行。拼少少平台据了解,小红车”基于北斗等技术,可以精...
日期:03-10
光绘世界 智享生活 | 长飞公司精彩亮相CIOE中国光博会「长飞光纤光缆股份」
通信世界网消息(CWW)9月6日-8日,2023 年中国国际光电博览会在深圳会展中心(宝安)盛大举行。长飞光纤光缆股份有限公司(以下简称“长飞公司”,股票代码:601869.SH、06869.HK)以“光绘...
日期:09-07
小米14的屏幕「小米14将采用超窄边框屏幕」
小米14将采用超窄边框屏幕,四边厚度仅为1mm,提供更大的显示面积和更高的屏幕与机身比例。该屏幕将由华星公司提供,并将采用该公司新的fiaa超薄设计,以降低成本,提高生产效率。小...
日期:05-09
特斯拉新款小型电动汽车将配备53kWh磷酸铁锂电池 目标销量4200万辆「特斯拉搭载磷酸铁锂」
4月6日消息,据外媒报道,特斯拉在当地时间周三发布的“宏图计划”第三篇章(Master Plan Part 3)文件中透露,其下一代汽车将包括一款小型电动汽车,这款车将配备53kWh的磷酸铁锂电池,...
日期:04-06
京东撤出澳洲市场 刘强东曾表示澳洲市场很重要(京东撤出澳大利亚市场)
  5月9日下午消息,今日有外媒报道,京东位于澳大利亚墨尔本的办公室在运营不到15个月后,已于本周悄然关闭。这意味着,刘强东的南半球扩张计划恐陷入停滞。对此,京东方面回应称,...
日期:07-11