您的位置:首页 > 互联网

腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线

发布时间:2023-10-30 06:21:42  来源:互联网     背景:

揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。

首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模块,已经能生成相当合理、逼真的图像。

文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的应用入口。

智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可以说风格各异,细节比此前更为丰富。

来源:混元助手

如果指令更复杂一点呢?

手部细节是可以说是文生图的一个难点。但在输入弹奏古筝的指令后,如图所见,手部细节可以说比较逼真,没有出现多指、扭曲等问题。

来源:混元助手

探路3年,解散400名员工,亚马逊无人配送车为何关停了

文生图能力升级:不仅要美,更重要的是“对”

这两个月,混元在文生图领域的技术研发目标,用一句话可以总结:“AI图像不仅要美,更重要是的是‘对’。”腾讯混元大模型文生图技术负责人芦清林表示。

首先要把用户的指令理解对。在大模型的指令上,混元如今对中文里的意象理解也有所进步,采用了中英文双语细粒度的模型,同时建模中英文进行双语理解。比如,输入“轻舟已过万重山,水墨画风格”,就可以得到下面的图片:

三星galaxy s21+5G

来源:混元

能画得更“对”,也来源于腾讯在训练过程中的一些算法创新。

“在人像上的生成合理性上,我们把人物区分成肢体和手的数据,以及人体的骨架信息都加入到训练中,而手指头生成的局部情况也用了多种形式控制,这样畸形率会比较低。”腾讯混元大模型文生图技术负责人芦清林表示。

而画面细节的提升,来自多种因素的总和,比如人物衣服褶皱、色彩层粗等等——混元用多模型融合的方式,来对其进行提高。

以前,文生图产品用的常规扩散模型是基于CNN等技术架构,特点是比较局部,对整体的结构和刻画能力没有那么强。但现在,混元是基于扩散模型和Transformer架构相结合,可以刻画更多细节,而且对空间位置的定位能力也有加强。

“目前在人像的优化上,比如头发、皱纹,我们的效果提升了30%,在场景模型,比如草木、波纹,效果提升25%。”芦清林估算。

超过180个腾讯业务接入,为广告提效显著

除了千亿参数的主模型,腾讯混元此次也释出了7B、13B等中小模型,主要面向垂直业务。

腾讯机器学习平台负责人康战辉表示,目前千亿级别的混元模型训练,涉及了超过了2.5T的数据。而最近一个多月,混元大模型能力提升比较大的在代码能力以及数据推理,效果较此前有20%的提升。并且,对话上下文窗口,也从原来的4K,中小模型可以长至16K。

而第三季度,可以说是国内大模型领域的关键节点——包括百度、讯飞在内的各家厂商都不约而同地汇报对标GPT-3.5的进展。

特斯拉有几个雷达

在这个层面,腾讯表示,如今混元的千亿级主模型,中文效果整体超过GPT3.5,而7B/13B中小模型实测效果整体优于国内外开源模型,如LLaMA2等。

康战辉尤其指出了压缩比这一参数——同等效果下,混元仅需较少的tokens,训练效率更高。如今,基于,基于探真技术,混元大模型的幻觉率也下降了30%-50%。

而基于这些模型,大模型接入业务的形式既有API接入,也有基于混元进行精调后再部署。

在9月刚发布时,腾讯只有约60个业务接入,但两个月之后,这个数字变成了180个。

腾讯内部各种类型的业务,可以看作大模型落地的切面。

腾讯机器学习平台负责人康战辉表示,其中60多个业务是基于混元做精调,比如腾讯会议、腾讯文档、企业微信、腾讯广告等。

而能落地的功能也越来也多。比如最近,QQ浏览器就基于腾讯混元推出了“PDF阅读助手”,具备智能摘要、智能问答和多轮提问等功能。

可以看出,大模型落地已经到了一个新阶段。业内对大模型落地的讨论,也已经从参数量,进一步到更具体的模型选型——用大模型还是小模型?如何更切实地降低模型应用成本?

康战辉介绍,当前腾讯内部业务的应用很多还是以效果为主。但每个业务都会根据自己的实际情况和场景,来选择合适模型。“比如广告肯定要兼顾成本,这是很复杂、务实的选择。”

目前,已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云调用腾讯混元大模型API,应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。这些业务里,既有使用千亿模型,也有采用小模型,或者混合模型模式。

其中,腾讯广告既是腾讯的核心业务之一,在大模型应用上也是走在前列的业务。

最早,腾讯就在广告场景进行AI自动生成图像的探索,如今腾讯混元的文生图在人像真实感、场景真实感上有比较明显的优势。

“对包括传统广告的素材、创意生成、广告链路推荐等等,如今我们也能用混元来进行生成。”康战辉说。

而通过实测数据不断迭代,相较Midjourney等文生图的标杆模型,混元对广告业务的提升已经有明显优势。“经过几个月的攻坚,我们比MJ在广告场景的应用明显好一些,评测的goodcase率要比MJ高10个点左右,广告主测评采纳率混元比MJ高48%。”康战辉透露。

另外,混元代码、数学能力大幅提升后,当前也已经能在软件研发、学习等环节提供更多帮助。当前,腾讯混元代码处理水平提升超过20%,代码处理效果在实测中高于ChatGPT 6.34%,在HumanEval公开测试集指标上超过Starcoder、Codellama等业界头部开源代码大模型。

只需输入简单的指令如“帮我用前端语言实现一个贪吃蛇”,腾讯混元便能自动生成可运行的代码,快速制作出一个贪吃蛇小游戏。

来源:腾讯

此外,腾讯混元还支持Python、C++、Java、Java等多种语言的指令生成,比如输入“用Python画红色的心形线”,腾讯混元也会提供代码库选择、安装命令、绘制代码等具体操作步骤的指引。

目前,腾讯内部已经有多个开发平台接入了腾讯混元大模型,工程师们可以使用腾讯混元来进行代码生成、代码补全、代码漏洞检测和修复、表格数据处理、数据库查询等工作。


返回网站首页

本文评论
Stable Diffusion发型与发色Prompt常用提示词汇总
本文整理了在使用 Stable Diffusion 或 Midjourney、NovelAI 等 AI制图时,想要变更发型时可以参考的 Prompt提示词词汇,基板涵盖了大家日常会使用的发型名称种类。一、头发的...
日期:04-10
英特尔布局移动芯片 ARM联手国内新贵同台竞技_ARM 英特尔
《IT时代周刊》记者/蓝晓熙(发自北京)随着智能手机与平板电脑市场日渐扩大,移动上网终端的发展速度远远快于传统PC,这一趋势也促使英特尔开始涉足日益增长的移动芯片市场 智能...
日期:07-28
工信部:我国5G标准必要专利声明量全球占比达42%_我国5g专利数量
通信世界网消息(CWW)10月20日,在国新办举行的前三季度工业和信息化发展情况新闻发布会上,工业和信息化部新闻发言人、总工程师赵志国表示,5G作为新一代信息通信技术的代表,已成为...
日期:10-22
工信部陆洋:鼓励先行先试,打造5G消息规模应用高地_工信部 陆峰
通信世界网消息(CWW)11月15日,由中国通信企业协会增值服务专业委员会、中国通信企业协会虚拟运营分会、5G消息工作组、新通话工作共同举办的“第二十届增值电信及虚拟运营年会...
日期:11-17
西班牙5G国家补助或将华为排除 华为提出上诉
10月10日消息,当地时间周一,华为对西班牙政府出台的5G国家补助规定提出上诉,因为该规定可能导致华为失去获得补助的资格。西班牙已承诺提供超过5亿欧元(约合5.27亿美元)国家补助,...
日期:10-10
淘特发布三大招商新政策:全店服务费减免等「淘特商家入驻条件」
11月15日 消息:淘特发文称,双十一期间,淘特喜提苹果App Store应用榜单第一,同时宣布三大招商新政策,降低新商的入驻门槛。具体来说,三大招商政策为:全店服务费减免;在本政策有效...
日期:11-16
超高端智能手机占 2022 年第二季度智能手机总收入的一半「2020国内智能手机份额」
10月9日消息:根据Strategy Analytics发布的数据,超高端智能手机批发价在600美元及以上,占2022年Q2智能手机总收入的一半,略低于前两个季度。除了100-190美元 (批发) 的中端价位外...
日期:10-10
稳定性差?功能不完善?腾讯课堂极速版10秒解决在线教学难题_腾讯课堂网络不佳
  刷题,刷完英语刷文言文,然后是数学、物理……高考应届生方方(化名)在刷题中跨入新年。除夕当晚,班上QQ群里有两次特别热闹,第一次是班主任发红包,大家互道“新年快乐”...
日期:06-10
picoVR一体机「字节旗下PICO发布PICO 4 VR一体机:售价2499元起」
9月27日 消息:今日晚间,字节旗下的PICO正式发布了新一代PICO4VR头盔,配备了双眼4K+高分辨率的超视感屏,刷新率也达到了90Hz,重量仅为295g,售价2499元起。2020电视盒子哪个牌子最...
日期:09-28
卖旧手机又不想泄露数据,只恢复出厂设置可不行「二手手机恢复出厂设置,数据还会被盗吗」
较真要点01仅通过手机恢复出厂设置不能保障信息安全,稳妥的办法是在手机恢复出厂设置并重启后,通过多次拷贝视频、下载软件等方式,把原有手机存储内存占满,覆盖掉原有数据,然后再...
日期:09-22
女神节,这些电影必须看,来华为视频尽享佳片!_女神节观影
  女性能顶半边天,喜迎三月女神节!   各位使用华为、荣耀手机的女神们有福了   华为视频为你们准备了一张片单,   盘点女神节必不可少的十部经典佳作。   女神节,看...
日期:03-25
意外!它从线上夜总会起家:1年干46亿,吸引2亿中年人
声明:本文来自于微信公众号 铅笔道(ID:pencilnews),作者:铅笔道,授权转载发布。昨天,周鸿祎成功收获第四家上市公司:花房。第一家是2016年从纽交所退市的奇虎360,第二家是2018年在...
日期:12-14
realme Q5系列官宣4月20日发布_realme新旗舰最新消息
  realme 今日官宣,真我 Q5 系列将于 4 月 20 日 14:00 正式发布,口号为“超速玩家,冲啊!”   realme 副总裁、中国区总裁、全球营销总裁徐起此前在社交媒体表示:“realme...
日期:07-18
拉手短视频价值究竟有多大?_拉手短视频骗局
  如果说,2020年是互联网寒冬,那“短视频”一定就是寒冬里最温暖的存在。   据报Qusetmobile2019年半年报告,截至2019年6月,短视频用户规模已超8.2亿,这意味着:每10个移动互...
日期:07-14
深圳计算科学「集中签约!深算院YashanDB关键行业商用提速」
(原标题:集中签约!深算院YashanDB关键行业商用提速) 11月17日,深圳计算科学研究院在2023深圳企业创新发展大会主论坛上,与金融、...
日期:11-27
未经同意定制“AI换脸”视频还卖教程 一男子被判赔60000元
8月23日 消息:据杭州互联网法院消息,近日,杭州互联网法院组成七人合议庭,对公益诉讼起诉人杭州市萧山区人民检察院诉虞某个人信息保护民事公益诉讼案公开开庭审理,判令被告虞某...
日期:08-23
良性的运营助好乐买6月发力品牌建设_好乐买运营状况
  随着电商企业在国内的不断发展,不少的企业纷纷投身品牌建设。而众所周知,品牌建设需要良好的运营体系和供货系统作为支撑。不过通过凡客在品牌建设上的成功可以看出,优秀...
日期:07-30
全铝车身同级仅有 奇瑞eQ7首车量产下线:预计售价20万以内「奇瑞eq1售价」
快科技7月12日消息,奇瑞新能源旗下全新纯电SUV车型eQ7首台量产车正式下线,同时奇瑞还发布了中国首个铝基轻量化平台。小米手环3 nfc 门禁 公交卡切换丰田霸道机械钥匙eQ7采用...
日期:07-12
特斯拉开始生产Semi电动卡车 首批12月交付「特斯拉 电动货车」
10月8日消息,特斯拉CEO马斯克的最新推文显示,特斯拉已经开始生产Semi电动卡车,并计划于12月1日开始向百事公司交付。百事公司周五也证实,将于12月1日开始接收特斯拉的Semi电动卡...
日期:10-10
Midjoureny网站Alpha版本优化 增加3个分类
1月25日 消息:Midjoureny网站的Alpha版本进行了一系列体验优化,主要是对探索页面进行了改进。这次更新主要包括对鼠标悬停效果的丰富化,对页面内容的进一步优化,以及新增了热门...
日期:01-25