您的位置:首页 > 媒体评论

2022 谷歌、抖音和百度涌向AIGC

发布时间:2023-01-15 02:05:02  来源:互联网     背景:

就在本月,WSJ 引述知情人士称,作为 2022 年爆红的聊天机器人 ChatGPT 背后的公司,OpenAI 正在谈判以收购要约的形式出售现有股份,这起交易对 OpenAI 的估值达到 290 亿美元左右。在 2021 年的一场交易中,OpenAI 的估值还只是在 140 亿美元左右。

估值高涨的背后不只是因为 ChatGPT,OpenAI 旗下另一个 AI 生成图像模型——DALL-E 2 同样展现了生成式 AI 的能力可以有多高。2022 年,从 Stable Diffusion 以开源形式引爆 AI 创作,到 GPTChat 一周内就突破了百万级用户注册,全球出现了无数生成式 AI 的产品和创业公司,文本、图像乃至视频,掀起了巨大的 AIGC(人工智能生成内容)浪潮。

AI 绘画,图/抖音

基于 Stable Diffusion 开源模型,字节也推出 2022 抖音年度爆款「AI 绘画」,统计显示有 2758.3 万人使用过这款特效。抖音和快手都看到了 AIGC 技术在图像应用上的巨大价值,快手对 AIGC 的布局也证实了这一点。快手在 11 月联合百度 AI 数字人希加加、度晓晓等发布短视频,进行 24 小时 AI 直播,还通过 AIGC 技术进行作画、写诗、写歌词等。

6 月,一位谷歌高级软件工程师甚至声称,谷歌开发的对话式 AI LaMDA「有意识、有灵魂」,但随后很快被谷歌否认。而在一个月前,谷歌刚刚在 2022 年 I/O 大会上公布了 LaMDA2,称其为谷歌有史以来最先进的对话式 AI,与年底红遍全球的 ChatGPT 有着相同的语言模型技术和原生应用场景。

12 月 16 日,知名学术期刊《科学》杂志公布了 2022 年十大科学突破,记录一年里最重大的科学发现、进展和趋势,其中一项就是「AI 具备创造力」。用我们更熟悉的词就是:AIGC,即基于 AI 能力的内容创作。

当 AI 开始拥有大规模创造内容的能力,很多事情都可能被颠覆。

AI作画开始大众化

图/OpenAI

2022 年 4 月,人工智能研究公司 OpenAI 发布了新版本的文本生成图像程序——DALL-E 2,随后一张由 DALL-E 2 生成的「宇航员在太空骑马」图片开始蹿红社交网络。

相比前代,DALL-E 2 生成图像有了更高的分辨率和更低的延迟,同样基于用户描述文本进行生成。不过和之前 OpenAI 推出的产品一样,DALL-E 2 开始并不对外开放,仅限部分研究人员注册使用该程序,一直到 9 月才宣布向公众开放使用,每月仅限 15 个免费图像。

这也为下半年 Stable Diffusion 的爆火和流行提供了机会。如果说上半年最火的「AI 画师」当属 DALL-E 2 和 Midjourney,8 月 22 日 Stable Diffusion 发布之后基本就成了「AI 画师」的代名词。

在目前的三大 AI 图像模型中,Stable Diffusion 诞生得最晚,但由于发展良好的开源社区,它的用户关注度和使用范围都超越了 Midjourney 和 DALL-E。任何人都可以免费使用,任何公司也可以基于开源项目定制自己的 AI 生成图像程序。

「一个不在乎人工智能争论的老艺术家」 ,图/DrMacabre68

「我们已经看到 3 岁到 90 岁的人第一次开始创作。」StabilityAI CEO Emad Mostaque 在一次采访中说,该公司资助了 Stable Diffusion 的开发。在海外知名论坛 Reddit 的「StableDiffusion」板块下,每天都有用户分享通过 Stable Diffusion 生成新的图像作品。

到现在「AI 画师」已经可以走入千家万户。用户可以在本地部署,普通消费级显卡就能满足硬件要求,也可以直接输入一串网址,直接输入描述文本开始创作,这是 2021 年 DALL-E 初代发布的时候不敢想的。

不仅如此,「AI 画师」出现和流行也在 2022 年挑战人类的美术和图片产业。

9 月,全球最大图库盖蒂图片社(Getty Images)宣布禁止上传和销售使用 DALL-E、Midjourney 和 Stable Diffusion 等 AI 艺术工具生成的插图。盖蒂认为 AI 产生的图片并非是一种人类创造性的艺术品。

《太空歌剧院》,图/Jason Allen

同月,游戏公司 CEO 兼游戏设计师 Jason Allen 通过 Midjourney 生成的《太空歌剧院》,在美国科罗拉多州博览会举办的艺术展中一举夺得数字艺术组大奖。

但这次获奖也引起了广泛的争论,有人认为这对其他自己创作的人不公平,「这就跟为什么我们不让机器人参加奥运会的原因完全一样。」参加评审的艺术家杜兰(Cal Duran)甚至表示,他在评分的时候根本没意识到这幅画由 AI 生成。

相比之下,百度更加务实,一开始就确定了自己「辅助」定位。8 月,百度基于自身的文心大模型也推出了AI 绘画平台「文心一格」,更明确定位为面向有设计需求和创意的人群,基于文心大模型智能生成多样化AI创意图片,辅助创作者的创意设计。

在技术之外,AI 生成图像还在探索如何解决版权等一系列问题。

用嘴做视频?还要再等等

作为 AI 大厂,Meta 和谷歌实际上没有缺席任何一个重要的 AI 技术,在 AI 视频生成上更是独领风骚。

Meta 在 9 月率先推出了 Make-A-Video,言简意赅地表达了它的作用:做视频。更具体地说,Make-A-Video 可以通过文本、图片或者视频来生成一个全新的视频内容,尤其是文本直接生成视频,直接让视频创作的门槛大大降低,比如输入「机器人在时代广场跳舞」:

图/Meta

仅仅一周后,Google 也发布了自己的 AI 视频扩散模型 Imagen Video。与 Make-A-Video 相比,Imagen Video 最直接的感受就是清晰度更高——画面分辨率可以达到 1280×768,帧率也能到 24 fps 了。

不过,两者实际上都还存在画面不正常抖动、主体畸形、动作不够流畅等问题,而且与之前推出文本生成图像程序一样,谷歌和 Meta 都没有选择对外开放,这也是为什么相比 AI 画画的流行,AI 生成视频领域更多还是处在看热闹的阶段——就像 2021 年的 AI 生成图像。

字节也看好 AI 视频模型的未来,在抖音内就支持了「图文成片」功能,输入一段文字,软件智能匹配图片素材、添加字幕、旁白和音乐,自动生成视频。从一些创作者的反馈来看,目前「图文成片」的实现还很初级,智能匹配和生成视频两个环节都很难真正在视频生产环节中使用。

当下 AI 生成视频在技术上显然还不够成熟,但最近几年 AI 进化速度在肉眼可见地加快,很难想象今年 AI 视频模型又会发生什么样的质变。

不管 AI 视频模型是否能在今年再度质变,就如百度移动生态负责人何俊杰在 9 月的 2022 百度万象大会上所说,「未来十年,AIGC 将颠覆现有内容生产模式,可以实现以十分之一的成本,以百倍千倍的生产速度,创造出有独特价值和独立视角的内容。」

何俊杰,图/百度

可以预期,AIGC 将是 UGC 用户生成内容出现之后,又一个内容生产的大变革,最直接的应用就是大大降低视频制作的成本和门槛,这也意味着为视频内容在供给侧的大爆发提供了技术基础。

那场万象大会上,百度就推出了基于文心 AI 大模型的「创作者 AI 助理团」,由 AI 文案、AI 画师和 AI 视频制作人组成。理想状态下,借助「创作者 AI 助理团」,一个人就可以是一支视频团队。

但显然,现实是 AI 视频生成还需要一些时间。

ChatGPT,属于AI的「初代iPhone」

12 月初,OpenAI 发布了 ChatGPT——一个对话式 AI,发布后很快就在小范围内流行起来,随后持续发酵并风靡全网。从敲代码、写稿、写诗、推荐到教你学英语、写小说,甚至是一场类似人类之间的对谈,ChatGPT 都表现出了惊人的语言对话能力。

ChatGPT 甚至一度拉响了谷歌搜索的红色警报。

用 ChatGPT 修 bug,图/@amasad

与 OpenAI 之前发布的产品不同,ChatGPT 选择面向公众大范围公测,短短 5 天,其用户注册量就突破了百万级,这在互联网增长集体放缓的 2022 年多少有些不可思议。即便到了岁末年初,很多用户依然在使用 ChatGPT 做报告、写年终总结等事务,可见其表现带来的用户粘性。

ChatGPT 之所以脱颖而出,普遍认为很大程度上是因为它采用了很自然的措辞进行对话,有网友评价其使用体验「就像平常聊天」。而 ChatGPT 背后的核心之一是使用 GPT-3 的新版本 GPT-3.5 来进行对话,该版本拥有 1750 亿个模型参数。

诺比克除螨仪有用吗

事实上,从 GPT-3 引发全球范围 AI 大模型的军备竞赛开始,这件事一定程度上就是巨头之间的比拼。谷歌在 2021 年推出了万亿级参数的 AI 大模型——Switch Transformer,微软和英伟达烧坏了 4480 块 GPU 后,才开发出 5300 亿参数的自然语言生成模型 MT-NLG(威震天-图灵)。

「钱」,图/英伟达

rog游戏手机3红色接口

根据媒体报道,GPT-3 训练的仅是硬件和电力成本就高达 1200 万美元(约 7500 万人民币),GPT-3.5 应该只高不少。目前 ChatGPT 仍然是免费使用,但显然 OpenAI 不可能一直免费开放下去。

另一个对话式 AI 的问题在于——自以为是。大量的用户对话已经证明,ChatGPT 的回答并不可靠,但它又经常以令人信服的方式「胡说八道」。OpenAI 也承认,尽管 ChatGPT 生成的回答从语气上已经非常逼近真人,但有时仍会给出完全错误的答案。

这不是在否认 ChatGPT 带来的惊艳。Box CEO 亚伦·莱维认为,「当一种新技术已经到了改变你对计算机的看法时,你会有一种特定的感觉。谷歌做到了,火狐做到了,AWS(亚马逊)做到了,iPhone 做到了,OpenAI 正在通过 ChatGPT 做到这一点。」

写在最后

过去十年,可以说互联网和智能手机彻底改变了内容的分发和消费环节,但在内容生产领域本质上没有过多的变化。而在过去一年,AIGC 已经带来了太多的变化,Stable Diffusion、Imagen Video 和 ChatGPT 分别对应了最主要的内容形式——图像、视频和文本。

当然,AIGC 还在面对很多挑战,包括版权、生成质量不稳定、创作主体争论等,甚至 AI 生成视频还没有经过大众使用验证。但现如今 AIGC 开始「飞入寻常百姓家」,已经具备了成为一项大众化技术的基础,未来很可能极大地提高内容的生产效率和丰富度。

柯尼赛克gemera、四座跑车

从《太空歌剧院》获得艺术大奖到今天,AI 的争论依然没有停止,但就如 Jason Allen 为自己的事件所做的总结:AI 作画程序已经诞生,人们能做的只有承认并接受这件事。

题图来自 StabilityAI


返回网站首页

本文评论
CES:荣耀、平庸与疯狂
作者:宇多田,题图来自:电影《头号玩家》中国企业仍然对硅谷充满敬畏,但这样想的人近来明显少了。2023年1月5日,暂停两年重新开启的CES电子消费展,是冲撞开两大洲之间高墙的第一道...
日期:01-14
抖音观看超过60分钟_追剧过瘾了!抖音将开放发布超30分钟视频权限:支持4K 120帧
  你有没有发现,手机里的抖音App每天打开的次数已经超过了优酷、腾讯视频等视频App?在抖音追剧已然成为碎片化时代下的潮流。中建财务一体化平台  日前,抖音召开2022抖音创...
日期:09-22
谷歌安全性设置_谷歌对Android 13隐私安全进行优化
  【ITBEAR科技资讯】8月17日消息,近期,谷歌正式宣布Android 13开源,并将源代码上传到Android开源项目(AOSP),这意味着各大厂商基于新系统的ROM将很快推出。饿了么渠道运营3d...
日期:08-19
年轻人不换手机了?国产手机如何“活下来”_为什么年轻人经常换手机
有份量的国产品牌当华为Mate 50将于9月6日发布的消息公布后,因为紧邻iPhone14的发布时间,让外界嗅到了一丝火药味。作为华为颇具代表性的高端旗舰机,本该在去年发布的华为Mate5...
日期:09-02
手机快充技术的发展_岂单止于快!盘点近年手机快充闪充发展史
近些年来,随着手机性能的不断提升,以及人们生活对手机依赖性的增强,对快充的需求也与日俱增。2022年7月19日,iQOO发布了iQOO10Pro,这是第一款突破200W功率快充的手机,从最初的5V1A...
日期:10-22
2022年还会缺芯片吗_请回答2022:芯片寒冬何时休?
这个世界变化太快。去年全球还在经历芯片短缺的危机,从智能手机、PC 到汽车,各个行业都在抢占芯片产能,加大库存。高通 CEO 安蒙为此彻夜难眠,小鹏汽车董事长何小鹏也在发愁芯片...
日期:12-31
日本汽车拆解_日本人,到底拆了多少中国车?
出品 | 虎嗅汽车组作者 | 李文博编辑 | 周到头图 | 纪录片《决定性瞬间》2022 年 10 月 10 日,世界第一汽车品牌、日本第一大汽车公司丰田发了台叫 bZ4X 的全新电动车,喜欢这...
日期:10-19
“老虎”没肉吃 “狮子”没水喝_老虎能吃狮子
摄影:IT时报 沈毅斌一边是双11线上电商促销活动如火如荼,而另一边,老牌家电零售企业国美、苏宁却一片寂静。打破这场寂静的不是销量,而是国美欠薪和苏宁亏损。10月28日,国美电器...
日期:11-15
meta万元天价头显背后:牵手敌人微软 意在苹果
文丨邱晓芬编辑丨苏建勋近日,Meta发布一款万元天价头显产品Quest Pro。这款热度极高的VR产品,在发布之后因为价格过高备受争议——扎克伯格这次的定价策略则相当激进,1500美元...
日期:10-19
英特尔啥时候出新cpu_英特尔进入“蛰伏期”
今年,各个行业的发展处境都不太好,大家都进入到寒冬。Strategy Analytics公布的最新数据显示,第三季度全球手机出货量同比下降9%,仅为2.97亿部。其中除了苹果取得6.4%的小幅增长...
日期:11-12
好好的年轻人,为啥偏爱玩弄老相机?_现在年轻人用什么相机
作者 | 黄瓜汽水题图 | 渣渣郡CCD相机,在小红书一火就是大半年。曾经被称为电子垃圾的卡片机,这次让广大民间摄影师们跌了个踉跄——不管是玩徕卡的还是玩哈苏的,看完CCD爆火都...
日期:11-14
不让用就直接取消?iPhone 15或将不再配备充电口!_iphone13会不会取消充电口
上个月,苹果正式发布了iPhone 14系列,不过这次苹果并没有为iPhone 14更换全新的充电接口,依然采用沿用了10年的Lightning接口,而非传闻中的USB-C接口。众所周知,苹果一直以来都...
日期:10-18
特斯拉的人形机器人“炸弹” 或再造“蔚小理”_特斯拉机器人制造
图源:特斯拉apple pencil技术3至5年后,数百万台人形机器人从特斯拉工厂下线,以低至2万美元的价格送往千家万户。“比汽车更便宜!”这是马斯克为其人形机器人Optimus(擎天柱)画下的...
日期:10-14
主机大战再起:“御三家”发布多款新游“大作移植”拉新客「御三家 主机」
9月17日,95后玩家刘浩在家翻出“吃灰”已久的PS5,熟练地登陆进《战神4》游戏。他计划在《战神:诸神黄昏》上线前,将游戏前作剧情重温一遍。三天前,主机游戏市场“三巨头”任天堂...
日期:09-20
钱包你都瘦了_“躺瘦”:钱包空了、焦虑来了?
撰文/ 卢 丽编辑/ 陈邓新夏天的炎热逐渐褪去,有的在朋友圈晒起了“秋天的第一杯奶茶”、“秋天的第一束花”,而有的则晒起了“秋天的第一顿减脂餐”。随着越来越多人注重饮食...
日期:09-20
一个胚胎带三人DNA:中国研究表明可行
原标题:一个胚胎带三个人DNA,中国研究者首次证明其发育安全性一个胚胎,带着三个人的DNA。你见过么?近日,Nature上就报道了这么一项成果——来自中国的研究者们不仅实现了将三个人...
日期:10-06
官翻机是个好生意 但只有苹果做出了知名度「苹果官翻机好吗」
前阵子,苹果发布了iPad10。对这样一款非常有争议性的产品,雷科技编辑部的小伙伴们自然毫不客气,纷纷开炮吐槽。在一番讨论后,我们都得出了它不是很值得买的结论。而且,还有人在苹...
日期:11-11
记忆是如何欺骗我们的?「记忆是如何欺骗我们的英文」
这两天,“天将降大任于是人还是斯人”引发了全网大讨论,事情是这样的:一个知乎网友发现,中学学过的课文“故天将降大任于斯人也”,课本原文居然是“是人”不是“斯人”。不止是他...
日期:10-31
腾讯地图正式接入微信状态,可一键设置旅行“足迹”-移动互联-ITBear科技资讯
  【ITBEAR科技资讯】6月27日消息,今日,微信官方公众号微信派宣布腾讯地图正式接入微信状态,支持用户将个人旅行“足迹”一键设为微信状态。  据了解,用户可通过在腾讯地图...
日期:07-10
《三体》动画定档12月 B站推出49部国创作品新内容「b站的三体动画真的可以看了吗」
10月29日,哔哩哔哩(以下简称“B站”)举办了2022-2023国创动画作品发布会,宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。图片来源 B站《三体》动画将于12月3日...
日期:11-06