您的位置:首页 > 互联网

40B已在Amazon SageMaker JumpStart中可用 “史上最强开源大语言模型”Falcon

发布时间:2023-09-24 16:41:31  来源:互联网     背景:

【】6月9日消息,在Hugging Face上登顶、并搅动大模型领域风云的“新选手”Falcon 40B又有了新动态。

亚马逊云科技宣布,从6月7日起,两个开源Falcon大语言模型Falcon 40B和Falcon 7B已在Amazon SageMaker的机器学习中心Amazon SageMaker JumpStart中可用。

SageMaker JumpStart提供了预训练模型、内置算法和预构建的解决方案模板,可帮助用户快速上手机器学习,以执行文章总结和图片生成等任务。

用户只需在SageMaker Studio中轻点鼠标就可以部署和使用Falcon模型,或者通过SageMaker Python SDK以编程方式使用。

这意味着,现在,各个行业、各种规模的企业/开发者都可以快速轻松地部署自己的Falcon 40B模型,并对其进行定制以满足特定需求,如翻译、问答、信息总结、图像识别等应用程序。此举对生成式AI行业发展可谓意义重大。

Falcon 40B是谁?牛在哪儿

Falcon 40B是阿布扎比技术创新研究所(TII)推出的开源大型语言模型,是阿联酋首个大型人工智能模型。

Falcon 40B参数400亿,在1万亿高质量token上进行了训练。其性能超越硅谷大佬扎克伯格旗下650亿参数的LLaMA,以及StableLM、RedPajama和MPT等知名开源模型,一举登顶HuggingFace 开源大语言模型全球榜。 

Hugging Face 开源LLM排行榜

Hugging Face一直被认为是大模型领域GitHub,因此Hugging Face的榜单被从业者给予了很高的参考价值。

苹果13为什么这么香

不仅性能剽悍,Falcon 40B还是一个在训练资源上有很高效率的模型,只用到GPT-3 75%的训练预算,性能就显著超越GPT-3,且推理阶段的计算也只需GPT-3的1/5。

优异的表现让Falcon 40B获得“史上最强开源大语言模型”称号。

更重要的是,Falcon 大语言模型采用开源Apache 2.0许可证,基于开源原则,广泛地允许“免费使用”(如果商业化开源收入超过100万美金,需要缴纳10%的授权费用),这为广大AIGC产品开发者大开了方便之门。

开源的Falcon 40B让开发者能够构建和定制满足独特用户需求的AI工具,模型权重可供下载,检查和部署在任何地方。

苏宁内购会

基于亚马逊云科技训练完成

此番,Falcon开源大语言模型在Amazon SageMaker JumpStart中可用,可谓对生成式AI行业意义重大,广大开发者都很是兴奋。

事实上,Falcon大语言模型和Amazon SageMaker的“渊源很深”。

Falcon 大语言模型提供的两个不同规模的开源版本——Falcon 40B和Falcon 7B均是使用Amazon SageMaker的数据预处理和模型训练任务从零开始构建。

通常而言,构建、训练和部署大语言模型可能需要数周甚至数月的时间,并耗资数千万美元。为了实现更好的性能和成本效益,TII使用Amazon SageMaker构建其Falcon 40B模型。

SageMaker是一个托管API集合,用于开发、训练、调优和托管机器学习(ML)模型,包括大语言模型。SageMaker Training提供了具有用户自定义硬件配置和代码的计算集群。计算作业按运行次数计费,按秒分配任务,这意味着用户在未使用服务时无需为GPU资源付费。

据悉,TII使用SageMaker Training API提供的瞬态集群来训练Falcon大语言模型,最多支持48个ml.p4d.24xlarge实例(384个英伟达A100 GPU)。

现在,TII正在训练下一代Falcon大语言模型,将训练扩展到3136个A100 GPU(392个ml.p4d实例)。

除了Falcon外,Stability AI、AI21 Labs和LG AI等知名大模型也是使用SageMaker处理其大语言模型工作负载。

从TII对Amazon SageMaker的深度使用来看,为了让客户更轻松地访问该模型,Falcon 40B可以通过Amazon SageMaker Jumpstart部署可谓是水到渠成。

模型拿来可用 加速AIGC应用产品落地

在生成式AI赛道上,亚马逊云科技可谓是“既要”、“又要”的典型代表。“既要”为第三方大语言模型产品如Falcon 40B、Stability AI等提供基础计算能力和训练平台,同时,“又要”为第三方客户/开发者提供诸多可使用的“大语言模型产品”。

今年4月,亚马逊云科技推出Amazon Bedrock托管服务和Amazon Titan模型。Amazon Bedrock让开发者可以通过API访问AI21Labs、Anthropic和Stability AI等热门AI公司的预训练基础模型,还提供对亚马逊云科技开发的基础模型系列Amazon Titan的独家访问。

现在,通过Amazon SageMaker JumpStart,各行业客户都可以快速轻松地部署自己的Falcon 40B模型,并进行个性化定制。

那么,截至目前,在亚马逊云科技,开发者可以访问、部署、使用的大语言模型就有AI21Labs、Anthropic、Stability AI、Amazon Titan、Falcon 40B等。开发者可以在其中找到适合自身业务的模型,快速上手,使用自有数据基于基础模型进行定制,并将定制化模型集成并部署到应用程序。这一方式无疑将极大加速大语言模型应用产品的落地。

 


返回网站首页

本文评论
苹果招聘职位「苹果发布多份关于AI岗位招聘  努力为iPhone等设备推进人工智能」
5月23日 消息:近几个月来,Apple发布了数十份专注于人工智能 (AI) 的招聘信息,这表明该公司其正在加大在人工智能领域的努力。这家科技巨头目前在其招聘门户网站上发布了至少88个...
日期:05-23
QuestMobile发布2022年中国移动互联网大报告:腾讯课堂获评用户规模增长之星,平均月活同比增长541.71%
  1月26日,中国专业移动互联网智能服务平台QuestMobile发布《2020中国移动互联网年度大报告(上篇)》,对2020年和2021年互联网行业发展进行总结分析与趋势预测,并公布2020...
日期:07-10
趣店目标从大学生转至宝妈 罗敏的预制菜背后涉金融借贷业务
作者: 吕倩   在微博搜索“罗敏”,显示页面顶端仍是趣店创始人罗敏在微博投放的广告“趣店预制菜”。与之形成鲜明对比的是,广告下方即是冲上热搜的词条“罗敏到底得罪了多少...
日期:07-31
美股周二:三大股指全线下跌,谷歌涨逾2%,百度涨超4%_美股上周的股票
5月17日消息,美国时间周二,美股收盘主要股指全线下跌。投资者仍在关注美国白宫与国会就债务上限问题谈判的最新进展。道琼斯指数收于33012.14点,下跌336.46点,跌幅1.01%;标准普尔...
日期:05-17
iPhone 15 Pro首发A17 Pro:全球首款3nm芯片
快科技9月13日消息,iPhone 15 Pro正式亮相。这次苹果为其配备了A17 Pro芯片,官方强调:这是业界首款3nm手机芯片。据悉,iPhone 15 Pro首发搭载的A17 Pro采用6核心设计,包含2颗高性...
日期:09-13
天猫超市直播间成为杭州首批放心消费直播间「天猫超市直播间主播」
9 月 30 日消息,日前,浙江省市场监管局消费者权益保护分局局长祝永飞走进杭州首批放心直播间培育单位天猫超市直播间,和网友进行了 1 小时的互动。据祝局长介绍,今年以来,杭州、...
日期:10-01
特斯拉Q1财报:营收增长24%,净利润下降24%「特斯拉2021年营收」
特斯拉2023年第一季度财报显示,总营收为233.29亿美元,较去年同期增长24%,但净利润为25.13亿美元,较去年下降24%。该公司总毛利率降至19.3%,低于分析师平均预期的22.4%。iphone14p...
日期:04-20
小米10s12期免息「小米12S立减600 3000出头分期还免息」
国庆已经过完,但手机市场的促销仍在继续,现在小米12S手机立减600元,现在到手只要3399元了,还有分期免息,赠品等活动,强劲的性能配合MIUI 13不错的调校,强强联手打造的小米12S手机有...
日期:10-09
intel和nvidia关系「NVIDIA与Hugging Face将连接数百万开发者与生成式AI超级计算」
通信世界网消息(CWW)NVIDIA与Hugging Face宣布建立合作伙伴关系,为数百万开发者提供生成式AI超级计算服务,帮助他们构建大语言模型(LLM)和其他高级AI应用。此次合作将使开发者能够...
日期:08-09
阿里巴巴第四财季营收2082.0亿元 同比增长2%
5月18日晚消息,阿里巴巴集团公布2023财年第四季度(自然年2023年第一季度)及全年业绩。2023年1至3月,营收2082.0亿元人民币,同比增长2%,预估2091.9亿元人民币;调整后EBITDA为321.2亿...
日期:05-18
无一英寸大底 Ultra性能全面下放 雷军爆料小米13新品影像性能曝光
就在刚刚,雷军用小米13在微博上放出了小米13系列影像性能曝光,放出了预热海报,并配文”Ultra 同款徕卡光学镜头、徕卡原生双画质、大师镜头包,还有万物追焦、闪电连拍(每秒30张连...
日期:12-01
机械硬盘越混越惨了:三大品牌出货量雪上加霜(机械硬盘品牌占有率)
机械硬盘本就遭遇着被SSD取代的艰难时刻,没想到又遇到PC电脑空前的低迷危机,境况可想而知了。来自StorageNewsletter和Trendfocus联合发布的数据显示,今年第二季度,全球机械硬盘...
日期:08-19
寺库回应“人去楼空”:正常办公面积 奢侈品回归专业仓库
8月17日消息,今日有媒体报道称“奢侈品电商寺库疑似跑路,人去楼空”。对此,寺库方面否认了这一说法表示,目前办公面积并未缩减,属于正常办公状态。8848m5钻石版iqoo8光学防抖...
日期:08-19
时隔109天,李佳琦回来了!2小时超6000万观看,但直播江湖已变天_1月24日李佳琦直播
  记者/叶晓丹安卓和win10双系统  编辑/何小桃;董兴生 杜波  李佳琦重返直播间,时隔109天。  2小时,超6000万观看,多个链接售罄,再一次校验了李佳琦作为超头部主播的带...
日期:09-22
我国在这一领域,取得重要突破的成果「我国在这一领域,取得重要突破」
我国发布荷斯坦牛中高密度基因组选择育种芯片一张全基因组育种芯片上均匀分布超12万个基因位点,检出率和检测准确率超99%,技术达国际先进水平……12日在第三十届中国北京种业...
日期:09-14
网易云音乐首款音乐社交App MUS正式开放注册_网易云音乐APP介绍
  9月27日,网易云音乐首款音乐社交App MUS正式开放注册。2021中国企业500强榜单出炉百度2020年oppo手机上半年手机销售情况富士康iphone13产能apple watch nike表盘有哪些...
日期:09-27
全新支付宝上线华为WATCH 3:手表能偷能量球了_华为手表3应用
手表收蚂蚁森林绿色能量还不过瘾?那就在手表上跟好友的能量球们打个招呼吧!苹果 反垄断法10月13日,全新支付宝现已在华为WATCH 3系列手表上线,好友的能量球,都归你。安装方法:1、...
日期:10-17
调查称社交媒体影响工作效率 电邮居首
新浪科技讯 北京时间5月23日上午消息,社交邮件软件厂商Harmon.ie日前发布的调查报告显示,Facebook、Twitter、电邮等社交媒体工具严重影响了员工的工作效率。 报告称,专为提...
日期:07-28
魔趣摩托罗拉手机论坛_摩托罗拉奇葩手机
是一个致力于摩托罗拉手机开发和技术讨论的论坛。在这里,能够看到关于摩托罗拉手机的最新消息、评测和开发教程,可以深入了解摩托罗拉手机的内部结构和技术特点,更重要的是能够...
日期:05-29
茄子互联网有限公司_茄子科技(SHAREit Group):以科技实力锚定商业价值高地
  在移动互联网产品中,拥有超10亿用户量级代表了其“爆款”的身份,同样在技术支持上也是一个门槛,对数据处理与稳定性上有更加复杂的考验。作为出海领军企业,茄子科技(海外SH...
日期:10-03