您的位置:首页 > 互联网

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了

发布时间:2024-04-24 00:10:17  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:关注前沿科技,授权转载发布。

iqoo7支持120w快充吗

Llama3发布刚几天,微软就出手截胡了?

图片

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。

图片

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama38B

为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。

图片

微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone14pro和iPhone15使用的苹果A16芯片上跑到每秒12token。

图片

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

图片

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

图片

除了mini杯之外,小杯中杯也一并发布:

Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。

Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral8x7b MoE。

(大杯他们目前不打算做)

作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

图片

那么,Phi-3系列到底有什么独特之处呢?

根据技术报告中披露,其核心秘诀就在于数据

去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need

图片

Phi-3也延续了这一思路,这次他们更是下了血本:

  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)

  • 大幅强化了数据的”教育水平”过滤

  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能

  • 独特的指令微调和RLHF训练,大幅提升对话和安全性

举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据

这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。

图片

不过小模型毕竟是小模型,也不可避免存在一些弱点。

微软透露,模型本身参数中没能力存储太多事实和知识,这一点也可以从TriviaQA测试分数低看出来。

缓解办法就是联网接入搜索引擎增强。

自由落体八秒

图片

总之,微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去,未来还打算继续增强小模型的多语言能力、安全性等指标。

对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。

图片

参考链接:

[1]https://arxiv.org/abs/2404.14219


返回网站首页

本文评论
行业观察丨新日超战略全球发布会给行业发展带来了哪些启示
  6月8日,新日电动车“新日超战略全球发布会”在无锡举行。在发布会上,新日公布了其新品牌战略,以及其自主研发的新一代汽车级锂电池和MIKU Super、XC2两款新品。新日董事长...
日期:07-14
谷歌:Facebook封闭 不改变将很快寿终正寝_facebook被暂时封锁
  9月24日消息,据国外媒体报道,TCP/IP的设计人、谷歌首席互联网专家温顿-瑟夫(Vint Cerf)今日警告称,Facebook“封闭”的结构意味着该公司最终将不能满足公众对一个开放标准...
日期:07-23
2014年智能手机等设备将占移动通讯流量的87%_由于通信网络的快速发展,中国智能手机用户数量近年来
  据市场研究公司ABI Research发表的一篇关于美国移动运营商网络通讯流量的报告称,智能手机和连接到网络的计算设备将是未来五年推动数据通讯流量增长的主要因素。到2014...
日期:07-29
搭载“鸡血版”骁龙8 Gen2+200W快充 「iQOO」-11S配置细节曝光「骁龙8cx gen2」
上半年已接近尾声,各大品牌旗下的顶级旗舰都已悉数亮相,因此这段时间以来,关于下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系列,日前有爆料称...
日期:09-12
小天才官方禁用是什么意思?_“小天才”被责令封禁不良应用
本报讯(记者;;王薇)对确认违规App立即下架永不上架,对已经下载的不良应用进行封禁,家长端App增加“远程安装”功能等。昨天,北京市消费者协会、天津市消费者协会、河北省消费者权...
日期:08-20
《面向未来智能家电系统基础软件发展白皮书》正式发布_未来智能家电的功能
   11 月 16 日,国家高端智能化家用电器创新中心、中国信息通信研究院联合产学研上下游机构和厂商,共同发布了《面向未来智能家电系统基础软件发展白皮书》。该白皮书旨在家...
日期:11-17
Lexar雷克沙联手老罗“交个朋友”,双十一高端存储专场迎来开门红
2023 年双十一购物节,全球领先的存储方案解决商Lexar雷克沙首战告捷。 11 月 1 日,Lexar雷克沙正式发布了双十一开门红战报。根据各大电商平台给出的数据,Lexar雷克沙实现全面...
日期:11-03
大调整!iPhone 15 Pro Max或改名为iPhone 15 Ultra「iphone11promax更新ios15吗」
【手机中国新闻】前不久,苹果发布了最新一代iPhone 14系列,目前新机已经开售,其Pro系列凭借“灵动岛”的设计俘获了一众果粉的心而大卖。从iPhone 11到14系列,苹果手机的Pro Max...
日期:09-14
荣耀X30 Max正式开售,2399元起大屏观影爱好者首选(荣耀x30max中关村)
  近日,荣耀发布2021年迄今为止行业内唯一5G超大屏手机——荣耀X30 Max,带来了大屏幕、大音量、长续航三大Max体验,受到用户的热烈关注。11月11日10:08,荣耀X30 Max正式开售,...
日期:07-17
美股周五:亚马逊跌超8%,热门中概股普跌,蔚来跌逾6%_美股即将暴跌
美国时间周五,美股收盘主要股指全线下跌,以科技股为主的纳指领跌。美国1月非农就业人口意外强劲增长,同时苹果等三家科技龙头公布的财报令人失望。道琼斯指数收于33926.01点,下...
日期:02-04
人人视频遭奈飞、索尼、迪士尼等多家海外影视公司起诉
2月5日消息,据天眼查App显示,近期,人人视频关联主体公司上海众多美网络科技有限公司新增多个开庭公告,案由涉及“著作权权属、侵权纠纷”“侵害作品信息网络传播权纠纷”等。天...
日期:02-05
好未来数学领域千亿级大模型MathGPT开启公测「好未来网」
【】8月24日消息,在好未来20周年直播活动中,CTO田密宣布好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测。即日起,用户可通过官网(www.mathgpt.com )申请注册账号免...
日期:09-16
涉黄!苹果紧急下架了吗「涉黄!苹果紧急下架!」
有网友在苹果应用商店发现一款伪装成学习软件的黄色软件,年龄分级在4岁以上,且会引流到赌博和其他黄色网站。对此,许多网友表示,此种伪装软件十分容易误导使用者,尤其对辨别能力...
日期:10-09
虚拟数字人的痛点: 漂亮的皮囊有了缺有趣的灵魂
  作者: 刘晓洁  [ IDC在6月发布了一份《中国AI数字人市场现状与机会分析,2022》报告,预测中国AI数字人市场规模在2026年将达102.4亿元。 ]  2022世界人工智能大会(WAIC)将...
日期:09-01
恒安嘉新陈晓光:以五个“数字化”打造安全治理新模式
通信世界网消息(CWW)每一次移动通信技术的迭代更新都会推动不同价值要素的连接,激活不同的业务场景。当前,以5G为代表的新基建极大地促进了产业互联网的发展,产业数字化进程加速,...
日期:05-26
马斯克公司盲视技术已在猴子身上见效:有望让盲人重见光明_马斯克激光眼
快科技3月22日消息,据媒体报道,特斯拉CEO埃隆马斯克的脑机接口公司Neuralink近期在技术上取得了重大突破,其Blindsight(盲视)”植入技术已经在猴子身上成功应用,这一进展预示着未...
日期:03-22
专家:发展电车一年可节约500亿美元石油进口、这钱拿来干什么不好
中国电动汽车百人会论坛2023”正在进行中,此次主题为推进中国汽车产业现代化。能源基金会(中国)首席执行官兼中国区总裁邹骥出席并演讲,邹骥表示,电动车对空气质量的改善有独特作...
日期:04-01
霉霉为女性发发声「AI生成霉霉 “不雅照” 被疯狂传播 浏览量高达千万」
划重点:- 全球顶流歌手霉霉成为最新的 Deepfake 受害者,大量虚假 “不雅照片” 在社交媒体上疯狂传播。乐视盒子C1S欢度国庆的手抄报大全- 尽管一些传播这些照片的账号已被封...
日期:01-26
中国移动ipv6前缀怎么填「中国移动联合华为等产业伙伴发布IPv6三大创新成果」
通信世界网消息(CWW)近日,在2023年上海世界移动通信大会(MWC Shanghai 2023)期间,中国移动“5G创新引领,数智融合共赢”技术创新论坛成功举办。中国移动联合华为等产业伙伴共同发布...
日期:06-29
三体播出引热议 出品方已注册数百枚三体相关商标_三体版权页
1月16日 消息:1月15日晚21:30,电视剧《三体》开播,并迅速引起讨论。据了解,《三体》电视剧的出品方包括企鹅影视、三体宇宙、灵河、咪咕文化等。企查查APP显示,《三体》电视剧出...
日期:01-16