您的位置:首页 > 互联网

DeepMind科学家:LLM没有过度炒作!亲身分享50个AI用例让工作效率飞升50%

发布时间:2024-08-16 19:54:26  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:新智元,授权转载发布。

Nicholas Carlini是谷歌DeepMind的一位研究科学家,近日,他撰写了一篇长达8万字的文章,介绍自己是怎么使用AI的。

他详细列举了自己日常使用AI的50个实例,而且说这些只是他所有AI应用的不到2%。

小米11 Pro概念渲染图

文章地址:https://nicholas.carlini.com/writing/2024/how-i-use-ai.html

一开篇,Nicholas就亮出了自己的观点:我不认为AI模型(LLM)被过度炒作了。

他承认AI泡沫的存在——许多公司喜欢说自己『正在使用人工智能』 ,就像他们以前说自己由『区块链』驱动一样。

但是,Nicholas认为AI所取得的进展可不仅仅是炒作。

因为在过去的一年里,他每周至少花几个小时与各种大语言模型进行交互,这些大语言模型能够胜任越来越困难的工作。

有了这些模型,Nicholas在研究项目和副业项目中编写代码的速度至少提高了50%。

以下就是Nicholas使用LLM的几个实例——

  • 用他从未使用过的技术构建整个网络应用程序

  • 让模型教我如何使用以前从未使用过的各种框架

  • 将数十个程序自动转换为C语言或Rust语言,将性能提高10-100倍

  • 缩减大型代码库,大幅简化项目

  • 为他去年撰写的几乎每一篇研究论文编写初始实验代码

  • 将几乎所有单调的任务或一次性脚本自动化

  • 在帮助他设置和配置新软件包或项目时,它几乎完全取代了网络搜索

  • 约50%的网络搜索被取代,以帮助他调试错误信息

Nicholas将这些例子分为了两大类,一类是帮助我学习,另一类是自动化无聊的任务。

这些应用可能并不花哨,因为它们都来自于Nicholas完成实际工作的需要,就像我们一样——每天所做的大部分工作并不迷人。

但LLM的魅力正基于此:自动化完成那些工作中boring的部分。

作者背景

有一点很重要,Nicholas特别写在了前面,他自己并不是一个乐于相信新技术的人。

尽管他经历了十年前安全界的加密炒作,但他没有写过关于区块链的任何一篇论文,也从未拥有过比特币,它们基本上没有任何用途,除了赌博和欺诈。

除此之外,Nicholas作为一名安全研究员,近十年来,他的日常工作就是向人们展示人工智能模型在面对未经训练的环境时会以何种方式惨遭失败。

他已经证明,对机器学习模型的输入稍加扰动,就能让它们产生大错特错的输出。

或者,大多数机器学习模型都会记住训练数据集中的特定示例,并在你使用它们时重复这些示例。

所以,他完全理解这些系统的局限性。

然而,Nicholas毅然决然地宣称大语言模型为我的工作效率创造了自互联网诞生以来的最大提升。

如何使用语言模型

构建完整的应用程序

去年,Nicholas做了一个GPT-4能力预测挑战赛的小游戏,共设置了28个由易到难任务,让人们逐步预测GPT-4成功解决它们的概率。

GPT-4能力预测挑战赛

结果很受欢迎,页面浏览量超过了一千万。你猜怎么着?整个应用程序的初始版本几乎全部是GPT-4编写的。

Nicholas是通过一系列的问题来完成的,从询问应用程序的基本结构开始,然后慢慢建立各种功能。

这段对话总共长达3万字,真正凸显了GPT-4(当时最先进的)原始模型的能力。

电瓶车撞人处罚

语言模型擅长解决人们以前解决过的问题,而这个测验99%的内容都是一些基本的HTML和Python网络服务器后台,世界上任何人都可以写出来。

这个测验之所以有趣,人们之所以喜欢,并不是因为它背后的技术,而是因为测验的内容。因此,将所有枯燥的部分自动化,让Nicholas制作这个测验变得非常容易。

Nicholas说,事实上,如果没有语言模型的帮助,他可能就不会做这个测验。因为他自己没有兴趣花时间从头开始编写整个网络应用程序。

作为新技术的导师

一个人一天只有这么多时间,而且由于工作原因,Nicholas大部分时间都花在了解最新的研究进展上,而不是JavaScript框架。

这意味着,当需要在他的特定研究领域之外启动一个新项目时,他通常有两种可能的选择。

首先,可以利用已经知道的知识,这些知识往往已经过时一二十年,但如果项目规模较小,往往已经足够。

或者,可以尝试学习新的(通常是更好的)做事方法。

这就是LLM的用武之地。

windows8怎么安装itunes

因为像Docker、Flexbox或React这样对Nicholas来说很新的框架/工具,对其他人来说并不陌生。

世界上可能有数以十万计的人对这些东西都了如指掌,这也就意味着当前的语言模型也是如此。

今年早些时候,Nicholas正在构建一个LLM评估框架,希望能够在一个封闭的环境中运行LLM生成的代码,这样它就不会随意删除他电脑上的文件或类似的东西。

Docker是完成这项任务的完美工具,但他以前从未使用过。

重要的是,这个项目的目标并不是使用Docker,Docker只是实现目标所需的工具。

Nicholas想要的只是了解他所需要的10%的 Docker,这样他就能确信自己正在以最基本的方式安全地使用它。

如果是在上世纪90年代做这件事,Nicholas基本上只能买一本介绍如何从第一原理开始使用 Docker 的书,读完前几章,然后试着跳来跳去,找出如何做他想做的事。

如果是在前十年,情况有所改善。他会在网上搜索一些介绍如何使用Docker的教程,并试着跟着做,然后在网上搜索他发现的任何错误信息,看看是否有人遇到过同样的问题。

但今天,只需要请一个语言模型来教我Docker就好。

由于篇幅所限,有关Nicholas使用LLM的更多示例,请移步到他的个人网站(文末有参考链接)。

结论

Nicholas称自己写作这篇文章有两个动机,第一个是证明LLM已经为他提供了很多价值。

第二个是为那些很喜欢使用LLM,但不知道它们如何帮我的朋友提供一些示例。

在展示这些示例之后,他最常听到的反驳之一就是但这些任务很简单!任何计算机科学专业的本科生都能学会!

只要花几个小时四处搜索,本科生就能告诉你如何正确诊断CUDA错误,以及可以重新安装哪些软件包。

一个本科生只要花几个小时,就能用C语言重写那个程序。

一个本科生只要花几个小时,就能研究相关的教科书,教给你任何你想知道的知识。

但不幸的是,我们没有那个神奇的本科生,他会放下一切,回答你的任何问题。

但我们有语言模型。当然,语言模型还没有好到可以解决程序员工作中最难也最有趣的部分,目前的模型只能解决简单的任务。

五年前,LLM所能做到的最好的事情就是写出一段听起来像是英语的段落,但它们的实际效用完全为零。

但如今,它们已经让Nicholas在编程方面的工作效率平均提高了至少50%,并且消除了足够多的繁琐工作,让他做出了许多他从未尝试过的东西。

所以,Nicholas才会旗帜鲜明地反对LLM只是炒作的观点。

作为一个拥有20年编程经验的科学家,Nicholas利用LLM显著提高了自己的工作效率,他相信,其他人也可以从中受益。


返回网站首页

本文评论
10年增长55倍成畅销王 特斯拉:95%精力用于研发 倾听用户反馈
快科技10月3日消息,特斯拉公布的最新数据显示,其Q3全球交付超43.5万辆,前三季度累计交付量已超2022全年。埃隆马斯克推特事件根据特斯拉历年Q3交付量进行统计,10年间,该品牌交付...
日期:10-03
AI前哨|防止AI“失控” OpenAI宣布重大措施「ai前哨站」
凤凰网科技讯《AI前哨》北京时间7月6日消息,ChatGPT开发商OpenAI周三宣布,公司计划投入大量资源,并组建一支新的研究团队,以确保其人工智能(AI)对人类是安全的,最终实现AI的自我...
日期:07-06
47%的iOS开发者为Android开发应用(ios、android)
  据国外媒体报道,美国投行Piper Jaffray分析师吉恩·蒙斯特(Gene Munster)周一发布投资报告称,在苹果iOS操作系统的应用开发者当中,有47%的开发者同时还为谷歌Android操作系...
日期:07-30
sony笔记本型号大全「sony笔记本e系列」
Sony笔记本E系列是Sony公司生产的一款轻薄便携的笔记本电脑。该系列不仅拥有时尚简约的外观设计,而且在性能和品质方面也得到了很高的评价,备受消费者的青睐。外观设计:Sony笔...
日期:05-30
小米电视视频通话来了_小米手机和电视视频通话
  (原标题:小米李肖爽:)   8月10日消息 今天上午,小米电视(空调)部总经理李肖爽在微博发布视频称,。   李肖爽表示,小米电视视频通话来了!这是市场部同学拍的一个内测视...
日期:06-03
吴声年度演讲:对话时代,具体生活大于想象「吴声2021」
来源:吴声造物2023年8月6日,一年一度的立秋演讲「新物种爆炸·吴声商业方法发布2023」,在751·D Park北京时尚设计广场97罐举行。第7届新物种爆炸主题为「风再起时」,场景方法论...
日期:08-06
百度召开Web APP应用开发者大会 全方位激励开发者创新Web应用(百度app开发者模式)
  4月27日,由全球最大的中文搜索引擎百度发起的主题为“开放平台 由你做主”Web APP应用开发者大会在北京京仪大酒店隆重举行,来自全国各地的近千名开发者云集一堂,共同探讨...
日期:07-27
霸王茶姬茶品「霸王茶姬获首批营养分级标识:辅助消费者实现精准控糖」
据北京商报报道,热搜话题“霸王茶姬获首批营养分级标识”于3月25日引发热议。据悉,上海市作为首批营养健康指导工作的试点城市,茶饮品牌“霸王茶姬”荣幸入选,成为首批实施“营...
日期:03-25
科大讯飞发布中报:AI学习机爆卖 6月销额增速217%_科大讯飞ai教育产品
快科技8月11日消息,科大讯飞发布2023年半年度报告,公司上半年实现营业收入78.42亿元,实现归母净利润7357万元。科大讯飞表示,公司Q2走出低谷,当季预计实现营业收入49.54亿元、毛...
日期:08-12
被360起诉冻结现金400万 市值风云创始人约架周鸿祎:让你两只手_360公司总裁周鸿炜
快科技4月24日消息,近日,市值风云创始人杨峰在微博发文称,因被周鸿祎碰瓷式起诉冻结现金400万,决定正式约架360创始人周鸿祎。杨峰表示,时间、地点、规则随周鸿祎定,也别说我杨某...
日期:04-24
热爱、坚持、赢!掠夺者打造“电竞+篮球”新型社交场!_掠夺者lol
夏天已过,制燥不止。电竞品牌掠夺者携手知名篮球IP欧耶战队举办的城市挑战赛席卷北京、成都、郑州三地,迎来盛大收官。在掠夺者打造的“电竞+篮球”的新型社交场中,不仅看到了...
日期:09-27
全新视界:探索CleanMy®Phone —— 智能手机终极清理伴侣
全新视界:探索CleanMy®Phone —— 智能手机终 极清理伴侣在数字化时代,智能手机已成为我们生活中不可或缺的一部分,储存了大量的个人数据和回忆。然而,随着时间的推移,不断积累...
日期:03-06
Claude 3模型家族详细介绍 Claude 3 Sonnet、Opus官网体验入口
Claude 3模型家族是Anthropic推出的下一代AI模型,包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus三个不同能力的模型。这些模型在多种认知任务上设立了新的行业基准,提...
日期:03-29
小米14卖爆了!雷军称未购机用户抓紧去线下买_小米pro14买不到
小米14日前正式开售,市场反应热烈,成为目前手机界的新热点。据官方透露,此次供不应求的原因并非产能不足或库存匮乏,而是因为产品过于抢手。抖音与罗永浩的合作关系荣耀80 Pro三...
日期:11-02
新加坡南洋理工大学出品!大规模视频分割数据集MeViS,自动识别视频动态主体
文章概要:1) MeVIS数据集包含2006段视频,强调目标物体的运动属性,不能仅从单帧识别。2) 提出LMPM基准方法,利用语言理解和运动评估找到视频中语言描述的目标物体。3) 研究为发展更...
日期:08-25
FF将于5月31日举行终极发布活动 介绍FF91交付计划_ff91交付时间
5月23日 消息:FaradayFuture(FF)宣布,FF91& Faraday Future2.0终极发布将于北京时间5月31日举行。广东江门市旅游美团的为你优选有用吗shp9500和he400i5月31日发布活动中,将回顾...
日期:05-23
马自达阿特兹遭车主集体投诉:车机APP关停 紧急通话也用不了_马自达阿特兹有没有carplay
快科技1月10日消息,第三方投诉平台车质网显示,马自达阿特兹近段时间遭到车主的集体投诉,投诉原因普遍为车机关闭联网服务,SOS紧急通话功能也无法使用”。据投诉车主介绍,一汽马自...
日期:01-10
涨价成为必然 骁龙8 Gen3或将用户台积电3nm制程
近日,台积电宣布将在2022年末实现3nm制程芯片的量产,和三星不同,虽然3nm制程相对时间节点落后了几个月,但由于台积电的良品率很高,在业界的口碑非常好,并获得了包括高通和苹果在内...
日期:01-03
B站在港交所主板主要上市生效 收盘微涨0.67%「B站港交所上市」
10月3日消息,哔哩哔哩(简称B站)在港交所发布公告,称公司自愿将其在香港联交所的第二上市地位转换为主板主要上市的事项于今日生效。截至收盘,B站股价涨0.67%,报120.4港元,市值474亿...
日期:10-05
赛事特写 | 芙蓉城中的联通身影「芙蓉城解释」
赛事特写 | 芙蓉城中的联通身影 通信产业网|2023-08-08 11:08:06作者:闫宇 王欢来源:通信产业网【通信产业网讯】八月的成都,似火的热情。经过为期12天的赛场角逐,盛大的“青春...
日期:08-08