您的位置:首页 > 互联网

蚂蚁集团、清华大学联合发布“蚁天鉴2.0”,持续攻坚大模型安全技术

发布时间:2024-07-05 22:06:02  来源:互联网     背景:

7月5日,在2024世界人工智能大会“迈向AGI:大模型焕新与产业赋能论坛”上,蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。蚁天鉴2.0新增AI鉴真功能,支持图像、视频等多模态内容真实性及深度伪造检测;并在测评功能上持续升级,打造了大模型安全测评“智能体”,并新增大模型X光、大模型基础设施测评两大测评功能。至此,蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。

(图:蚂蚁集团联合清华大学发布“蚁天鉴2.0”)

12306cn网上退票

蚂蚁集团副总裁、大安全技术部总裁李俊奎现场发布了这一升级产品,并介绍道,大模型和Agent智能体正带给我们前所未见的智能体验,同时也带来了模型内部幻觉、安全漏洞和深度生成内容滥用等新的挑战。蚁天鉴旨在打造AI大模型的安全铠甲,确保大模型技术在安全可靠的环境中发挥效能。

记者从现场了解到,蚁天鉴2.0有两大特色,一是在测评端研发了业内首个“测评智能体”。该测评智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,可扩展测评垂类大模型、多模态大模型及Agent智能体,并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例,保障测评效果和效率。目前,蚁天鉴2.0有超300万高质量测评题库,支持最高50万/日的饱和式攻击和逐级诱导深度攻击,并实现了1工作日内完成测评,全流程自动化率>99%。

与此同时,该智能体也增加了两项新功能。一是大模型X-ray。即大模型X光,可针对大模型的内在神经元进行X光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。二是大模型基础设施测评。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发,深入扫描模型算法组件及软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。

同时,蚁天鉴2.0防御端新增AI鉴真功能。支持多模态内容真实性及深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪,图像识别准确率99.9%达到行业最高优秀级(信通院测评)。目前,蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集,覆盖主流生成方案,有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。 

(图:蚁天鉴2.0大模型安全一体化解决方案全景图)

据了解,蚂蚁集团是国内较早布局大模型安全的厂商。蚁天鉴去年7月首次对外发布,1.0版本即被评为2023年世界人工智能大会“镇馆之宝”。历时1年升级到2.0版,蚁天鉴2.0构建了双重防御护栏,内置防护关注训练阶段的数据清洗和风险抑制;外置护栏融合智能风控技术,精准拦截输入和输出的风险内容,保障其应用安全。

目前,蚁天鉴的检测与防御产品已开放给20家外部机构和企业使用,为通用大模型及医疗、金融、政务等垂直领域行业大模型应用安全保驾护航。例如,上海市第一人民医院引用了蚁天鉴,有效应对医疗领域大模型应用中的信息安全与隐私保护、双向内容风险防控等挑战;蚂蚁AI金融助理“支小宝”结合蚁天鉴,通过大模型训练与推理风险管控、大模型风险点全方位评测、大模型用户交互风险管控等举措保障大模型应用安全,确保数据的准确性和金融逻辑的严格性。2024年,蚁天鉴商业化迈出重要一步,通过蚂蚁数科开始服务广泛的外部客户。

论坛现场还发布了由清华大学、中关村实验室、中国信通院、蚂蚁集团联合编制的《大模型安全实践白皮书(2024)》。这也是国内首份“大模型安全实践”研究报告,为行业打造高价值参考体系。

(图:大模型安全实践白皮书现场发布)

白皮书基于当前大模型发展趋势与挑战,提出了大模型安全实践总体框架。即确立了“以人为本,AI向善”为大模型安全建设的核心,确保技术进步服务于人类福祉;以“安全、可靠、可控”三个核心维度的大模型安全技术体系,涵盖大模型安全测评与防御的综合技术方案;以及“端、边、云”为大模型安全技术的主要承载实体。作为企业撰写方,蚂蚁集团安全生态副总裁邵晓东进行了现场发布并表示,白皮书还阐述了大模型在金融、医疗、政务等领域安全应用的案例,以及“五维一体”协同共治的治理框架,希望行业共同推动大模型安全生态发展。

本场论坛汇聚了国内外研究机构和顶尖学者以及产业人士等,从前沿技术、产业应用等不同视角分享了大模型安全的研究,探讨端云协同、端侧应用等最新趋势以及大模型安全最新体系与实践。这些深入的讨论,也将为大模型如何安全可靠地助力产业转型升级、推进数字经济发展提供更加明确的前进方向。(七喜)


返回网站首页

本文评论
推特前安全主管提交举报人投诉,称该平台数据安全有缺陷「推特平台保护」
  推特(Twitter)前安全主管提交了一份举报该公司的投诉书,指称该公司未能保护敏感用户数据,并在安全问题上撒谎。据帮助提交这份投诉书的举报人援助组织Whistleblower Aid的一...
日期:09-05
兼得“降本+增效”:红帽虚拟化下的创新探索_红帽子虚拟机
兼得“降本+增效”:红帽虚拟化下的创新探索 通信产业网|2024-03-29 16:37:45作者:党博文来源:通信产业网apple store直营店在温州当前,随着企业对于提高资源利用率、降低成本、...
日期:03-30
谷歌Pixel Buds Pro耳机发布:支持蓝牙超宽带技术、31小时续航_谷歌pixelbuds使用方法
快科技10月5日消息,谷歌发布了新款Pixel Buds Pro耳机,售价为199.99元(约合人民币1460元)。外形方面,新款耳机采用胶囊设计,拥有海岸蓝、瓷器白、珊瑚红、炭黑、雾蓝、柠檬草黄六...
日期:10-05
真我11系列曝光:旗舰曲面屏 下黑边仅2.33mm「真我v11全面屏」
真我已经官宣,真我11系列将于5月10日16点正式发布,主打影像旗舰。新机搭载高定旗舰120Hz刷新率曲面屏,主打质感与护眼,支持2160Hz超高频调光、20000级自动调光,2.33mm超窄下巴、6...
日期:04-28
微美全息(NASDAQ:WIMI)开发基于云计算的高可靠图形渲染引擎优化系统
随着计算机技术和互联网技术的不断发展,图形处理技术也在不断创新和进步,其行业应用也在不断扩展和深化。图形渲染引擎是一种重要的图形处理技术,它可以将三维空间中的物体和场...
日期:06-14
IDC:预测折叠屏手机到2026年出货量将达到4150万部_折叠屏手机什么时候量产
10月4日消息:据研究机构 IDC 预测,到2026年,折叠屏手机的出货量将从2021年的810万部翻两番以上,达到4150万部。IDC报告称,价格下降和商业用例将推动这些设备的采用,得益于它们的...
日期:10-06
上榜 | 欧税通入选“世界互联网大会跨境电商实践案例”!_欧洲2021年7月开始,对跨境电商征税
近日,世界互联网大会数字丝路发展论坛期间《世界互联网大会跨境电商实践案例集(2024年)》正式发布,共63个优秀案例,深圳跨境电商综试区共有12个案例入选,数量居全国第 一。深圳欧...
日期:05-10
特斯拉超级工厂建设「韩国拟吸引特斯拉建超级工厂 已提交17个潜在选址信息」
12月27日消息:据韩国经济新闻报道,上个月特斯拉CEO马斯克表示,韩国是「特斯拉在亚洲建立另一座生产基地的最佳候选地之一」。自那以来,韩国所有主要地方政府都已准备好成为特斯...
日期:12-27
为十年“降碳”浪潮递工具的人
  撰文/赵子坤  编辑/李原  今年以来,三藏科技CEO童甫明显感觉到,来做碳排放评估的企业类型更多样,需求也更紧迫了。腾讯手机管家检测病毒可信吗  来者不只有石化、建...
日期:10-03
小红书博主用AI画出无价的饭获赞21.9万 网友感动哭_小红书美食画法
12月27日 消息:近期,一种新的ChatGPT文生图玩法在海外社交媒体平台上引起了轰动,即在提示词中输入“Make it more”,从而引发AI创作出丰富的想象力。这一新形式的内容创作近期...
日期:12-27
清明节前AI复活亲人成热门生意:几十元到上百元不等
3月28日 消息:随着清明节的脚步日益临近,思念亲人的情感愈发浓烈,而近日,一项名为“AI复活”的服务在市面上引起了热烈讨论。这一创新业务,通过利用人工智能技术,让逝去的亲人仿...
日期:03-28
微信突然无法访问公众号、链接了?官方给出答案「微信突然无法访问公众号,链接了?官方给出答案」
因为疫情,不少中小学在家上网课。有些小孩和家长发来一个十万火急的问题,为什么学校让大家看的网课链接打不开?”微信官方表示,你或许忘了已经给孩子开启了青少年模式”。设置路...
日期:11-27
点赞过千万多少钱「百万点赞,只卖了3单。」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。15万的粉丝博主,每个视频都有十几万播放,但橱窗里只卖了三件产品。今天...
日期:12-20
“数智天府,蜀赢未来”华为四川新质生产力城市峰会在成都举办
6月24日,以“数智天府,蜀赢未来”为主题的华为四川新质生产力城市峰会在成都世纪城新国际会展中心举行。四川省人民政府副秘书长杨昕,成都市市委常委、市人民政府副市长田成川,...
日期:06-25
百度飞桨新增适配系列AI芯片,软硬结合强势输出AI生态效能_百度飞桨人工智能
  “新基建”浪潮下,人工智能技术迎来深入发展新局面,AI场景规模化落地与应用不断刷新速度。随着软硬件一体化的AI生态持续繁荣,AI技术与产业不断融合,智能经济呈现加速...
日期:07-14
苹果 iOS 17 系统安装率低迷,发布 18 天后约为 23%_苹果11系统
IT之家 10 月 7 日消息,苹果公司在 9 月 18 日向公众发布了 iOS 17 正式版系统。对于许多人来说,这是他们期待了几个月的时刻。但还有一些人可能不知道 iOS 17 已经可以下载升...
日期:10-07
保护隐私有多难?就连匿名币也可能泄露你的秘密(加密货币匿名)
《保护隐私有多难?就连匿名币也可能泄露你的秘密》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长...
日期:08-01
抖音主播打电商什么意思「各界“大佬”转战直播,抖音电商为什么是第一站?」
导语:6月16日晚7点半,被誉为“钓鱼界天 花板”的@天元邓刚,开启了本次抖音商城618好物节的首场直播,吸引了众多粉丝的目光,开播仅十分钟,直播间同时在线人数便突破10万。据卡思观...
日期:06-21
小米4曲面概念机「小米Civi 4 Pro首次采用全等深微曲屏:终结直曲之争」
快科技3月21日消息,小米Civi 4 Pro正式亮相。小米集团卢伟冰表示,Civi 4 Pro被定位为小14 Pro”,它拥有Pro级的设计、影像和性能。applewatch os9新表盘其中,Civi 4 Pro的Pro级...
日期:03-21