您的位置:首页 > 互联网

一周打完1000场官司,中科院发布首个AI法庭AgentCourt_中国科学院法学院

发布时间:2024-08-31 13:51:37  来源:互联网     背景:

声明:本文来自微信公众号“新智元”,作者:LRST ,授权转载发布。

在人工智能重塑各个行业的今天,法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战,而AI技术的出现为解决这些问题提供了新的可能。

从最初斯坦福小镇火遍全网,25个由大语言模型(LLMs)驱动的智能体生活交友,打开了多Agent新视角。

谷歌手机pixel4 xl

而现在,AI法庭也来了!

最近,来自中科院深圳先进研究院的研究团队开发了一个名为AgentCourt的模拟智能法庭,

它是一个基于大语言模型(LLMs)的法庭模拟系统,旨在通过AI驱动的虚拟法庭来革新法律教育、案例分析和法律研究。

论文地址:https://doi.org/10.48550/arXiv.2408.08089

代码:https://github.com/relic-yuexi/AgentCourt

AgentCourt实战演示:https://b23.tv/e6eQMfM

该系统能够模拟完整的法庭程序。法官、原告律师、辩护律师以及其他参与者均由大型语言模型驱动的自主代理扮演。他们的主要目标是通过模拟法庭流程来帮助律师代理学习如何有效辩论案件,并提高其整体法律专业技能。

该篇文章的主要贡献有:

1. 全面模拟,真实再现

AgentCourt不仅仅是一个模拟工具,它是一个高度复杂的系统,能够精确模拟民事法庭的设置,实现多方互动和复杂的法律推理。这是首次将AI技术应用于法庭环境模拟中,为法律教育和实践提供了前所未有的可能性。

2. 对抗性交互,强化法律推理

在AgentCourt的模拟过程中,大型语言模型(LLMs)的法律推理能力通过智能体之间的对抗性交互得到了显著增强。这种利用对抗性多智能体交互的方法,不仅超越了简单的信息传递,更为未来的相关研究提供了新的视角和思路。

中国科学院法学院

3. 高效模拟,真实案例验证

该工作成功模拟了1,000个中国真实的民事案例,这些案例在AgentCourt中仅用数天时间完成,而在现实世界中,这可能需要律师们花费十年时间。通过自动和人工评估方法,验证了智能体进化的有效性。

为了尽量真实的模拟法庭,研究人员设置了以下的人物:

1. 原告与被告代理

模拟开始于案件发生之前,两名由ERNIE-Speed-128K驱动的代理分别扮演潜在的原告和被告。一旦涉及案件,他们将自动寻求律师事务所的法律援助,这是法律纠纷中的典型行为。系统配置使得原告或被告在与律师的互动中可以直接获得诉状或答辩状,无需从头起草。

2. 律师代理

设计了两名律师代理,同样由ERNIE-Speed-128K驱动。当原告和被告在律师事务所寻求帮助时,这些律师代理将被随机分配为原告律师和被告律师。他们与各自的客户沟通,收集案件相关信息,并利用丰富的法律经验、案例先例和法定代码,按照规定程序进行法庭辩论,维护各自客户的利益。

3. 法官代理

在法庭中,法官负责监督整个过程,听取双方律师的论点,并在适当时候提问。最终,法官总结并评估律师的每一轮论点,然后作出最终判决。

新物种爆炸·吴声商业方法发布2020

4. 法庭书记员代理

为了创造更真实的法庭环境并促进代理的进化,他们设计了法庭书记员代理,负责宣布审判的开始和记录审判的全过程。

这些由大模型驱动的Agent,可以根据初始数据,自发地进行法庭的模拟,而无需任何人工的监督。

数据集

研究人员利用中国裁判文书网的数据,编译了一个包含10,000个民事判决的数据集。预处理的重点是提高数据集质量,精心清洗并选择了1,389个高质量案例,这些案例同时包含原告的诉求和被告的辩护。

为了解决潜在的重复问题,他们采用了BERT进行案件介绍部分的语义向量化,并使用K-Means聚类对相似文档进行分组。这产生了1,000个代表性文档,用于模拟法庭训练和测试。

数据生成与匿名化

利用ERNIE-Speed-128K API(百度智能云文档2024)生成并匿名化高保真模拟文本,这些文本专门针对民事判决。这产生了一个精选的数据集,包含1,000个训练样本和50个测试样本,旨在支持模拟法庭环境中强大的法律论证和判决预测,从而推进法律分析技术。

通过这些严格的数据处理步骤,AgentCourt确保了模拟环境的真实性和数据的可靠性,为法律AI的发展奠定了坚实的基础。

在得到数据后,各个Agent各司其职,根据一定的流程展开法庭的辩论。该论文的模拟过程如下:

在模拟完1000个民事案例后,原告律师和被告律师的能力都得到了很大的提升,文章中的自动评估和人工评估展示了实验结果:

实验基于1,000个真实世界的民事案件,通过自动评估和人工评估两种方式,全面检验了AgentCourt系统的效能。自动评估采用了LawBench评估标准,涵盖了法律知识的记忆、理解和应用三个层面。人工评估则由经验丰富的法律专家进行,评估了智能体的思维敏捷性、专业知识性和逻辑严谨性。

实验结果显示,在AgentCourt中经历了数千次对抗性法律案件模拟(相当于现实世界律师十年的工作经验),律师代理在处理法律任务的能力上有了显著提升。无论是在自动评估还是人工评估中,进化后的代理都展现出了更快的响应速度、更深的法律知识和更强的逻辑推理能力,在复杂案件分析、法律推理和辩论策略上,部分AI律师甚至超越了人类专家的表现。

就像自动评估中的Article Recitation任务,经过进化后的律师Agent可以较好的背诵出指定法律的内容。而未经进化的律师就只能阿巴阿巴了。

AgentCourt的出现在未来可能对法律行业产生深远影响:

1. 法律教育革新: 为法律院校提供高度仿真的实践平台,学生可与顶级AI律师对战,快速积累经验。

2. 提高司法效率: AI辅助可以加速案件预审、证据分析等流程,减轻法官和律师的工作负担。

3. 降低法律服务成本: AI律师助手可以处理大量初级工作,使优质法律服务更加平价可及。

4. 推动法律研究: 海量案例模拟为法学研究提供了前所未有的数据支持,助力发现新的法律模式和理论。

5. 伦理挑战: AI在法律领域的应用也带来了一系列伦理问题,如决策过程的透明度、AI偏见的控制等,需要社会各界共同探讨。

参考资料:

https://github.com/relic-yuexi/AgentCourt


返回网站首页

本文评论
amd x4 855「荣耀 X40 GT 5G 新机官宣:性能跃级标杆」
10月8日消息:荣耀手机官方微博今日上午宣布,荣耀 X40 GT 新机即将登场。官方海报显示,荣耀 X40 GT 支持5G,号称「性能跃级标杆」。小米k40pro会降价吗华为鲲鹏四大合作据了解,上...
日期:10-11
吴京:我比成龙、李连杰差太远了 觉得自己很幸运_吴京比李连杰小多少
11月8日消息,俞敏洪今天公布了今年8月10日与吴京的直播对话内容。对话中,俞敏洪问吴京比较喜欢哪些和自己类似的带有武打色彩或者英雄气概的中国电影明星。吴京表示,自己非常喜...
日期:11-10
亨通荣获第二十四届中国专利优秀奖
亨通荣获第二十四届中国专利优秀奖 google tv 没有第三方遥控器vivo布吉岛什么时候发布第十届数字保险峰会Mini LED显示器...
日期:05-26
微软Win11 Dev 预览版 Build 23424 及Canary Build 25330推送_win11预览版dev渠道
IT之家 3 月 31 日消息,微软今天发布了两个新的 Windows 11 内测版本,分别是 Dev 频道的 Build23424 版本和 Canary 频道的 Build 25330 版本。据IT之家了解,微软本月早些时候...
日期:03-31
推特创作者将获得广告分成:需要开通蓝V会员才有资格「推特广告账户」
作为一个社区平台,各个领域的创作者无疑都会成为推特广告收益的来源,因此希望创作者能够得到推特部分广告收益分成的呼吁也始终不曾停下。近日,马斯克宣布,推特将于创作者分享出...
日期:02-05
特斯拉中国工厂工人月薪1万  还有股票或现金奖励「特斯拉工人底薪月薪多少钱」
上海临港发布消息称,近日,特斯拉储能超级工厂已正式签约落户上海临港,并开始招聘。特斯拉上海工厂建成之初,曾吸引了大量求职者排队申请。双十一营销思路特斯拉上海工厂的员工待...
日期:04-17
华为上架第三代立体光护眼台灯:96颗全光谱灯珠 发光面积增大100%_华为台灯一代和二代
快科技8月26日消息,华为智选与达伦联合推出第三代立体光护眼台灯:华为智选 达伦智能台灯3Pro,发售价429元,众测价329元。华为智选与达伦光科技创新研发出第三代立体光源SSDT立体...
日期:08-26
Intel官宣下代至强发布时间:56核心迎战AMD 128核心
Intel官方宣布,将于北京时间2023年1月10日22点举办新品发布会,正式发布第四代至强可扩展处理器(代号Sapphire Rapids)。同时发布的,还会有Intel CPU Max系列处理器、Intel GPU...
日期:12-23
iqoo11上市时间「3799元起!iQOO 11S正式发布」
今晚19:00,iQOO新品发布会如期而至,iQOO 11S正式亮相,售价方面,12G 256G:上市价3799元16G 256G:上市价4099元; 16G 512G:上市价4399元; 16G 1TB大满配:上市价4799元。tcl么么哒3n手机...
日期:07-05
天狼星资本创始管理合伙人沈海伦:AI狂潮中的变与不变「天狼星aik」
2023年,是崭新的一年,也是充满机遇和挑战的一年,这一年,大模型引领各行各业风口,科技带来的变革愈发显现。如何关注潮水变革的方向,见证科技为美好生活带来的无限可能至关重要。在...
日期:08-25
IPHONE12pro plus「都是苹果的套路!iPhone14 Plus遇冷iPhone14 Pro卖爆」
中关村在线消息:iPhone 14 Plus首销,却迅速破发,第三方报价已经比苹果官网便宜了400元左右。上个月黄牛抢购的现象并未在iPhone 14 Plus上重现。iPhone 14 Pro系列依旧很火爆,第...
日期:10-17
华为P50系列新机3月16日发布_华为最新款p50发布
  此前华为宣布 2022 华为全屋智能及全场景新品春季发布会将于 3 月 16 日 19:00 举行,slogan“色彩新生”,预计新品将包括 MatePad Paper 墨水平板、MatePad 10.4 2022 平...
日期:06-19
PPT发明者去世了,为什么很多人在说“愿天堂没有PPT”?
PPT(PowerPoint)是现代打工人最常用的软件之一,从学校课堂到国际会议,都少不了PPT的踪影。昨天,PPT发明者丹尼斯·奥斯汀去世的消息冲上热搜,再次引发了网友对这个工具的讨论。有...
日期:09-11
印媒:OpenAI 可能会在 2024 年底破产 ChatGPT 需要巨大的运行成本
8月14日消息:ChatGPT 去年发布后,成为增长最快的人工智能平台之一。然而,近几个月来,最初的欣喜若狂的人数增长已经停止。OpenAI 是把人工智能(AI)带入寻常百姓家的公司,但它可能...
日期:08-14
"微博上桌"首次应用  万名网友对话80位嘉宾
36%用户认为百度新知将对知乎产生冲击 中国电信3G用户1784万 宽带用户6782万 verizon iphone可以在国内用吗wordpress文章360创始人周鸿祎个人简介小米MIX被国...
日期:07-28
美国为了打压中国芯片业竟然禁止卖金刚石 这太荒唐了
运营商财经 康钊/文阿里云数字化平台建设网络零售电商企业盈利模式分析讯飞双屏翻译机评测2021全球创新企业100强名单OPPO aiTCL X10近日,美国相关部门宣布对中国禁止出售四...
日期:08-16
女子考科三被别停,官方回应「大妈占科三考场晒麦致多名学员挂科 官方:退费并及时安排考试」
6月8日消息,对于很多惨叫科目三路试的学员来说,考试时本就比较紧张,如果再遇到一些意外情况,那无疑更加影响发挥。近日在山东德州,网友曝光当地驾考科目三的考试线路上,因有人晒粮...
日期:06-08
2021中国新经济企业500强榜单发布 腾讯、阿里、字节位列前三「2021中国企业500强完整榜单」
  中国企业评价协会发布了“2021中国新经济企业500强”榜单,腾讯、阿里巴巴、字节跳动位列前三。大疆phantom 4 rtk多少钱apple TV怎么样双11美的销售额  榜单显示,2021年...
日期:10-19
中国信通院王晶晶等:《工业和信息化行政处罚程序规定》的十大亮点
2023年5月30日,工业和信息化部公布了《工业和信息化行政处罚程序规定》(以下简称“《规定》”),自2023年9月1日起施行,2001年5月10日原信息产业部公布的《通信行政处罚程序规定》...
日期:07-11
杀疯了 极越01价格最高降4万 高阶智驾免费用一年_极越全合成机油怎么样?
  2023卷字当头,车企最残酷的时代,将是消费者最爽的时代。市场重构、价值重构,各车企的组合拳眼花缭乱。  11月30号,刚刚“满月的”极越又放大招,推出新的价格政策和权益:自12...
日期:12-01