GPT-5 在法律推理实验中表现优于联邦法官,得分为100% 对 52%。
GPT-5 outperforms federal judges in legal reasoning experiment

原始链接: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6155012

启用 JavaScript 和 Cookie 以继续。

## GPT-5 在法律推理方面表现优于法官——但这好吗? 最近一篇在Hacker News上分享的实验显示,GPT-5 在法律推理方面的准确率达到 100%,显著超过了在相同情境下测试的联邦法官的 52%。然而,讨论迅速转向质疑这是否是一个积极的结果。 评论员指出,审判涉及细致的决策和酌处权,而大型语言模型(LLM)可能缺乏这些能力——它始终如一地应用“在法律上正确”的结果。人们担心人工智能无法处理需要同理心和情境理解的复杂案件,并举例说明,例如儿童色情案件,严格的法律解释可能导致不公正的结果。 这场辩论涉及“法律现实主义”,即法官的裁决受到个人哲学的影响,以及“规则基础”和“标准基础”法律原则之间的区别。一些人认为实验的前提存在缺陷,因为普通法并不总是只有一个“正确”的结果。另一些人则认为人工智能可以作为有价值的第二意见,同时承认其训练数据中存在固有偏见的风险。
相关文章

原文
联系我们 contact @ memedata.com