GPT-5 在法律推理实验中表现优于联邦法官，得分为100% 对 52%。

GPT-5 在法律推理实验中表现优于联邦法官，得分为100% 对 52%。
GPT-5 outperforms federal judges in legal reasoning experiment

原始链接: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6155012

启用 JavaScript 和 Cookie 以继续。

## GPT-5 在法律推理方面表现优于法官——但这好吗？最近一篇在Hacker News上分享的实验显示，GPT-5 在法律推理方面的准确率达到 100%，显著超过了在相同情境下测试的联邦法官的 52%。然而，讨论迅速转向质疑这是否是一个积极的结果。评论员指出，审判涉及细致的决策和酌处权，而大型语言模型（LLM）可能缺乏这些能力——它始终如一地应用“在法律上正确”的结果。人们担心人工智能无法处理需要同理心和情境理解的复杂案件，并举例说明，例如儿童色情案件，严格的法律解释可能导致不公正的结果。这场辩论涉及“法律现实主义”，即法官的裁决受到个人哲学的影响，以及“规则基础”和“标准基础”法律原则之间的区别。一些人认为实验的前提存在缺陷，因为普通法并不总是只有一个“正确”的结果。另一些人则认为人工智能可以作为有价值的第二意见，同时承认其训练数据中存在固有偏见的风险。

GPT-5 在法律推理实验中表现优于联邦法官，得分为100% 对 52%。 GPT-5 outperforms federal judges in legal reasoning experiment

GPT-5 在法律推理实验中表现优于联邦法官，得分为100% 对 52%。
GPT-5 outperforms federal judges in legal reasoning experiment