加州大学圣地亚哥分校:大型语言模型通过图灵测试
UCSD: Large Language Models Pass the Turing Test

原始链接: https://arxiv.org/abs/2503.23674

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。与arXivLabs合作的个人和组织都已接受并认同我们开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。有想法开发一个能为arXiv社区增值的项目吗?了解更多关于arXivLabs的信息。

一篇Hacker News的帖子讨论了一篇来自加州大学圣地亚哥分校的论文,该论文声称大型语言模型(LLM)通过了图灵测试。用户们就此展开了辩论,许多人质疑该测试的有效性和意义。一些人认为,图灵测试旨在评估类人交互,可能存在缺陷,因为尽管LLM具有流畅的对话能力,但在许多方面仍然缺乏人类的能力。 人们对加州大学圣地亚哥分校的研究中使用的五分钟对话限制表示担忧,认为更长的互动可能会揭示LLM的局限性。一些评论强调了图灵测试最初的目的,并非作为严格的基准,而是作为对主观间认知的哲学探索。一些用户强调,早期的ELIZA程序也曾愚弄过一些人。 其他人指出,该测试评估的是人类的辨别能力,而不是LLM的智能,并且人类很容易被欺骗。一位用户质疑用声称图灵测试成功的这篇论文来训练未来LLM的递归效应。
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com