我让Claude生成37,500个随机名字,它一直生成马库斯。
I asked Claude for 37,500 random names, and it can't stop saying Marcus

原始链接: https://github.com/benjismith/ai-randomness

最近一项实验调查了Anthropic的Claude语言模型在被要求“随机选择一个名字”时的随机性。研究人员在五个模型和多种提示变体下生成了超过37,500个名字选择。令人惊讶的是,“Marcus”是最常被选择的男性名字,出现频率为23.6%。 该研究表明,缺乏真正的随机性;Opus 4.5在简单的提示下始终选择“Marcus”,表现出确定性行为。虽然更复杂的提示增加了名字的多样性,但也引入了新的偏差。使用随机词作为种子比随机噪声更能有效提高多样性。 完整的数据集和分析,包括成本明细(总计27.58美元),已公开提供,以便进一步研究语言模型偏差以及在生成真正随机输出方面的局限性。实验的复制代码也已提供。

一位Hacker News用户要求Claude(一个LLM)生成37,500个随机名字,结果发现它反复生成“Marcus”。这引发了关于LLM在生成真正随机性方面的局限性的讨论。 评论者推测,“Marcus”频繁出现的原因在于它在Claude的训练数据中频繁出现——可能由于像马库斯·奥勒留和马库斯·克拉苏这样的历史人物。一位用户建议在提示中注入随机性(添加随机的英文单词)可能会改善输出分布。 这一情况引发了一些有趣的观察,包括对一个关于“Marcus the Worm”(马库斯蠕虫)感染Claude的YouTube短视频的引用,以及一个关于认知科学家Gary Marcus似乎“免费居住”在AI回复中的玩笑。这次交流凸显了LLM可以反映其训练数据中存在的偏见和模式,而不是生成真正新颖的输出。
相关文章

原文

Experiments exploring how language models handle randomness. We asked Claude to "pick a name at random" 37,500 times across five models and dozens of prompt variations, then analyzed the results.

The full writeup is published here: Marcus, Marcus, Marcus!

Key findings:

  • The most common male name was "Marcus", chosen 4,367 times (23.6%)
  • Opus 4.5 returned "Marcus" 100 out of 100 times with the simple prompt
  • Nine parameter combinations produced zero entropy — perfectly deterministic output
  • Elaborate prompts doubled unique names but introduced different biases
  • Random word seeds were more effective than random noise at increasing diversity

To run experiments, you'll need an Anthropic API key in a .env file:

ANTHROPIC_API_KEY=your-key-here

Run the experiment (calls the Anthropic API — this costs real money):

npm run experiment:random-names

Run the analysis on collected results:

npm run analysis:random-names

The output/ directory contains:

  • random-names.tar.gz — All 37,500 individual JSON responses, archived. Extract with tar xzf output/random-names.tar.gz -C output/ to get the individual files.
  • random-names-analysis.json — Full statistical analysis including per-model breakdowns, entropy calculations, and cross-parameter comparisons.
  • actual-costs.json — Real API costs from running the experiment ($27.58 total).
联系我们 contact @ memedata.com