填字游戏热力图
Crossword Heatmap

原始链接: https://arbourtrary.com/sketches/crossword-heatmap

本项目通过分析《纽约时报》15x15 日常版和 21x21 周日版填字游戏的历史数据,对填字格中字母的空间分布进行了研究。通过将每个字母的出现频率映射到具体的网格坐标,可视化效果突显了字符最常出现的位置。 与简单的频率统计不同,该数据通过相对阴影来展示字符的分布模式。例如,虽然“A”等字母出现频率很高,但它们集中在特定区域;而“G”等字母则在整个棋盘上分布得更为均匀。该分析确定了字母的独特行为模式: * **首尾字母:** B、C 和 P 等字符倾向于出现在单词开头,而 D、E、S 和 Y 则倾向于出现在末尾。 * **高限制字母:** N 或 H 等字母会避开特定的网格位置,而 V 则几乎只出现在中心。 * **均匀分布:** A、O 和 R 等字母在网格中出现的位置非常广泛,具有高度的多样性。 此次探索为填字游戏的结构设计提供了一个独特的视角,揭示了字母的放置方式是如何受到语言趋势和网格机械约束共同影响的。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 填字游戏热力图 (arbourtrary.com) 7 分,由 surprisetalk 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 1 条评论 | 帮助 hdjrudni 6 分钟前 [–] Q, U, V, X, Y, Z 很有趣。不太确定怎么看这张图。黑色代表出现频率最高还是最低? 回复 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:
相关文章

原文

Inspiration: Curiosity initially around what the most common crossword layout is. Kinda morphed into wondering about distributions of empty spaces and letters.

Description: I downloaded some crossword data from Saul Pwanson. I focused on the NYT crossword which has had two variations for its history, the 15x15 daily and the 21x21 Sunday version. For each version, I tallied up counts of characters per cell.

What's visualized above are frequencies that answer the question “When character X shows up, where is it most likely to show up on the board?" The shading is scaled to the max per-cell-frequency of that particular character. So it's really highlighting distribution, not overall frequency.

For example, the character A is far more common than G, but G appears darker because it's very evenly distributed whereas A has a couple of extreme outliers in the top left. It's fun clicking through as some patterns emerge.

Quasi-Groupings

Anywhere works

A    G    K    L    O    R    T    W

Great starters

B    C    F    M    P

Great enders

D    E    S    Y

Anywhere but the start

N

Anywhere but the end

H    I    U

Just the middle

V

Rarities

J    Q    X    Z

Sources

NYT Crossword Data (2024)

联系我们 contact @ memedata.com