每日HackerNews RSS

## 社交媒体的保存挑战 本文探讨了社交媒体存档的困难,将个人“剪贴簿”式保存与机构存档的复杂需求进行对比。虽然文化机构长期以来都在考虑数字保存,但社交媒体的庞大*规模*——数十亿条每日帖子——使得全面存档变得不可能,迫使人们采取选择性收集政策,从而引入固有的偏见。 除了数量之外,语境至关重要。社交媒体依赖于相互关联的对话,捕捉帖子完整含义需要保存帖子链、回复和相关账户——范围迅速扩大。此外,许多社交媒体内容是私密的(私信、封闭群组)或短暂的(Snapchat Stories),这在访问和同意方面带来了技术和伦理障碍。 保存社交媒体的*体验*——界面、算法——也至关重要,但具有挑战性。机构面临法律限制(版权、隐私)以及平台限制数据访问日益增加的阻力。一个关键问题是*谁*希望被保存,并在全面捕捉与用户隐私之间取得平衡至关重要。 最终,完美的保存是不现实的。然而,有针对性的存档、详细的文档记录以及Posty等工具表明,捕捉这一文化历史的碎片是可行且有价值的,即使是不完整的。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 社交媒体存档中的难题 (alexwlchan.net) 2小时前 surprisetalk 发布,4点赞 | 隐藏 | 过去 | 收藏 | 1条评论 帮助 zoobab 5分钟前 [–] HTTP 并非为镜像设计。FTP 使用 "lftp> mirror -p" 即可轻松镜像。 简单的镜像和存档级别维护(例如网络始终保持至少3份副本)应该内置在“社交媒体”协议中。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 设计一个36键定制键盘布局 (2021) (peterxjang.medium.com) 5 分,来自 speckx 2小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Picol:一个微型的Tcl类解释器 Picol是一个500行的C语言解释器,于2007年发布,设计目的是作为学习工具和实践C语言编程风格的演示。它不像追求最小的代码量,而是以清晰和功能为目标——能够运行非平凡的程序,而不仅仅是“Hello World!”。 该解释器具有受Tcl启发的语法,包括字符串插值(例如,`set a "pu" set b {ts} $a$b`)、具有适当作用域的用户自定义过程,以及`if`、`while`(带有`break`和`continue`)和递归等控制流结构。基本的算术运算(+、-、*、/)和`set`和`puts`等命令也受支持。 Picol的一个关键方面是其手工编写的解析器,它占据了大约250行代码。它识别标记并构建一个解析结构,该结构由`picolEval`函数用于执行程序。变量和命令替换在评估期间处理,利用调用帧来管理过程作用域。 Picol在GitHub上可用,作为解释器设计和解析器实现的存档示例。可以使用`gcc -O2 -Wall -o picol picol.c`编译它,并使用`picol filename.tcl`运行它。

## 微型 Tcl 解释器引起关注 由 Redis 作者 antirez 创建的一个新的 Tcl 解释器 **picol** 已发布,代码量惊人的简洁,仅有 500 行。该项目在 Hacker News 上引发了关于 Tcl 当前用法的讨论。 虽然 Python 和 Lua 是流行的选择,但 Tcl 仍然是**ASIC/FPGA 设计和仿真**等专业领域中的关键脚本语言,充当工具脚本的“通用语言”。虽然 Python 正在缓慢地占据优势,但通常被认为在这些任务中速度较慢。 有趣的是,antirez 本身就使用 Tcl 来进行 Redis 测试套件。其他人发现它对特定任务很有用,例如在 Windows 上访问 ODBC。 相关的项目 **JimTcl** 提供了更多功能,具有相似的小型足迹,由同一作者维护和扩展。

预印本 · 2026年2月 GPU加速的约束满足,由内在黎曼曲率引导。一种感知几何的求解器,在Python CPU的基础上,以1226倍的速度解决世界上最难的数独——并推广到任何有限域CSP。比Kona 1.0快40,128倍。Yann LeCun的EBM解决一个谜题需要313毫秒。我们每秒解决270,000个。性能总结 GPU吞吐量~270K谜题/秒 单实例延迟3.7微秒 比Python CPU快1,226倍 已解决的最难谜题11 / 11 平均解决时间(v4)7.8毫秒

一个由软件工程师和数学家组成的团队,开发了一种受Yann LeCun最近的能量模型方法启发的数独求解器。他们声称性能显著优于LeCun的方法,每秒可以解决270,000个谜题,而LeCun的系统解决一个谜题需要313毫秒。 该团队在他们的网站(davisgeometric.com)上详细介绍了他们的“能量几何模型”解决方案,包括代码和研究论文。他们认为数独的吸引力在于它与约束满足问题有关,这与现实世界的挑战,如调度和物流相关。 帖子引发了一段简短的评论,质疑一位开发者根据照片的年龄。团队欢迎通过[email protected]提出问题。

## 编码代理成本:缓存读取是隐藏的开销 随着编码代理变得越来越复杂,理解其成本结构至关重要。一个关键发现是,**缓存读取迅速成为主要开销**,通常在**27,500个token**左右时,费用会占到总成本的一半——到对话结束时,甚至高达总成本的87%。 这是因为编码代理在每次交互时都会将整个对话历史记录发送给LLM。虽然初始输入和输出token很重要,但从缓存中*读取*这段历史记录的成本会随着对话长度和LLM调用的次数呈二次方增长。 对exe.dev上的250个对话的分析一致地显示了这一趋势。成本不仅基于token数量,还基于*LLM调用的次数*——调用次数越多,缓存读取次数就越多。以Anthropic的定价为例,缓存读取可能在**20,000个token**时就成为主要成本。 缓解策略包括限制大型工具的输出(避免重复读取整个文件)以及考虑重启对话以避免过高的缓存成本,这类似于开发者经常从git仓库开始全新项目。最终,成本管理、上下文和代理编排可能从根本上是相关的。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 昂贵的二次方:LLM 代理成本曲线 (exe.dev) 5 分,luu 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

一份新近发现的8世纪编年史,被称为713年马龙尼特编年史,为从晚期古至今伊斯兰崛起这一动荡的过渡时期提供了宝贵的见解。这份手稿在埃及圣凯瑟琳修道院被发现,最初是用叙利亚语写成,后来被翻译成阿拉伯语,它提供了最早的幸存的基督教文献之一,记录了7世纪的阿拉伯-伊斯兰扩张和阿拉伯-拜占庭战争。 艾德里安·皮尔蒂亚通过数字化手稿发现了这份编年史,它详细记录了从亚当到作者同时代历史,其中最重要的部分集中在拜占庭-萨珊战争、伊斯兰教的兴起和早期的阿拉伯征服。值得注意的是,它显示出对广阔地理区域事件的了解,从叙利亚到巴尔干半岛。 学者们认为,这份此前未知的文本可能与后世历史学家使用的8世纪佚失文献有关,为重建早期中世纪叙利亚史学和恢复这一关键时代的重要基督教视角提供了一块关键的拼图。目前正在进行完整翻译。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在西奈发现了一部1300年的世界编年史 (heritagedaily.com) 5 分,由 telotortium 1小时前发布 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

请启用 JavaScript 并禁用任何广告拦截器。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 可能找到失落的苏联月球着陆器 (nytimes.com) 11点 由 Brajeshwar 2小时前 | 隐藏 | 过去 | 收藏 | 1条评论 帮助 moebrowne 2小时前 [–] https://archive.is/pqiyD 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

要使用 Mastodon 网页应用程序,请启用 JavaScript。或者,尝试为您的平台使用 Mastodon 的原生应用程序。

## LLM 与常识:洗车困境 最近在 Hacker News 上的讨论强调了大型语言模型 (LLM) 的一个有趣缺陷——回答一个看似简单的问题:走 50 米还是开车去洗车?许多模型,包括 OpenAI 的 GPT 5.2,最初建议*步行*,似乎假定汽车*已经在*洗车场。 然而,澄清提示词(“我的车在家……”)通常可以纠正答案。其他模型,如 Gemini 3、Claude Opus 和 Grok,通常一开始就能正确回答,认识到需要*开车*去洗车。 这场辩论表明,LLM 在“常识”推理方面存在困难,需要明确的上下文。一些人认为这源于缺乏“对现实世界的理解”,或者由于训练数据而倾向于谨慎、不明确的回答。另一些人则指出,模型依赖于模式识别而不是真正的思考,以及强化学习来自人类反馈 (RLHF) 可能会抑制强烈的观点。 最终,这次交流强调了仔细提示的重要性,并凸显了当前 LLM 的局限性,即使是最先进的 LLM,在面临需要基本情境感知能力的任务时也是如此。

## 使用AI代理构建SQLite:摘要 2026年2月,Kian Kyars成功地指示三个大型语言模型——Claude、Codex和Gemini——使用Rust构建一个类似SQLite的数据库引擎。该项目在大约三天和154次提交中完成了约19,000行代码,包括解析器、计划器、火山执行器、B+树、WAL、事务、索引和聚合等功能。重要的是,282个单元测试全部通过,验证了实现。 该过程模拟了分布式系统原理,强调通过Git、锁文件和严格测试进行协调。代理在一个循环中运行:声明任务、以SQLite作为预言机进行实现、更新共享文档并推送更改。协调开销(锁管理)占了超过一半的提交。 成功的关键在于预言机式验证、高测试频率和强大的模块边界,从而最大限度地减少了合并冲突。一个“合并器”代理(Gemini)旨在减少重复,但*在运行期间*未能有效利用。该实验强调了严格的任务边界、共享文档作为运行时组件以及测试作为利用并行AI代理时的重要反熵力量。该项目的仓库和脚本可公开获取以供复制。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 使用小型集群构建 SQLite (kiankyars.github.io) 17 分,kyars 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 希望有人觉得这篇关于我并行编码代理经验的文章有趣。帮助 scirob 1 分钟前 | 下一个 [–] 他们最终通过了所有单元测试吗?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

罗伯特·沃尔克(Robert Wolke)的“美食101”专栏解释了铝箔的起源以及亮面和暗面的区别。最初被称为“锡箔”,因为19世纪时它是由锡制成的(灵感来自爱迪生的留声机),现在几乎完全由铝制成。 两种不同表面是制造过程的结果。铝在钢辊之间轧制;最后的工序使用两张面对面压制的薄片。外表面因与抛光辊接触而变得光滑,而内表面则相互挤压,形成哑光表面。 然而,沃尔克澄清说,**使用哪一面烹饪并不重要**——性能相同。有趣的是,铝是地球地壳中最丰富的金属,尽管人们普遍认为,锡箔帽并不能阻挡无线电信号!

一个由一篇博文引发的黑客新闻讨论询问为什么铝箔一面是亮的,一面是哑光的。最初关于铝箔不同一面的问题很快就跑题了。 用户们戏谑地争论“铝”的正确拼写(与“铝”相对),引用了国际标准,甚至开玩笑说在月球上会听力受损。关于亮面反射更多热量用于烹饪的常见误解被驳斥——两面具有基本相同的热传递特性,而蒸汽保留更为重要。 最初对两种面的解释在于制造过程:铝箔是通过将两层铝片面对面地一起轧制而成的。对话还包括一个关于在铝箔轧制过程中,什么构成“三明治”的幽默辩论。

更多

联系我们 contact @ memedata.com