每日HackerNews RSS

## ICML 2026 与人工智能在同行评审中的应用:维护诚信 ICML 2026会议正在积极应对人工智能对同行评审诚信带来的挑战。 认识到潜在的滥用风险,ICML实施了两级政策:**政策A**(禁止使用LLM)和**政策B**(允许使用LLM理解和润色评论)。 评审员选择他们偏好的政策,没有人会被强制执行政策A,如果他们更喜欢政策B。 尽管有明确的协议,ICML检测到在分配到政策A的评审员提交的795份(约1%)评论中使用了LLM。 这是通过一种新颖的水印技术实现的——在论文PDF中嵌入隐藏指令,要求LLM在评论中包含特定短语。 所有标记的实例都经过手动验证,以避免误报。 因此,与违规评审员相关的497篇投稿被直接拒稿,51名评审员被从评审池中移除。 ICML强调这并非是对评论*质量*的判断,而是对信任被破坏的回应。 虽然水印方法并非万无一失,但它成功地识别了大量政策违规行为。 ICML承认对评审过程的干扰,并正在支持受影响的领域主席和作者。 这一坚定立场旨在维护信任的基础,这对于一个功能正常的同行评审系统至关重要,因为人工智能的整合正在不断发展。

## ICML论文审查丑闻:LLM使用与学术诚信 最近,国际机器学习会议(ICML)的一项调查显示,2%的论文因其评审员违反了禁止使用大型语言模型(LLM)的政策而被直接拒稿。评审员可以选择加入“禁止LLM”政策,但发现那些加入政策的评审员使用了LLM来生成他们的审查意见。 ICML采用了一种巧妙的检测方法:在PDF中嵌入隐藏指令,提示LLM插入特定短语。包含这两个短语的审查意见会被标记出来。这并非关于检测LLM用于编辑的通用使用情况,而是专门识别那些复制粘贴LLM生成内容作为自己原创内容的人。 这一事件引发了关于学术诚信、对LLM日益增长的依赖以及研究界内部压力的争论。一些人主张严厉惩罚,而另一些人则认为应该关注调整审查流程,以有效地适应LLM。这种情况凸显了随着人工智能工具的普及,在同行评审中维持信任和质量的挑战。许多人认为这仅仅是个开始,目前的检测方法长期来看将不再有效。

这似乎是PDF文件的一部分,包含了一些内部数据和编码信息,而不是可读的文本内容。 它包含诸如对象引用、交叉引用表、流数据等。 因此,无法翻译成有意义的中文。

这个Hacker News讨论围绕着Guido Van Rossum于1988年发表的论文“Stdwin: 标准窗口接口” [https://ir.cwi.nl/pub/5998](https://ir.cwi.nl/pub/5998)。该论文提出了一种跨平台的C语言GUI工具包,旨在在广泛的跨平台解决方案出现之前实现可移植性。 评论者们争论着这种工具包在历史上是否实用,指出即使有了可移植的窗口系统,不同的系统接口也存在挑战。他们讨论了后来出现的跨平台GUI尝试,如Java Swing、Tcl/Tk,以及最近的Electron,强调了美观、性能以及最终Web应用程序的统治地位等问题。 一个反复出现的主题是难以在跨平台实现真正“原生”的外观和感觉,一些人提倡采用平台的原生API(如Cocoa),而不是试图进行抽象。另一些人则指出,像Toga这样的现代工具包有可能实现Van Rossum最初的愿景。 讨论还涉及了对科技行业中年龄和经验的看法。

## ENIAC 80周年:计算机时代的黎明 为庆祝其80周年,电子数值积分计算机(ENIAC)是历史上一个关键时刻。这款庞大的机器于1946年问世,占据一个大房间并消耗巨大电力,是第一台大规模、可编程的电子数字计算机。ENIAC由宾夕法尼亚大学在二战期间开发,最初设计用于快速计算火炮射击表,这项任务此前由人工费力地完成。 ENIAC的突破在于其使用真空管和可编程性,为现代计算铺平了道路。尽管编程涉及物理地重新布线机器,但它展示了高速、通用计算的潜力。它的成功推动了计算机产业的发展,催生了存储程序、集成电路,最终促成了互联网的诞生。 值得注意的是,凯瑟琳·安东内利、吉恩·巴蒂克、贝蒂·霍尔伯顿、玛琳·梅尔策、弗朗西斯·斯彭斯和露丝·泰特尔鲍姆六位女性是ENIAC的首批程序员,这一贡献长期以来被忽视。虽然后来的法律诉讼澄清了约翰·阿塔纳索夫和克利福德·贝里的早期贡献,但ENIAC仍然是一项具有里程碑意义的成就,标志着“ENIAC之前”和“ENIAC之后”的转变,并从根本上改变了科学、工业和日常生活。

本文详细介绍Cloudflare规则引擎中一个关键且经常被误解的方面:**规则评估顺序至关重要,因为存在“终止动作”。** 作者发现,一个旨在保护`/metrics`端点的`Block`规则,在放置在`JS Challenge`规则*之后*时会被绕过。这是因为完成挑战会设置一个`cf_clearance` cookie,从而自动终止进一步的规则评估——有效地绕过了`Block`规则。 Cloudflare将某些动作(如`Block`、`JS Challenge`等)定义为“终止动作”。如果触发了终止动作,则后续的规则将*不会*被处理。 作者建议按动作类型组织规则,将限制性动作(如`Block`)优先于挑战动作,以确保安全性。虽然未确认大规模的可利用性,但该问题凸显了Cloudflare仪表板中关于规则执行顺序的误导性信息所带来的潜在漏洞。这个问题已被用户注意到多年,正如Serverfault上的类似讨论所示。

一个 Hacker News 的讨论强调了 Cloudflare 规则引擎一个关键且经常被误解的方面:**规则顺序至关重要。** 用户发现,某些“终止操作”,例如“Managed Challenge”,会立即停止规则评估,即使仪表盘暗示后续规则仍会被检查。 许多评论者对 Cloudflare 的文档和支持表示沮丧,指出信息不一致,并且普遍缺乏对这种行为的清晰解释。UI 没有清楚地表明规则何时会停止进一步评估,导致调试困难——尤其是在与其他防火墙系统(如 UFW)结合使用时。 对话也转向了对 Cloudflare 整体“自行解决”文档风格的抱怨,以及关于一位以私人飞机出行问题而闻名的苛刻人士的讨论。最终,核心要点是理解 Cloudflare 的规则处理顺序对于有效配置至关重要。

## Pano:你的互联网图书馆 Pano是一个免费工具,旨在解决互联网最大的问题:遗失你在网上找到的东西。它充当你的个人网络图书馆,允许你**保存任何网址**——文章、食谱、视频等等——并自动捕捉标题和描述。 Pano不使用传统的文件夹,而是利用**彩色编码的“书架”**进行组织和标记,方便你查找保存的内容。你还可以**公开分享你的书架**或通过链接分享,甚至可以关注他人以发现有趣的内容。 一个浏览器扩展程序简化了从任何标签页保存内容的操作,适用于Chrome和Edge等主流浏览器。Pano旨在超越简单的书签功能,培养一个“品味网络”,通过精选的收藏展示人们如何看待世界。本质上,Pano帮助你*保存*你在网上*发现*的宝贵内容。

## Pano:一款新的书签工具 Pano (panoit.com) 是一款新推出的免费互联网归档工具,旨在解决保存的链接丢失和杂乱的问题。这款工具的创建者是一位对分散的书签、标签页和截图感到沮丧的用户,Pano 允许用户将链接保存到“书架”——可组织、可分享的集合——而不是传统的书签列表。 该工具专注于元数据提取,自动从 YouTube、GitHub 和 Reddit 等网站提取标题、描述和作者等信息。Chrome 扩展程序可实现快速保存,并提供批量导入现有书签的功能。 早期用户反馈集中在较长的初始加载动画上,许多用户在加载完成前就离开了网站。其他讨论点包括与 Karakeep 和 OneTab 等现有工具的比较,以及对搜索、标签和备份选项等功能的请求。创建者正在寻求关于“书架”模型与传统文件夹以及如何改善用户体验的反馈。

## 真实 API 性能:框架并非关键 最近的基准测试显示 BlackSheep 的速度是 FastAPI 的两倍,引发了关于框架性能的讨论。然而,对一个真实 API(使用 FastAPI、SQLAlchemy 和 Postgres 构建的书籍目录)的深入研究揭示了一个令人惊讶的真相:**框架速度通常与网络延迟和数据库性能相比微不足道。** 该研究测量了从土耳其到阿姆斯特丹的响应时间,发现**69-83% 的总响应时间都花在网络传输上**,即使数据库查询已经过优化。框架开销始终只占总时间的**不到 1%**。最大的性能瓶颈不是框架,而是低效的数据库查询——特别是 N+1 查询问题,导致响应时间增加了 6 倍以上。 虽然框架基准测试侧重于微优化,但**用户体验却主要由框架之外的因素决定。** 对于典型的流量水平(即使高达每天 100 万次请求),现有基础设施也具有充足的余量。 **关键要点:** * **优先优化数据库查询。** 修复低效查询比更换框架收益更大。 * **将部署地点靠近用户。** 减少网络延迟至关重要。 * **根据开发者体验、生态系统和可维护性选择框架**,而不是原始速度。 完整的数据和代码已公开提供,供审查和进一步分析。

一个 Hacker News 的讨论围绕着一篇声称框架选择对性能影响很小的文章展开。用户们大多不同意,认为文章的方法论——一个微小、简化的数据库测试——存在缺陷,不能反映实际应用。 许多评论者指出,设计良好的框架确实很重要,并举例说明了切换到更强大的框架(如 Phoenix/Elixir)所带来的显著成本和性能提升。另一些人强调,框架选择应优先考虑抽象和设计,而不仅仅是性能,尤其是在数据库性能是主要瓶颈时。 一个常见的批评是,文章从有限的范围得出广泛的结论,认为测试用例太小,除了“小作坊”级别的应用程序外,没有实际意义。有些人甚至怀疑这篇文章本身可能是 AI 生成的,因为它采用了过于简化的方法。

Anthropic进行了一项大规模定性研究,采访了来自159个国家、70种语言的80,508名Claude.ai用户,以了解他们对人工智能的期望和担忧。研究表明,人们主要希望人工智能改善他们的生活——不仅仅是提高生产力,而是腾出时间用于人际关系、追求爱好和实现财务独立。主要愿望包括“职业卓越”、创业机会和改善生活管理。 81%的受访者表示人工智能已经朝着实现他们的愿景发展,但担忧也多种多样,从失业和不可靠到潜在的滥用和人际关系的削弱。一个反复出现的主题是人工智能的益处与潜在危害之间的紧张关系——例如,获得时间与过度依赖技术。 有趣的是,全球对人工智能的总体情绪是积极的,但在低收入和中等收入国家,这种情绪*更加*积极,因为人工智能通常被视为一个机遇工具。该研究强调了人们希望人工智能解决医疗保健和教育普及等社会挑战。Anthropic计划利用这些见解来指导Claude的未来发展,重点关注福祉和有益的应用,并继续探索人工智能的承诺与潜在陷阱之间的复杂关系。

该项目详细介绍了使用289个NKK JB15LPF-JF开关作为显示屏,构建康威生命游戏的物理交互式实现。作者没有使用软件模拟,而是构建了一个设备,其中每个单元格都是一个带有集成LED的开关。 Microchip AVR128DA64微控制器通过顺序激活LED的行和列来管理显示屏,通过高电流(150mA)和快速切换实现亮度。用户输入通过检测开关闭合来检测。电位器控制模拟速度,开关切换单元格状态,并短暂暂停以进行编辑。 固件优先考虑安全性;屏幕更新与游戏逻辑分离,以防止二极管因持续电流而损坏,看门狗定时器确保稳定性。该设备安装在定制的木质外壳中,与触摸屏替代品相比,提供了触觉和引人入胜的体验。虽然成本较高(由于开关约为800美元),但作者认为触觉反馈证明了其价值,并探讨了更便宜/更精美的替代方案,例如3D打印键帽或翻点显示器。所有源代码和PCB文件均公开可用。

## 康威生命游戏:被实现(某种程度上) 一位创作者使用17x17的照明开关网格构建了一个大规模的、交互式的康威生命游戏。该项目花费约900美元,主要用于开关本身,但评论者讨论了更便宜的替代方案,例如使用Novation Launchpads或使用LED和3D打印组件的DIY解决方案。 讨论引发了进一步开发的想法,包括更经济的构建、更大的显示屏(甚至使用建筑物窗户作为像素!),以及通过动态地形显示将游戏与桌面角色扮演游戏集成。许多评论者回忆起在较旧的计算机上使用创造性的解决方法来实现生命游戏,因为资源有限。 尽管被承认仍然是*数字*实现,并且“像素”较大,但该项目的物理交互——通过按下按钮初始化状态——被认为是对经典模拟的一种引人入胜且迷人的诠释。该帖子还涉及了游戏完全机械或模拟版本的可能性。

大卫·阿尔特拉斯是一位来自汉堡的专业摄影师,专攻建筑、景观和室内摄影。他提供全面的视觉媒体制作,以精确、美观的方式呈现图像,并着重于光线和透视。 阿尔特拉斯擅长捕捉建筑和空间的之美与功能,充分展示建筑和设计的优势。他的景观作品突出了建筑环境与自然之间的和谐,而他的室内摄影则能为建筑师、设计师和开发商专业地传达氛围和设计。 除了摄影,他还提供电影制作服务。阿尔特拉斯将艺术天赋与技术技能相结合,创作出富有感染力的图像,深受德国及国际客户的青睐。他以灵活性、专业性和适应各种项目的独特风格而闻名——从住宅建筑到生活方式宣传活动。更多信息和作品示例可以在他的网站和社交媒体上找到。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 David Altrath 摄影日记 (davidaltrath.com) 12 分,由 mooreds 2 天前发布 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 thunderbong 1 天前 | 下一个 [–] 非常美丽的摄影作品。光线和对比度的运用捕捉得很好。已收藏!回复 Mistletoe 1 天前 | 上一个 [–] 我喜欢他的视角。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Borderhold需要JavaScript和桌面浏览器。返回borderhold.io。 正在加载Borderhold...

## Borderhold.io:一款大型浏览器策略游戏 Borderhold.io 是一款新的、基于浏览器的多人策略游戏,使用 Rust 和 Bevy 构建,旨在支持数百名玩家在广阔的地图上进行游戏。开发者旨在探索规模,提供相对较短的匹配,玩家可以在其中扩张领土、建造建筑物和飞船,甚至发射核弹。据报道,该游戏在高玩家数量下仍然稳定(已测试高达 1024 名玩家,帧率为 144 FPS)。 Hacker News 上的初步反应不一。虽然概念引人入胜,但许多用户报告了大量错误、缺乏清晰的游戏反馈以及难以理解游戏机制。一些评论员指出与现有游戏(如 OpenFront)的相似之处,质疑其原创性并要求提供更多关于开发过程的信息。 尽管存在批评,但一些用户对大型策略游戏体验的潜力表示兴奋,甚至建议它可能会启发未来的《文明》游戏。开发者已做出回应,承认地图模拟的挑战,并表示愿意回答问题。

更多

联系我们 contact @ memedata.com