每日HackerNews RSS

wterm(“dub-term”)渲染至 DOM —— 原生文本选择、复制/粘贴、查找和辅助功能均可直接使用。其核心由 Zig 编写并编译为 WASM,以实现接近原生的性能。

Hacker News 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Wterm – 网页终端模拟器 (wterm.dev) 14 分,由 m3h 发布于 5 小时前 | 隐藏 | 往期 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

LLM 评估器往往存在噪声,且与实际应用效果的相关性较差,因此在判断单个输出时(例如在生产环境的防护机制中)并不可靠。然而,对于模型选择或提示词优化等离线任务而言,这种噪声并非致命缺陷。 核心见解在于:**噪声会相互抵消**。在比较两个智能体时,评估器在单个输出上的偏差会在足够大的样本量下相互抵消。只要评估器不存在偏袒较差智能体的系统性偏差,其平均分就能可靠地识别出性能更优的版本。 在网格世界(Gridworld)、Wordle 和数据提取等多种任务的实证测试证实了这一点:尽管输出层面的相关性较低,但智能体层面的相关性却显著增强。在所有测试环境中,即使是存在噪声的评估器,也能成功识别出更好的智能体,其两两对比的胜率始终高于随机猜测。 **结论:** 从业者应区分输出层面的可靠性(生产环境防护所需)与智能体层面的可靠性(开发阶段所需)。只要评估数据集足够大,能够让信号从噪声中显现出来,即使是“有噪声”的评估器,也是用于离线模型选择和渐进式优化的有效工具。

抱歉。

为了确保备份可靠并加快工作流程,你可以使用本地“裸”(bare)仓库来托管自己的 Git 远程仓库。 设置方法如下:进入家庭服务器上的某个目录,运行 `git clone --bare /path/to/project`,即可创建一个专用于托管的仓库。之后,你可以通过以下命令将其添加为本地机器的远程仓库:`git remote add local ssh://USER@MACHINE:/path/to/bare/repo.git`。配置完成后,你就可以像操作其他远程仓库一样推送和拉取代码了。 这种方法具有多重优势:它为可能不稳定的异地服务器提供了一个高可用性的替代方案,降低了延迟,并能让你实现“两全其美”的设置——既保留了用于即时访问的本地远程仓库,又拥有用于冗余备份的异地副本。通过自建基础设施,你可以在享受更可靠开发流程的同时,保持数据独立于大型科技平台之外。

这篇 Hacker News 帖子讨论了在 Git 中使用“本地远程仓库”(local remotes)的实用性及其概念本质。许多评论者起初对这种做法表示质疑,指出由于 Git 本身就是分布式的,仅使用本地分支或将更改保留在个人计算机上通常就已足够。一些参与者认为,将本地文件夹视为“远程”是不直观的,且可能多此一举。 然而,其他人强调了该技术的一些实用场景: * **协作与归档:** 使用共享网络驱动器或 Dropbox 文件夹进行团队访问或异地备份。 * **安全性:** 在同步到远程服务器之前推送到本地加密容器,以避免信任云服务提供商。 * **环境隔离:** 便于在难以直接同步的容器内进行开发。 * **多机同步:** 维护一个中央本地存储库,以便在不依赖第三方云托管的情况下同步多台机器。 讨论还触及了一个常见的误解,即 GitHub 等同于 Git;用户指出,许多开发人员常将该平台误认为是其背后的版本控制系统本身。

为了容纳罗马迅速增长的人口,该市首创了“因苏拉”(insula),即高密度、多层的公寓楼。这些建筑通常有数层高,底层为商铺,楼上为住宅单元。尽管它们代表了垂直居住方式的突破,却充满了隐患:居民面临着不稳定的结构风险、由劣质材料引发的频繁火灾,以及极差的卫生条件。 像克拉苏这样的富有企业家从这些危险状况中牟利,他们买下受火灾损毁的建筑进行翻修。公元64年罗马大火后,尼禄皇帝推行了强制使用防火材料的建筑规范,但风险依然存在。罗马人在混凝土方面的创新——将石灰与火山灰混合——最终实现了更耐用的建筑,这一点在港口城市奥斯提亚保存完好的因苏拉建筑中得到了印证。 尽管顶层单元通常狭窄、不舒适且缺乏自来水等基本设施,但因苏拉营造了一种充满活力、适合步行的城市文化。通过整合居住、商业和公共空间,它们为高密度生活创造了蓝图,这与现代城市中心不谋而合。尽管那个时代随着环境和经济的变迁而结束,但因苏拉依然是人类智慧的见证,展示了如何在受限、紧凑的建筑空间中解决住房短缺问题。

这篇 Hacker News 帖子讨论了古罗马高密度居住的历史现实,起因是一篇发表在《Common Edge》上的文章。 评论者强调了罗马城市生活中始终存在的危险,指出居住在拥挤的公寓楼(insulae)中意味着要不断面临风险,例如高层窗户坠落的杂物。一位用户引用了尤维纳利斯的《讽刺诗》,强调了即便在“宜居城市”的便利之下,日常生活依然充满不确定性,并幽默地将其与现代城市生活进行了类比。 讨论还探讨了影视作品中对罗马平民的描绘。尽管大制作通常聚焦于贵族和将军,但用户指出费里尼的《爱情神话》(Fellini Satyricon)聚焦于普通公民在建筑倒塌等城市灾难中的挣扎。此外,英国喜剧《古罗马平民》(Plebs)也被提及,该剧以讽刺的视角利用罗马背景来评论现代社会问题,而非追求历史准确性。总之,这篇帖子反映了人们对古代世界普通人平庸且往往残酷的现实生活的迷恋。

**aislop** 是一款开源的确定性工具,旨在捕获并清理 AI 代码助手经常生成的“垃圾内容”(slop),例如叙述性注释、被吞掉的异常、无效代码以及幻觉导入。虽然 AI 生成的代码可以通过测试和代码检查工具,但它们往往会随时间推移降低项目质量。 **主要功能包括:** * **质量评分:** 使用七种主流语言的 40 多条规则对代码进行 0–100 分的评分。 * **确定性分析:** 无需依赖大语言模型(LLM),确保结果一致,无需外部 API 调用,亦无延迟。 * **自动修复:** 自动解决琐碎问题(如未使用的导入、格式化等),并可直接与 Claude Code、Cursor 和 Gemini 等工具集成,在完整上下文下解决复杂问题。 * **支持 CI/CD:** 包含质量门禁,若代码质量低于预设阈值,可阻止合并。 * **易于使用:** 通过 `npx` 运行,无需安装,适用于任何项目,并支持自定义配置。 通过提供统一的质量门禁,aislop 可确保 AI 辅助的工作流保持整洁、可维护且专业。立即运行 `npx aislop scan` 开始使用。

开发者 Kenny (Heavykenny) 推出了 **AISlop**,这是一款本地命令行工具,专门用于检测“AI 代码异味”(AI code smells)——即大模型常生成的欠佳代码模式,如空的 catch 代码块、冗余代码和无用注释等。与标准代码检查工具(linter)不同,AISlop 专门针对 AI 代理经常表现出的重复或草率习惯进行了优化。 该工具在本地运行,确保了代码隐私,并可集成到开发钩子(hooks)中以提供即时反馈。在 Hacker News 上,用户的反响大多积极,将其视为审查 AI 生成内容的一种有益的“质量控制”层。尽管一些评论者对“AISlop”这个名称是否恰当进行了讨论,并质疑无论作者是谁,重点是否都应仅仅放在代码质量本身,但开发者明确表示,其主要目标是通过捕获可能逃过自动化工作流的低质量设计模式,来防止代码库的长期退化。用户可以通过 `npx aislop scan` 测试 AISlop。

伊拉克内政部已就曼陀罗(Datura,又称洋金花或魔鬼号角)在全国农田的入侵式蔓延发出紧急警告。虽然该植物含有有价值的药用生物碱,但对人类、动物和农作物具有剧毒。 该植物原产于中美洲,其在伊拉克的迅速扩张令科学家感到困惑。研究表明,曼陀罗具有独特的“即时适应潜能”,使其能够在各种环境中茁壮成长,从寒冷气候到伊拉克半干旱、富含氮的河岸地区均能适应。多年冲突导致的肥沃农田荒废以及农业疏于管理,进一步加剧了其蔓延。 伊拉克当局目前正开展全面的根除行动,通过利用杀虫剂、生物防治和公众宣传倡议进行治理。然而,专家警告称,该植物生命力极强,对全球生态系统构成持续威胁,并有进一步扩散至尚未被探索的温暖地区的可能。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 有毒入侵:在伊拉克危害农作物的“恶魔小号”是什么?(aljazeera.com) 8 分,由 YeGoblynQueenne 于 25 分钟前发布 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

维基媒体基金会(WMF)近期宣布解散其“社区技术”(Community Tech)团队。该团队此前一直致力于为维基百科的志愿者编辑开发各类所需工具。WMF 声称,此次重组旨在通过将技术职责分配给其他团队来消除工作瓶颈,但此举引发了编辑们的强烈不满,他们担心会因此失去与基金会之间的重要沟通桥梁。 由于受影响的员工此前据称参与了工会化运动,外界对“打压工会”的质疑进一步加剧了反弹。尽管 WMF 否认了相关指控,但社区正要求恢复该团队。不满情绪不断蔓延,已有超过 700 名编辑签署请愿书,表示愿意通过罢工进行抗议。 虽然正式的罢工方案仍在讨论中,但提议的行动包括屏蔽捐赠横幅或停止日常维护工作(如清理垃圾信息和更新条目等)。专家警告称,志愿者的停工可能导致维基百科的准确性和时效性迅速下降。鉴于维基百科作为互联网信息关键支柱以及 AI 模型训练源的重要性,贡献者们希望此次集体行动能迫使 WMF 重视其与维基百科站点背后志愿者之间的关系。

Hacker News 上出现了一场关于维基百科资深编辑可能罢工的讨论。讨论很快澄清了一个常见的误解:虽然相关报道提及了潜在的罢工,但“Wiki Workers United”组织实际上是维基媒体基金会受薪员工的工会,而非维护平台内容的无薪志愿者编辑。 用户之间的辩论集中在志愿者罢工的潜在影响上。一些人认为,负责处理破坏行为和内容维护的志愿者一旦罢工,将导致网站瘫痪;而另一些人则质疑组织这种分散的志愿者队伍的可行性。持怀疑态度的人指出,维基百科在偏见和中立性方面一直面临争议,并暗示这些内部矛盾可能导致未来的“分支”或替代版本出现。总体而言,评论者对于维基百科的模式是否真正易受此类劳资纠纷的影响,或者该平台是否已稳固到无法被去中心化替代方案所取代,仍存在分歧。

作者观察到,代理式代码生成往往绕过了短期记忆、工作记忆和长期记忆之间的相互作用,而这些认知过程对于真正掌握技能至关重要。依赖人工智能获取即时解决方案,类似于社交媒体令人上瘾的反馈循环,会导致“脑雾”而非真正的理解。 为了重新掌控并磨练技艺,作者主张在开发过程中重新“增加阻力”。通过刻意放慢速度,将认知投入置于速度之上。有效的策略包括: * 在寻求人工智能审查之前,先亲自编写初始代码。 * 将智能体作为教育工具,用于解释概念或比较架构方案。 * 执行“20分钟规则”,即在使用人工智能之前先独立尝试解决问题。 * 以传统学习方式补充数字工具,例如阅读学术论文和重新实现基础数据结构。 作者最终指出,编程的目标不应是寻求阻力最小的路径。为了精通开发,我们必须优先构建自己的思维基础,而非依赖模型的思维基础;简而言之,在这个过程中,人类在认知上应该比人工智能付出更多的精力。

Hacker News 最新 | 往日 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 我们应该比模型更疲惫 (vickiboykis.com) xrd 发布于 59 分钟前 | 7 分 | 隐藏 | 往日 | 收藏 | 2 条评论 | 帮助 fhdkweig 9 分钟前 | 下一条 [-] [重复] 此链接几分钟前已发布,且有更多评论。 https://news.ycombinator.com/item?id=48322118 回复 aselimov3 55 分钟前 | 上一条 [-] 这绝对是正确之道。我不认为长期来看,完全脱离代码编写的代理式工程是可持续的。我认为这必然会导致(技能)退化。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

日本式的“过度设计”——即细致入微地解决哪怕最轻微的用户困扰——既令人忍俊不禁,又深受启发。百乐(Pilot)的“Kire-Na”荧光笔就是一个极佳的例子。百乐发现用户常受困于下笔力度不均和墨水渗漏问题,为此投入了长达六年的研发时间来寻求解决方案。 通过在斜切笔尖上增加小型塑料导向装置,百乐打造出了一款能自动调节角度与压力的荧光笔。结合其专利的超速干墨水,该产品消除了污损和渗墨现象,确保每次画出的线条都完美笔直。这种对完美的执着追求(包括曾将项目推倒重来)大获成功,上市首年销量便突破千万支。Kire-Na堪称工业设计的教科书,它展示了对“难以忍受”的用户体验痛点进行极致的关注,如何将平凡的日常用品转化为功能上的杰作。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 对用户体验的极致追求:百乐(Pilot)压力调节荧光笔 Kire-Na (core77.com) 3 分,由 surprisetalk 提交于 2 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

RM6237低值采购系统旨在简化小型企业的政府招标流程,但其中存在一个令人沮丧的官僚障碍:强制性的月度报告要求。即使企业当月零销售,也必须登录系统并完成多重身份验证,以提交一份“零申报”。 一份信息自由请求揭示了这种低效的真实规模。在2025年3月至2026年2月期间,该系统平均每月有超过1300名用户,然而其中约96%至97%的提交内容均为“零申报”。这意味着每月有超过一千家小型企业被迫浪费时间报告零业务。假设每次申报耗时两分钟,这每月总计造成了超过48小时的行政资源浪费。 作者认为,政府部门应当自行追踪支出情况,而不是将负担转嫁给供应商。更糟糕的是,政府商业机构声称他们并未针对RM6237收集用户反馈,这意味着他们既忽视了造成这一困境的根源,也未能衡量自身繁文缛节所带来的影响。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 英国政府的低值采购系统是在浪费时间 (shkspr.mobi) 16 点,由 ColinWright 发布于 43 分钟前 | 隐藏 | 过往 | 收藏 | 2 条评论 | 帮助 toyg 1 分钟前 | 下一条 [–] 他们应该增加一个“暂停账户”的选项。你提交一次零申报,然后挂起,除非有必要,否则永远不必再回来。这看起来很简单。 回复 solenoid0937 1 分钟前 | 上一条 [–] 政府雇员和部门需要绩效激励。而且不是那种离他们的日常工作非常遥远的“投票”机制。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com