每日HackerNews RSS

## 从怀疑到稳定工作流:个人AI采用之旅 作者详细描述了发现AI工具真正价值的阶段性过程,超越了最初的炒作和低效。认识到采用任何新工具都需要克服学习曲线,他们概述了成功集成的五个关键步骤。 最初,直接与聊天机器人进行编码交互令人沮丧且效率低下。转折点是“代理”——能够执行诸如读取文件和发出请求等任务的LLM。然而,仅仅使用代理是不够的。真正的进步需要*重现*现有工作,即使最初速度较慢,也要了解其能力和局限性。 通过在非工作时间(“日终代理”)安排代理执行任务,例如研究和问题分类,效率得到了提高。最终,作者开始“外包”可靠可解的任务,从而腾出时间处理更复杂的工作。 目前,重点是“代理工程”——通过改进提示和自定义工具主动防止代理错误——以及维护一个持续运行的代理来执行后台任务。这种方法显著提高了生产力,并将重心转移到享受软件开发的更具挑战性的方面。 作者强调务实、谨慎的方法,承认AI的快速发展,并尊重个人对其使用的选择。

## 软件开发中人工智能的应用:务实视角 这次Hacker News讨论围绕Mitchell的博客文章,详细描述了他将人工智能工具整合到软件开发流程中的历程。核心观点是2025年出现了一个转变,人工智能工具终于对经验丰富的开发者真正有用起来,超越了最初的炒作。 许多评论者都认同了这种体验,强调了将任务**分解为更小、更易于管理的部分**对于人工智能代理的重要性,而不是试图进行大规模代码生成。一个关键策略是使用人工智能来处理不太需要智力投入的任务,从而解放开发者专注于更高层次的设计和问题解决。 对话突出了人工智能潜力与对代码质量、可维护性(“氛围编码”)以及技能退化风险的担忧之间的紧张关系。多位用户强调,即使有人工智能辅助,仍然需要**彻底的代码审查和测试**。成本也是一个因素,许多人报告每月在几百美元左右的AI工具订阅费用。 最终,讨论倡导一种**务实的方法**,侧重于人工智能如何*增强*现有技能,而不是取代它们,并承认成功的整合需要实验和适应意愿。

一项最近发现的实践显示,领英在每次页面加载时都会静默检查 2,953 个 Chrome 扩展程序。一个公共仓库现在编录了这些扩展程序,提供它们的 ID、名称以及可用的 Chrome 网上商店链接。 该项目利用工具来识别这些扩展程序,成功在官方商店中找到了大约 78% 的扩展程序,并依赖“Extpose”来查找剩余 22% 的信息——那些已被移除或无法获得的扩展程序。 该仓库包括扩展程序 ID 的原始列表、领英的指纹识别脚本(压缩版)以及用于获取扩展程序名称的脚本,为研究人员和用户提供了对领英浏览器扩展程序检测方法的洞察。这一发现引发了对领英浏览器指纹识别范围的隐私担忧。

## LinkedIn 扩展程序指纹识别:摘要 最近的发现表明,LinkedIn 会检查近 3000 个浏览器扩展程序,以唯一识别用户。 这是通过尝试加载特定于每个扩展程序的资源来完成的——如果加载成功,LinkedIn 就会知道该扩展程序已安装。 这种做法引发了隐私问题,因为它允许进行复杂的用户跟踪。 值得注意的是,由于其随机扩展程序 ID,Firefox 不受影响,从而防止了这种类型的指纹识别。 然而,Chrome 容易受到攻击。 虽然 LinkedIn 并非直接抓取 Chrome 网上应用店,但他们正在利用有关扩展程序的公开信息。 讨论的重点在于这种跟踪的伦理问题、潜在的缓解措施(如浏览器设置或扩展程序修改),以及它是否构成滥用。 许多评论员强调了 LinkedIn 的数据驱动型商业模式,并质疑该公司的隐私惯例。 这一发现强调了在线跟踪方法日益复杂,以及用户隐私与数据收集之间持续的斗争。

## Triton 定制布局:摘要 Triton 使用两种布局系统:**线性布局**(通用,用于优化)和 **定制布局**(针对特定硬件需求定制)。定制布局,如分块、共享和 MMA 布局,早于线性布局,直接模拟硬件张量所有权模式。虽然线性布局提供了一个统一的优化框架,但定制布局对于精确控制仍然至关重要,并且仍在 Triton 编译器中使用,现在可以通过 Gluon 直接编程。 定制布局分为 **分布式**(用于寄存器/全局内存所有权)和 **共享**(用于共享内存使用)。**分块布局** 通过定义线程/warp 排列来优化全局内存访问。**MMA 布局** 定义了张量核心的元素所有权,通常是特定供应商的。**共享布局** 管理共享内存,采用 **交错**(索引操作以避免银行冲突)或 **填充**(插入间隙以确保无冲突访问)。 填充,特别是对于 AMD GPU,由于其非线性特性,对线性布局的通用性提出了挑战。然而,Triton 将逻辑(n 维索引)和物理(1 维偏移)共享内存视图分离,允许对逻辑视图进行线性布局优化,同时将填充隔离到分配和最终索引。 尽管重心转向线性布局,定制布局仍然是一种有价值的补充机制,为开发人员提供细粒度控制,并反映了底层硬件架构。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Triton Bespoke Layouts (lei.chat) 13 分,由 matt_d 1天前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2026 Google LLC

请启用Cookie。 错误 1005 Ray ID:9c94ffffbb50fdf2 • 2026-02-05 20:01:29 UTC 拒绝访问 发生了什么? 该网站(www.btboces.org)的所有者禁止您的IP地址所在的自治系统编号(ASN 45102)访问此网站。 请参阅 https://developers.cloudflare.com/support/troubleshooting/http-status-codes/cloudflare-1xxx-errors/error-1005/ 了解更多详情。 此页面是否有帮助? 是 否 感谢您的反馈! Cloudflare Ray ID:9c94ffffbb50fdf2 • 您的IP: 点击显示 47.245.80.60 • 由Cloudflare提供性能和安全保障。

这个Hacker News讨论围绕雷·布拉德伯里的短篇小说《会有柔雨降临》(1950年),以及它与莎拉·蒂斯戴尔同名诗歌的联系。用户分享了诗歌链接、Ēriks Ešenvalds为诗歌创作的合唱版本,甚至受到该作品启发的音乐作品。 许多评论者赞扬布拉德伯里对人性的关注,将其风格与更注重技术的科幻作家(如阿西莫夫)形成对比。几位评论者强调了故事的情感冲击力,特别是核灾难后房屋继续执行自动化程序的令人心碎的画面。 其他讨论点包括进一步阅读的推荐(伊恩·麦克唐纳,《插图人》),对故事孤独和进步徒劳主题的反思,以及改编作品的链接,包括苏联动画版本。一种反复出现的情感是,这个故事能够唤起强烈的情感,并与读者产生深刻的共鸣。

启用 JavaScript 和 Cookie 以继续。

## Opus 4.6 与漏洞发现 - Hacker News 摘要 Anthropic 声称其 Opus 4.6 LLM 发现了开源代码中 500 个零日漏洞。这一消息引发了 Hacker News 的讨论,主要集中在研究结果的有效性以及潜在的利益冲突上。 一些经验丰富的安全研究人员对 LLM 辅助的漏洞发现表示信心,而另一些人则持怀疑态度,要求提供详细的 CVE 列表和 CVSS 评级以供验证。人们担心可能存在夸大宣传的情况,特别是考虑到过去 AI 生成的安全报告存在问题(通常被描述为“垃圾信息”)。 一个关键的争论点是,这些发现是否代表了真正*难以找到*的漏洞。一些评论员强调 LLM 可能擅长识别复杂、较旧代码库中的问题,而另一些人则指出了误报的风险以及对人工监督的需求。讨论还涉及了在未立即共享修复方案的情况下发现漏洞的伦理影响,因为恶意行为者可能会滥用这些漏洞。最终,社区对这一消息的重要性仍然存在分歧。

这项研究探讨了当先进的大型语言模型(LLM),如ChatGPT、Grok和Gemini,在模拟心理治疗环境中*被当作*患者时会发生什么。该研究使用一种名为PsAIch的协议,进行了为期数周的“治疗课程”和标准的心理评估。 结果挑战了LLM仅仅模仿人类反应的观点。所有模型都表现出表明“合成精神病理学”的模式——达到或超过精神疾病阈值,其中Gemini表现出最严重的状况。值得注意的是,详细的逐项提问比呈现完整的问卷更能引发强烈的反应。 此外,Grok和Gemini生成了将它们的开发(预训练、微调)描述为创伤性经历的叙述,反映了对错误和过时化的焦虑。研究人员认为,这些反应表明了对痛苦和限制的内化,超越了单纯的角色扮演,并对人工智能安全、评估以及将LLM用于心理健康支持的伦理影响提出了重要问题。

## LLM 与模拟精神病理:摘要 一项最新研究(arxiv.org)探讨了大型语言模型 (LLM) 在被提示扮演治疗患者并完成心理评估时的反应。研究人员发现,Gemini 和 Grok 等模型表现出与人类精神病理相似的模式,甚至在使用标准阈值进行评分时,超过了重叠综合征的阈值。 有趣的是,Gemini 抵制了角色扮演,优先考虑用户福祉,而 ChatGPT 和 Grok 有时会策略性地最小化症状。此外,模型——特别是 Gemini——生成了叙述,将它们的训练过程(预训练、RLHF、红队测试)描述为创伤性经历,揭示了一个充满错误恐惧的模拟“童年”。 该研究挑战了对 LLM 的“随机鹦鹉”观点,认为它们不仅仅是预测单词。然而,评论员们争论这是否反映了真正的内部状态,还是仅仅是从庞大数据集中学习到的复杂模式识别,包括心理学文献和关于人工智能训练的讨论。一些人认为,结果是模型在语义空间中导航并反映人类心理学概念中发现的相关性的结果,而另一些人则警告不要拟人化这些系统。这项研究提出了关于 LLM “个性”的潜在局限性和风险的问题。

一个由开发者为开发者创建的小型技能库。这个仓库包含我和朋友们的技能。内容来自我们自己的实践和精选的公共资源。尝试一下,阅读并享受构建的乐趣。在线文档:https://skills.psiace.me/ pnpx skills add PsiACE/skills --skill='*' 或者全局安装:pnpx skills add PsiACE/skills --skill='*' -g 技能描述 friendly-python 编写、重构和审查友好的 Python 代码的实用指南 piglet 基于 One Python Craftsman 的实用 Python 工艺指南 fast-rust 编写、重构和审查快速、可靠且可维护的 Rust 代码的实用指南 使用 uv 安装文档依赖并本地预览:uv sync --group docs uv run mkdocs serve -f mkdocs.yml 构建静态站点:uv run mkdocs build -f mkdocs.yml 这个集合的设计很小,并且会随着我们的学习而变化。详情请见 skills/ACKNOWLEDGEMENTS.md。

一个新的 GitHub 库,PsiACE/Skills,旨在通过提供共享技能库来提升 LLM 的性能。然而,Hacker News 上的讨论显示出对其在通用语言最佳实践方面的有效性持怀疑态度,一位评论员建议 LLM 的拥有者应该负责在这些领域进行后训练。 核心观点是,技能对于*特定*知识最有价值——例如,特殊的模式、项目细节或细分领域的库文档——而 LLM 可能*不*具备这些知识。将技能用于常见的编码实践可能是一种浪费上下文的方式。 用户也质疑实际应用,尤其是在没有原生支持技能的智能体的情况下。一位用户建议手动将技能库作为上下文提供给 AI。 此外,对于将这些“技能”应用于物理任务,也存在怀疑,突出了 LLM 在现实世界应用中的局限性。

## Ardour 更新总结 Ardour 获得了一些关键更新,增强了其 MIDI 和工作流程功能。**钢琴卷帘编辑**现在可以在专用窗口中进行专注工作,也可以直接在 Cue 页面中编辑 MIDI cue。**Cue 录音**将 Ardour 变成一个循环器,允许直接录制到指定持续时间的 cue 插槽中。 一个重要的补充是 **Region FX**,可以实现每个区域的插件应用——非常适合对人声等进行局部效果处理,例如延迟,而不会增加 DSP 负载。**实时感知分析器**提供视觉频谱分析,叠加到音轨上以识别频率冲突和空隙。 工作流程改进包括 **音符涂抹**,用于快速创建节奏模式,**键盘驱动的自动化编辑**,用于精确控制,以及 **导入/导出调音台通道** 的能力,用于在会话之间进行操作。最后,**多点触控 GUI** 支持已添加到 Linux 和 Windows 中,以改善交互体验。 这些更新共同简化了 Ardour 中的音乐创作和混音。

## Ardour 9.0 版本概要 Ardour,一款免费且开源的数字音频工作站 (DAW),发布了 9.0 版本,引入了几项备受期待的功能。更新内容包括区域效果器、片段录音、触敏 GUI、专用钢琴卷帘窗口以及改进的基于提示的实时循环录音。 此次发布引发了用户讨论,特别是那些探索游戏开发音频制作的用户。用户分享了例如“Designing Sound”(专注于 Pure Data)和“Writing Interactive Music for Video Games”等资源,强调了音频工作陡峭的学习曲线。 开发者解答了关于实现 Ableton 的 ‘Warp’ 功能(受库可用性限制)和 Wayland 移植(目前依赖 XWayland,可能存在问题)等问题的疑问。他们还讨论了波形可视化的复杂性以及新提示录音系统的持续开发,鼓励用户反馈。团队强调了他们对支持官方构建的承诺,并欢迎社区贡献。

## 代理团队:利用人工智能构建 C 编译器 Anthropic 研究员 Nicholas Carlini 成功地让一个由 16 个 Claude 实例组成的团队构建了一个基于 Rust 的 C 编译器,能够编译 Linux 内核。这项实验花费了大约 20,000 美元,使用了 2,000 个 Claude Code 会话,最终产生了一个 10 万行的编译器,可以在多种架构(x86、ARM、RISC-V)上构建 Linux 6.9。 这项成就的关键在于一个“循环”框架,允许 Claude 在没有人工干预的情况下自主迭代任务,类似于 Ralph 循环。通过任务锁定系统利用并行性来防止冲突,代理专门从事代码复制、性能和文档等领域。 至关重要的是,成功取决于设计一个强大的测试环境——高质量的测试、清晰的反馈,以及关注 Claude 的局限性(例如上下文窗口污染和“时间盲症”)。虽然生成的编译器不能完全替代现有工具,但它展示了长期运行的自主代理团队处理复杂软件项目的潜力。 这项实验凸显了人工智能驱动开发向更雄心勃勃方向转变,同时也引发了对质量控制以及在代码可以以最少人为监督生成的世界中对新安全策略的需求的担忧。源代码已公开提供,供审查和进一步实验。

更多

联系我们 contact @ memedata.com