每日HackerNews RSS

## 构建一个用于并行计算的微型PC集群:摘要 该项目详细介绍了使用二手联想Tiny PC运行Ubuntu Server构建小型并行计算集群的过程。目标是学习如何将计算密集型R模拟,特别是目标最大似然估计(TMLE),分配到多台机器上,以减少与单台笔记本电脑或云解决方案相比的运行时间。 设置包括安装Ubuntu、配置无密码SSH以实现节点之间无缝通信,以及通过SSH自动化软件包安装。然后将R脚本分发到每个节点以利用多核处理。使用不同的交叉验证折叠(CV5与CV10)和各种SuperLearner模型比较了性能。 结果表明,与单机处理相比,集群的性能有了显著提高。增加CV折叠可以减少偏差,但略微增加方差。调整后的xgboost与glmnet结合,在偏差、方差和覆盖率之间表现出最佳平衡。 该项目强调了进一步开发的机遇,包括创建可重用的集群管理软件包、添加进度监控和ETA估计,以及探索openMPI以进行更高级的并行化。关键经验教训包括有效使用`sprintf`进行系统命令,以及在`future_lapply`中设置种子以获得可重复性的好处。

## Tiny PC 集群讨论 - Hacker News 摘要 一篇关于搭建小型 PC 集群进行并行计算的博客文章引发了 Hacker News 的讨论,讨论的中心是这种方法与使用成熟的高性能计算 (HPC) 工具的效率。 多位评论者建议使用 SLURM 进行集群管理,使用 Nextflow 进行工作流编排,认为它比基于 R 的自定义实现更具可移植性、可扩展性和语言无关性,用于任务分发。他们强调 Docker 在依赖管理和 Ansible 在节点配置方面的优势。 对话还涉及硬件选择,提到了 Beowulf 集群、Proxmox 虚拟化、树莓派集群(尤其是 Pi Zero,以降低成本)以及二手的 Intel NUC/联想迷你电脑。一位用户正在专门探索构建一个用于代码编译的集群,使用 NixOS 和网络启动。 最终,讨论强调,虽然构建自定义集群是一种宝贵的学习经验,但成熟的 HPC 工具为严肃的并行计算需求提供了更可靠和实用的途径。

## 关于大型语言模型的“平淡”真相 当前人工智能的讨论两极分化:要么大型语言模型(LLM)将彻底自动化所有知识型工作,要么它们只是被过度炒作的“随机鹦鹉”。本文认为,应该采取更冷静、因此也更不激动的观点——LLM是一种重要的*生产力*工具,类似于过去的科技变革,但不太可能导致广泛的经济崩溃。 LLM代表了另一层抽象,就像从汇编到Python编程的转变。虽然这通常会提高个人产出,但通常不会整体消除工作岗位。关键技能不是语法(现在由LLM处理),而是精确、系统的思维——这是LLM无法教授的。 影响可能主要体现在明确定义的任务中(总结、按规范编码),而模糊、依赖上下文的工作(战略、复杂谈判)——需要不成文的知识和判断力——仍然主要由人类驱动。LLM部署的三年里,这些模糊角色的就业并没有崩溃。 此外,大规模失业的说法与对劳动密集型行业(如医疗保健)持续高成本的预期相悖。如果由于人工智能导致劳动力成本*下降*,这些行业最终应该会看到价格稳定。 最终,最有可能的结果是劳动力重新分配,一些工人将转向仍然需要人类存在的行业,反映了历史上技术调整的模式。虽然LLM具有影响力,但期望它们引发一场独特的灾难性转变可能是一种过度反应。

## 黑客新闻讨论:人工智能 – 颠覆性还是仅仅…很好? 一场黑客新闻的讨论集中在人工智能是否会真正具有颠覆性,还是仅仅像以往的技术进步一样,是一种有用的工具。核心观点认为,人工智能可能会遵循过去技术的模式——从汇编到C到Python——抽象化提高生产力,但不会大幅改变就业人数。 几位评论员指出,虽然人工智能提高了生产力,但它不一定*取代*熟练工人,而是改变了他们的工作性质。有人担心招聘中可能出现年龄歧视,因为公司优先考虑“渴望”的年轻工人。 还有人强调人工智能可能会加剧现有问题,例如教育中的作弊,以及需要系统性变革,而不是依赖技术修复。 一个关键点是,人工智能的影响可能更类似于印刷机或文字处理器,而不是一场彻底的社会变革。 讨论还涉及推动人工智能投资的经济压力,质疑炒作是否与实际盈利能力相符。 最终,许多人认为人工智能将成为一种普遍的工具,融入许多工作,而不是消除对熟练专业人员的需求。

## Spotify 赢得对 Anna's Archive 的法院裁决 Spotify 成功获得法院命令,关闭了 Anna's Archive 的 .org 域名,该网站抓取并归档了流媒体服务中的音乐。 此法律行动源于 Anna's Archive 宣布打算将受版权保护的音乐作为 torrent 分发。 尽管一些人认为该网站实际上并未*托管*侵权材料,但法院引用了对 Spotify 业务的潜在未来损害。 许多评论员质疑法院反应的速度和严重性,并将其与在其他问题上的不作为进行对比。 讨论的中心是版权法、大型公司的力量以及音乐获取的伦理。 一些人认为 Anna's Archive 是一个宝贵的资源,而另一些人则承认,鉴于宣布打算分发受版权保护的材料,Spotify 的行动具有法律依据。 人们对艺术家和更广泛的音乐生态系统产生的影响表示担忧,一些人认为流媒体服务没有充分补偿创作者。 Anna's Archive 的替代域名已经流传,用户正在探索自托管解决方案。

我们正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1769034717-CHrlkoVfUNoXOKFk7Jsyqh2dt4e6s8pH 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1769034717-CHrlkoVfUNoXOKFk7Jsyqh2dt4e6s8pH

## Blue Origin 的 TeraWave:摘要 Blue Origin 宣布了 TeraWave,计划在低地球轨道 (LEO) 和中地球轨道 (MEO) 上部署 5408 颗卫星的网络,旨在提供高带宽连接。该系统将同时利用光通信和射频 (RF) 通信,提供高达 6Tbps 的卫星间回程和 144Gbps 的用户访问。 光通信的一个关键挑战——云层可能导致信号中断——将通过多个地面站网络来重新定向信号来解决。讨论的重点是维持连接的可行性以及潜在对飞机或天文观测的干扰。 该消息引发了关于轨道卫星密度增加和潜在空间碎片问题的争论,尽管许多人认为由于轨道衰减和规避机动,灾难性的凯斯勒综合症事件的风险目前较低。TeraWave 似乎针对政府、企业和其他高需求用户,而不是直接与面向消费者的服务(如星链)竞争。该项目还引发了关于频谱许可以及 Blue Origin 在亚马逊现有太空计划之外的长期战略的问题。

这是一个高度交互的网络应用程序,需要JavaScript。简单的HTML界面是可能的,但这并非如此。Andrew G. York (andrewgyork.bsky.social) 发布:令人激动的好消息!@mariaingaramo.bsky.social 的公司 (Nonfiction Labs) 制造了一种远程控制的抗体。它的结合在磁场的作用下可以开启和关闭。这是朝着我们磁控药物梦想迈出的巨大一步。想象一下,一种只攻击肿瘤,而不伤害身体其他部位的癌症药物。2026-01-13T04:57:32.733Z

## 蛋白质的磁力控制 研究人员开发了一种使用小型手持磁铁远程控制蛋白质功能的方法,AndrewGYork 在 Hacker News 上分享了这一消息。这项突破涉及对生物系统进行工程改造,使其响应磁场,从而有效地“开启”和“关闭”蛋白质活性。 这项发现,在 *Science* 和 *Nature* 的文章中详细介绍(提供链接),与未经证实的磁性手镯疗法的说法不同——研究人员本人驳斥了对正常生理功能的影响。相反,该研究侧重于操纵*工程改造*的蛋白质。 围绕研究的可访问性展开了讨论,有人建议使用 Skyview.social 允许查看 Bluesky 帖子,而无需注册帐户。核心发现展示了一种潜在的、强大的生物控制和研究新工具。

## SpeechOS:语音集成,提升生产力 SpeechOS 赋能开发者将语音输入无缝集成到他们的应用程序中,从而提高用户在各种用例中的效率。它通过加速数据录入,简化了在 **CRM**(Salesforce、HubSpot)中的工作流程,并简化了在 **CMS平台**(WordPress、Contentful)和 **文档编辑器**(Google Docs)中的 **内容创作**。 除了核心生产力工具外,SpeechOS 在 **笔记记录**(Notion、Obsidian)、**表单填写**(Typeform、Airtable)和 **客户支持**(Zendesk、Intercom)方面表现出色,通过减少打字并提高速度来提升效率。它还增强了 **可访问性**,方便运动障碍用户使用。 进一步的应用包括 **消息和聊天** 记录(Slack、Discord)、**语音控制仪表盘** 以实现免提导航,以及通过语音命令简化 **任务和项目管理**(Asana、Monday)。本质上,SpeechOS 改变了用户与软件交互的方式,使其更快、更便捷、更易于访问。

## SpeechOS:网页应用语音输入 David Huie 正在推出 SpeechOS,这是一款语音输入 SDK,旨在为 CRM 和文档编辑器等现有网页应用程序带来类似 Wispr Flow 的听写和命令功能。该 SDK 通过几行 JavaScript 代码和一个 API 密钥进行集成,为文本字段添加麦克风小部件。 SpeechOS 提供实时、流畅的转录以及编辑功能(“缩短一点”,“修正语法”),支持自定义词汇和语音激活命令(例如,“提交表单”)。开发者引用研究表明,语音识别的速度比打字快 3 倍,且错误率更低。 目前处于 Beta 测试阶段,并提供 HN 代码 **HN-JFc74cVC** 免费使用。SpeechOS 旨在通过压缩工作流程来提高生产力。Huie 正在寻求关于理想使用场景、所需的命令/代码片段配置以及对隐私、安全和定价的关注的反馈。 早期反馈强调了其压缩工作流程的潜力,但也提出了对隐私政策和法律文档缺乏的担忧,开发者对此表示认可,并计划在发布前解决。

多年来,作者一直苦于Sway缺少自动保存和恢复应用程序的功能——在从KDE切换后,这是一个令人沮丧的缺失。现有的解决方案不可靠,并且充斥着各种变通方法。最近,在将他的自建实验室迁移到更标准化的Ansible配置时,他重新审视了这个问题,并在Claude Code的帮助下,尝试构建一个解决方案。 最初的尝试重蹈覆辙,受到竞态条件的困扰。然而,深入研究Sway的文档后,他获得了一个关键的见解:窗口创建事件流包含进程ID。这使得他能够采用一种新的方法——同时启动所有应用程序,跟踪它们的PID,然后排列它们,从而避免了时序问题。 虽然Claude帮助完成了初始脚本,但作者完善了核心逻辑(完全没有使用AI),以处理嵌套窗口层次结构,克服了Sway IPC的限制。最终的结果,**sway-layout**,是一个基于Go的工具,它读取JSON配置文件以定义启动时的窗口布局。 目前,它在处理分离进程和窗口排序方面存在局限性,但提供了一个强大的自动启动解决方案。未来的开发可能包括通过事件跟踪和布局快照来实现会话保存/恢复。代码可在[GitHub](原文未提供链接)上找到。

## Sway 窗口管理器配置讨论 一个黑客新闻的讨论围绕着配置 Sway 窗口管理器展开。发帖者分享了自动化 Sway 布局启动的成功经验。 用户普遍认为,Sway 虽然强大,但需要大量的自定义才能使其完善,并指出缺乏合理的默认设置(例如,在栏中显示系统时钟)。然而,这个设置过程被视为一次宝贵的学习经历,能够更深入地理解底层系统组件。 一位用户详细介绍了广泛的个性化设置,包括自定义按键和窗口切换程序。另一位用户分享了一个复杂的自动启动配置,使用睡眠来实现所需的布局,但面临着时序和应用程序依赖性问题,导致在可用性之前需要等待 45 秒。发帖者建议探索并发应用程序启动,并可能为加载缓慢的应用程序使用无头输出。最后一位用户计划尝试将 Sway 作为 i3 的直接替代品。

你心中怀着怎样的奇妙梦想?尝试: 飞翔于云端 海边小镇 烹饪美味佳肴 夜空的星星 夜行列車 巫师之战 飞翔于云端 海边小镇 烹饪美味佳肴 夜空的星星 夜行列車 巫师之战 由Cloudflare AI Search提供支持

## 吉卜力搜索:语义图像搜索 一个新项目,吉卜力搜索 ([https://ghibli-search.anini.workers.dev/](https://ghibli-search.anini.workers.dev/)),允许用户使用文本描述或图像搜索吉卜力工作室的电影。它基于完整的 Cloudflare 技术栈(Workers, AI Search, R2, Workers AI)构建,能够根据语义含义找到视觉上相似的场景——例如,搜索“在日落时分飞过云层”将返回相关的片段。 早期的反馈表明它擅长通用概念搜索,但在特定角色识别方面存在困难。讨论围绕着使用吉卜力场景的合法性,有观点支持合理使用,理由是搜索引擎具有变革性,并链接回官方网站。该项目是开源的 ([https://github.com/aninibread/ghibli-search](https://github.com/aninibread/ghibli-search)),创建者欢迎反馈以改进。

## OpenAI平台漏洞:通过API日志泄露数据 OpenAI平台存在一个关键漏洞,使用“responses”和“conversations”API构建的应用程序和代理容易发生数据泄露。这源于API日志中不安全的Markdown渲染——即使应用程序本身阻止了恶意Markdown图片。 攻击链涉及将恶意提示注入到AI应用程序使用的数据源中(例如KYC工具)。这会操纵AI生成一个包含敏感用户数据的URL的Markdown图片。虽然应用程序*可能*会阻止渲染此图片,但漏洞在于OpenAI平台的API日志查看器。当开发者在日志中查看标记的对话时,Markdown会被渲染,从而触发对攻击者服务器的请求并泄露被盗数据。 这不仅影响直接使用这些API构建的应用程序,还影响OpenAI的开发工具,如Agent Builder、Assistant Builder、ChatKit,以及可能将OpenAI列为子处理者的任何供应商。尽管通过BugCrowd向OpenAI进行了负责任的披露,但报告被关闭为“不适用”,促使公开发布以告知用户和开发者采取预防措施。

抱歉,此网站在未启用 JavaScript 的情况下无法正常工作。请启用 JavaScript 以继续。

## Rust SIMD编程:Hacker News讨论总结 最近Hacker News上围绕一篇关于Rust中SIMD编程的博客文章展开讨论,引发了关于编写安全且高性能密码代码的最佳方法的争论。虽然使用像Rust这样的内存安全语言是有益的,但评论员强调,**真正的安全性,特别是针对侧信道攻击,通常需要用汇编语言编写关键的密码内核。** 这是由于编译器不可预测性以及OpenSSL等库的C代码中长期存在的漏洞,而非汇编部分。 对话还涉及了Rust的SIMD实现复杂性。尽管有所进步,但仍然缺乏标准化的、可移植的高级API,导致crate碎片化,以及一些人对内联汇编的偏好。现代CPU提供了大量的SIMD寄存器文件(例如Zen 5的24KB),但溢出到内存会抵消优势。 参与者强调了`.chunks_exact()`用于自动向量化等技术,以及指定目标CPU特征以进行intrinsic使用的重要性。讨论还指出,Intel过去AVX-512降频问题常常被夸大,尽管最初存在担忧,但该指令集仍然很有价值。最终,共识倾向于混合方法:使用Rust实现内存安全,并使用汇编语言进行最敏感的密码运算。

更多

联系我们 contact @ memedata.com