每日HackerNews RSS

## AI 与编码的未来:现实的看法 尽管炒作广泛,但人工智能将*取代*程序员的说法大多被夸大了。虽然人工智能工具正在快速发展,并且在代码生成和错误检测等任务中明显有用——作者每天都在使用这些工具——但它们目前缺乏构建健壮、可扩展应用程序所需的批判性思维和架构理解。 许多关于人工智能影响的预测是由既得利益驱动,或者来自缺乏深入编程经验的人,这反映了即使在其他领域(如自动驾驶汽车或医疗人工智能)的知名专家也曾做出过不准确预测的历史。 人工智能擅长“样板代码”,但如果没有人工监督,始终会产生难以维护的“意大利面代码”。真正的软件开发需要理解项目背后的*原因*,而不仅仅是*方法*——这是人工智能尚未掌握的细微之处。因此,人工智能应该被视为程序员技能的强大*补充*,而不是替代品。软件开发的核心——解决人类问题——仍然需要人类的创造力和专业知识。

一场 Hacker News 的讨论围绕着一篇名为“人工智能在编码中的革命:为什么我无视末日预言者”的博文展开。许多评论者怀疑这篇博文本身是由人工智能撰写或大量辅助的,理由是其风格线索,例如项目符号、粗体短语和“最终想法”等——这些模式经常出现在 LLM 生成的文本中。 争论超越了作者身份。一些人认为人工智能*已经*在自动化软件工程的重要部分,而另一些人则要求提供证据。一个关键点是,即使人工智能在特定任务上表现出色(例如放射学中的图像分类),人为监督和现实世界的约束(法规、责任)也会阻止完全自动化。 一些评论者对“人工智能将取代程序员”这一反复出现的说法表示沮丧,将其称为否认或无意义的争论。另一些人则强调该文章的写作质量平庸,无论是否涉及人工智能,并质疑那些缺乏丰富专业经验的人的观点有效性。

## LLMNet:您的私有离线AI搜索引擎 LLMNet提供安全快速的搜索体验,由您*本地*的大型语言模型(LLM)提供支持。它使用向量数据库(RAG)将您的LLM转化为强大的离线知识库,提供即时答案——无需互联网连接。 LLMNet基于Next.js、Tailwind CSS和PostgreSQL构建,优先考虑隐私;您的数据*绝不会*离开您的设备。您可以轻松索引网站或维基,将内容转换为可搜索的Postgres向量数据库。 主要功能包括亚秒级语义搜索、现代深色模式UI以及递归摄取管道,该管道可以抓取、转换为Markdown、分块和嵌入内容,以实现高效检索。 LLMNet需要本地运行的LLM服务器(如Llama.cpp或Ollama)以及安装了pgvector扩展的Postgres数据库。非常适合注重数据主权和离线信息访问的用户。

## LLMNet:一个离线互联网 一个名为LLMNet(github.com/skorotkiewicz)的新项目在Hacker News上引起关注,它提供了一种“无需网络即可搜索网络”的方式。它本质上允许用户构建自己的知识库,从而创建一个个人化的离线互联网。 然而,最初的反应褒贬不一。一些评论员认为该项目的营销具有误导性,认为个人知识库并不等同于复制整个互联网。另一些人则对专门关注维基百科数据的类似工具感兴趣,并提到了“LLM Zim”这个搜索词。 讨论还涉及用户界面,一些人认为它缺乏灵感。尽管如此,LLMNet仍然提供了一种潜在的有用解决方案,可以在没有互联网连接的情况下访问信息。

客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。此网站的必要部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置所致。请检查您的连接,禁用任何广告拦截器,或尝试使用不同的浏览器。

## TikTok文学评论家与影响力之争 《新政治家》杂志报道了TikTok创作者杰克·爱德华兹,他作为文学评论家获得了大量关注(150万订阅者)。Hacker News上的讨论集中在他是否值得被称为“世界上最有影响力的人”以及他评论的本质。 许多评论者质疑他分析的深度,认为他主要提供情节摘要和个人观点,而非严谨的评论,并且可能在重新包装他人的书评。一些人承认他对书籍销量的影响,但争论影响力是否等同于“权力”。另一些人指出社交媒体的表演性质以及在拥有如此影响力时保持真实性的压力。 对话还涉及算法策划、单个网红的统治地位以及TikTok等平台“沦为劣质”的潜力等更广泛的问题。 几位用户推荐了其他文学讨论的来源,例如萨姆·普拉姆的YouTube文章,并讨论了在网上浏览内容和Cookie横幅的挑战。最终,该帖子突出了真正的文学分析与社交媒体名声之间的紧张关系。

电子前沿基金会(EFF)曾警告政府整合数据用于监控的危险,最近的披露证实了这些担忧正在成为现实。美国移民及海关执法局(ICE)现在正在使用由Palantir开发的工具ELITE,来识别和追踪可能被驱逐出境的个人。 ELITE从包括医疗补助(通过卫生与公众服务部)等来源收集数据,创建包含“可信度评分”的档案,评分基于地址信息。这与EFF对特朗普政府计划建立集中式、人工智能驱动的公民信息数据库的担忧相符。 鉴于ICE加强了监控活动,包括在明尼阿波利斯等城市的大规模部署,以及可能援引《煽动法》,这一进展尤其令人担忧。EFF强调将为基本服务收集的数据用于无关的执法行动的危险,强调了一种越权行为模式,并呼吁公众抗议和国会采取行动,以保护隐私和公民自由。

## 星座:一场真实关系游戏 “星座”是一款真实关系游戏,参与者通过将手放在最符合描述的人的肩膀上来回应提示——包括他们自己。也可以选择不参与。这款游戏的力量在于它的简单性以及主持人调整提示“敏感度”的能力,从轻松愉快(“你想一起喝啤酒的人”)到可能敏感(“你认为最性感的的人”)。 随着提示变得更具挑战性,有趣的动态会浮现。参与者开始在真实性与社交风险之间权衡,有时会奉承、欺骗或策略性地回避答案以保护自己或他人。一个关键的观察是,个人会在回应负面提示*之前*评估潜在的冒犯性。 这款游戏揭示了人们如何表达对反馈的开放程度——并因此获得更多反馈——并突出了诚实与维护社会和谐之间的紧张关系。虽然有些问题被证明风险过高,但主持人旨在找到“最佳点”——推动边界以揭示令人不舒服的真相,同时避免社交崩溃。最终,观察参与者的行为——犹豫、风险计算——变得与答案本身一样富有洞察力。

一个黑客新闻的讨论围绕着一篇关于社交游戏“Authentic Relating”(AR)的文章,通常被称为“指点游戏”。 游戏涉及参与者对彼此进行观察——通常是尖锐或脆弱的观察——以及“接收者”的回应。 评论大多是批评性的。 许多用户觉得这个游戏会引起焦虑,可能有害,并且被设计用于冲突或提取信息。 有些人将其比作令人不安的场景或“反社会者的派对游戏”,认为它会助长边界侵犯和羞辱。 还有人指出,享受这种社交冒险可能存在性别差异。 然而,一位来自瑞典的评论员分享说,一个类似的游戏在那里很受欢迎,作为一种轻松的饮酒游戏。 尽管如此,总体情绪倾向于谨慎,许多人表示希望避免这种互动,并更喜欢更轻松的社交环境。 几位用户链接到解释“Authentic Relating”的资源,强化了对其潜在操纵性的担忧。

美国联邦航空管理局为冰上事务局行动设立无人机禁飞区。

## FAA 在 ICE 作业区域实施全国范围内的无人机禁飞区 FAA 已经实施了围绕国土安全部 (DHS) 作业区域(包括 ICE)的新型移动禁飞区,设置了 3000 英尺横向和 1000 英尺纵向缓冲区。 与传统限制不同,这些区域不会公开宣布坐标或激活时间,这意味着无人机操作员可能会在不知情的情况下违反禁令,因为 ICE 部队正在移动。 这引发了对过度管辖和潜在违宪性的担忧,因为它过于模糊,并被拿来与专制战术进行比较。 评论员担心这项规定将被用来压制对 ICE 活动的记录,特别是考虑到无人机现在经常传输识别信息。 讨论还集中在潜在的滥用可能性上,一些人提到了最近涉及 ICE 的事件,并质疑在这些区域内采取行动的合法性。 另一些人则争论这些规则的可执行性,并探讨了规避无人机跟踪技术的方案。 许多人认为这一举动是故意试图将 ICE 屏蔽在公众监督之下。

## 白宫修改抗议照片,引发争议 白宫因发布了一张经过数字修改的内基玛·莱维·阿姆斯特朗(一位在抗议活动中被捕的民权律师)的照片而面临批评。修改后的图像使阿姆斯特朗看起来像在哭泣,引发了关于虚假信息和滥用权力的指控。白宫为该帖子辩护,表示“表情包会继续”,表明他们愿意采用此类策略。 这起事件引发了关于将生成式人工智能用于政治目的的讨论,许多人注意到这些技术被迅速用于宣传。法律专家认为阿姆斯特朗可能有理由提起诽谤诉讼,但人们担心政府行为者可能享有豁免权,并且难以证明损害。 评论员对谎言和不诚实策略的常态化表示担忧,一些人将其与历史上的宣传例子相提并论。许多人担心信任的侵蚀以及辨别真相和虚假信息日益困难,尤其是在人工智能生成的内容变得越来越普遍的情况下。呼吁采取的行动包括法律挑战、抗议以及更广泛的社会变革,以解决不平等和提高媒体素养。

## AI驱动的Elixir开发:总结 BoothIQ,一种展会徽章扫描仪,完全使用AI生成的Elixir代码构建(15万行!)。虽然生产力极高,但经验揭示了其优势和劣势。 **优点:** Elixir体积小,语法简洁,非常适合AI,减少决策并最大限度地利用有限的AI“记忆”中的上下文。像Tidewave这样的工具,提供对正在运行的应用程序日志和数据库模式的访问,进一步提高准确性并减少“幻觉”。AI在前端工作方面表现出色,可以快速实现设计更改并提高代码质量。 **缺点:** AI倾向于使用防御性、命令式编码风格,这种风格常见于Ruby和JavaScript等语言,需要不断纠正以保持惯用的Elixir风格。 **问题:** AI难以处理并发和测试。它不理解Elixir的进程隔离或事务性测试,导致调试陷入僵局。它也缺乏架构愿景,经常创建冗余文件和不一致的代码。 尽管存在这些缺点,生产力提升仍然很大。成功的关键在于维护一致的代码库架构,并积极引导AI采用良好的Elixir实践。最终目标是自动化整个开发生命周期,最大限度地减少人工干预。

## Hacker News 讨论:15 万行“氛围编码”的 Elixir 代码 一场 Hacker News 讨论围绕着一篇博客文章展开,该文章详细介绍了使用 AI(特别是 Claude)生成大量(15 万行)Elixir 代码构建系统的经验。作者认为这个过程富有成效,但对话很快转向了以代码行数衡量生产力的优缺点——这种做法被广泛认为是有缺陷的。 许多评论者质疑如此庞大的代码库的效率,认为存在冗余,并强调了长期以来对代码行数作为指标的批评。其他人分享了使用 AI 辅助编码的经验,指出存在代码不符合惯例、过度防御以及难以处理异步操作和测试等复杂任务的问题。 几位用户强调了明确的提示、 “技能”(为 AI 预定义的指令)和上下文管理的重要性,以减轻这些问题。关于当前的 LLM 是否会显著改进,或者它们的用处是否已经达到瓶颈,以及不断上涨的成本是否会超过收益,存在争论。尽管存在挑战,一些开发者报告在使用 AI 方面获得了显著的速度提升,特别是使用 Tidewave 等工具和精心设计的提示。

## Netfence:基于eBPF的网络过滤 Netfence是一个利用eBPF过滤器动态控制虚拟机和容器网络访问的系统。它在每个主机上运行一个守护进程,将过滤器注入到网络接口(TC)或cgroup中,并通过gRPC实现的用户控制平面进行集中控制。 该守护进程管理一个每附件的DNS服务器,解析允许的域名并自动更新eBPF过滤器中的IP白名单。这允许基于策略的网络控制——允许列表、拒绝列表或阻止所有流量,支持IPv4/IPv6 CIDR和基于域名的规则(包括子域名)。 编排系统通过本地gRPC API与守护进程交互,以附加/分离过滤器,并提供用于标识的元数据(VM ID、租户等)。然后,守护进程与控制平面同步,通过双向流接收初始配置和更新。 Netfence通过在流量离开主机*之前*进行过滤,最大限度地减少延迟,从而优先考虑性能。控制平面处理规则定义(ALLOW/DENY),并将这些规则推送到守护进程,确保网络策略的一致性。

## Netfence:基于eBPF的类似Envoy的防火墙 Netfence是一种新的工具,旨在实现安全的代理防火墙,被描述为“eBPF过滤器的Envoy”。它允许定义基于DNS的规则,将规则解析为IP地址,然后通过高效的eBPF过滤器应用,从而控制出站网络访问,而不会产生性能损失。 与传统方法不同,Netfence避免修改基础镜像,防止代理对规则的潜在操纵。它使用类似于Envoy的xDS控制平面自动管理容器和微型VM(如Firecracker)的eBPF过滤器生命周期,从而实现动态规则更新和每个cgroup/接口的DNS解析。 创建者使用Netfence来限制代理访问特定服务,如S3、pip、apt和npm。一个关键的讨论点围绕DNS缓存展开;Netfence利用标准的DNS TTL进行IP查找,并利用高效的增量更新来管理权限规则,从而最大限度地减少延迟。虽然与Cilium类似,但目前它是在Kubernetes环境之外使用的。

## PostgreSQL 中的死信队列,用于可靠的事件处理 在构建 Wayfair 使用 Kafka 和 CloudSQL PostgreSQL 的每日业务报告系统时,团队面临着分布式系统不可避免的故障带来的挑战——API 故障、消费者崩溃和格式错误的事件。传统的 Kafka 死信队列 (DLQ) 由于缺乏检查和重试的可见性而证明不足。 解决方案是利用 PostgreSQL *作为* DLQ。失败的事件以及故障上下文直接持久化到专用的 `dlq_events` 表中,标记为“PENDING”。这提供了一个可查询、可审计的故障记录。一个由 ShedLock 提供支持的重试调度器,定期扫描此表以查找符合条件的事件,以防止重复处理。 DLQ 表设计用于高效查询,并在状态、重试时间和事件类型上设置索引。`retry_count` 和 `retry_after` 字段可以防止在故障期间进行激进的重试。成功的重试会将事件状态更新为“SUCCEEDED”。 这种方法将故障处理从破坏性转变为可预测性,使工程师能够轻松检查、调试和重新处理事件。Kafka 继续处理高吞吐量摄取,而 PostgreSQL 在持久性和可观察性方面表现出色。最终,将 PostgreSQL 视为 DLQ 创建了一个具有弹性和易于操作的管道,使故障成为系统可管理的组成部分。

## PostgreSQL 作为死信队列:摘要 这次 Hacker News 的讨论集中在使用 PostgreSQL 作为事件驱动系统的死信队列 (DLQ)。核心思想,在链接的博客文章中有详细说明,建议利用 PostgreSQL 的特性——例如 `FOR UPDATE SKIP LOCKED`——创建一个简单、持久且可查询的队列,而无需引入额外的基础设施。 许多评论者认为,对于每天处理少于几亿事件的业务应用程序来说,这是一种实用的默认方案,它具有动态优先级调整和易于队列检查等优点。然而,也存在对可扩展性和故障进程可能压垮 DLQ 的担忧,因此需要断路器或速率限制。 这场辩论凸显了简单性和健壮性之间的权衡。虽然专门的队列系统(如 Kafka)提供更高的可扩展性,但 PostgreSQL 可以作为一个可行的起点,尤其是在团队已经管理 PostgreSQL 实例的情况下。讨论强调了监控 DLQ 数量的重要性,因为持续的高数量表明上游存在问题,而不是架构缺陷。最终,选择取决于特定应用程序的规模和需求。

更多

联系我们 contact @ memedata.com