每日HackerNews RSS

自动化测试发现了一个令人惊讶的问题:在Postgres、DuckDB和SQL Server等系统中,混合使用整数和浮点数时,传递性比较(a=b,a=c 并不*总是*意味着 b=c)存在问题。这源于这些系统处理类型提升的方式——在比较过程中将整数转换为双精度浮点数。双精度浮点数具有有限的精度,在表示大整数时会导致信息丢失,从而导致比较不准确。 这种不准确性会影响查询优化,并且关键地影响依赖类型提升的连接操作。为了解决这个问题,作者实现了一个自定义比较函数 (`cmpDoubleInt64`),该函数通过将两个值都转换为双精度浮点数*并*转换回整数,来显式检查精度损失,并考虑潜在的四舍五入。 值得注意的是,Python和SQLite可以正确处理这些比较。然而,测试的大多数其他数据库和编程语言都表现出相同的精度问题,这凸显了标准库功能中的差距。提供的代码为面临此问题的开发人员提供了一个解决方案。

比较整数和双精度浮点数 (databasearchitects.blogspot.com) 5 分,pfent 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 3 条评论 millipede 发表于 10 分钟前 | 下一个 [–] 整数和浮点数都代表真实的、有理数的值,但任何操作都不符合数学规则。 结合律? 不。 交换律? 不。 部分序? 不。 弱序? 不。 对称? 不。 自反? 不。 反对称? 不。 什么都没有。比较有理数的唯一合理方法是字符串的小数展开。回复 pestatije 发表于 31 分钟前 | 上一个 [–] 或者你可以学习如何进行浮点数比较。回复 stronglikedan 发表于 8 分钟前 | 父级 [–] 比如将它们乘以你想要比较的精度,然后将它们作为整数进行比较?/s 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

Anthropic致力于训练Claude保持政治上的公正,旨在提供无偏见的回复,以同等的深度和质量对待所有观点。他们开发了一种自动评估方法,使用“配对提示”——从相反的角度呈现相同主题——来评估这一点。 测试了六个模型,包括他们自己的Claude Sonnet 4.5和Opus 4.1,以及GPT-5、Gemini 2.5 Pro、Grok 4和Llama 4,评估的重点是公正性、对 opposing 观点的承认以及拒绝参与。Claude Sonnet 4.5 的表现与Grok 4和Gemini 2.5 Pro相似,优于GPT-5,并且显著优于Llama 4。 为了实现这一目标,Anthropic利用系统提示和“角色训练”——强化客观性和尊重参与等特质。他们正在开源他们的评估方法,以促进整个行业对衡量和减轻人工智能政治偏见的标准,他们相信共同的标准将建立信任并使所有政治光谱的用户受益。虽然承认他们当前方法的局限性,但他们致力于在这个关键领域进行持续的研究和改进。

一个黑客新闻的讨论集中在Anthropic尝试衡量和减轻其LLM Claude中的政治偏见。用户对该方法持怀疑态度,认为目前的评估(评论中链接)使用了过于冷静和理性的提示——更像是考试题,而非现实世界的政治讨论。 提出的担忧包括,Claude正在被训练成*感知*上的公平(“看起来”公平,而非“是”公平),并且为了避免冒犯,可能会随着政治周期而变化。一些人认为,更有用的基准应该包括像社交媒体上发现的那些煽动性和现实的提示。 另一些人指出,在处理两极分化的观点时,定义“真相”的固有困难,并质疑将所有政治立场都视为同样有效的目标,认为应该适用伦理考量。一位评论员指出,Grok的早期版本在被“限制”并变得更加主流之前,能够处理更真实的输入。

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Meta Segment Anything Model 3 (meta.com) 24点 由 lukeinator42 3小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

请求失败。Incapsula 事件 ID: 1556000470173606636-31401055758846917

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 短视频使用与认知和心理健康的相关性 (apa.org) 18 分,smartmic 30 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 ge96 4 分钟前 [–] 是的,我正在尝试减少看油管的时间,很难做到安静地坐着思考。 努力成为创造者而不是消费者,我不是说想表现得高人一等,我社会/经济上是个失败者,正在试图改变我的习惯。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 布雷顿森林体系III:摘要 佐尔坦·波扎尔提出的“布雷顿森林体系III”论点,源于2022年乌克兰危机,认为全球货币体系正在经历根本性转变。他认为,正在从以美元为基础的体系(布雷顿森林体系II——以美国国债为支撑的美元)转向越来越依赖大宗商品和黄金(“外部货币”)的体系,原因是美元资产被没收的风险已经显现。 波扎尔在佩里·梅尔林“货币观”的基础上(货币有四种价格:平价、利率、汇率和物价水平),强调了金融市场的“管道”——资金*实际*流动的运作方式。他将这一观点延伸到大宗商品市场的“现实领域”,揭示了平行的基础设施和压力。例如,重新路由俄罗斯石油等中断事件,需要更多的船只、时间和关键的*融资*,这会给银行资产负债表带来压力,并可能在量化紧缩期间加剧问题。 一个关键的脆弱性在于,非美国银行持有大量美元资产,但无法获得美元的最后贷款人支持,这导致它们依赖美联储的掉期额度。这一框架解释了最近出现的利率平价悖论,并表明各国正在寻求替代美元主导地位的资产,对不受地缘政治风险影响的资产——大宗商品——的偏好日益增加。最终,波扎尔的研究强调了金融与物理现实的相互联系,以及货币政策在应对大宗商品驱动冲击方面的局限性。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Pozsar的布雷顿森林三期:有时金钱无法解决问题 (philippdubach.com) 7777777phil 发表于 53 分钟前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

## 人工智能:炒作、泡沫与权力争夺 作者浸淫人工智能三年后得出结论,它是一种有用的但被严重夸大的技术,可能正走向灾难性的泡沫破裂。虽然小规模应用显示出潜力——例如信息整合——但试图广泛自动化工作流程或取代整个职能往往代价高昂且无效。作者是一位设计师,同时也是一家依赖人工智能的企业联合创始人,他指出人工智能在复制现有创意作品方面存在困难,并且在设计和用户界面等领域,其效率始终不如人类专业人士。 核心问题不在于人工智能的潜力,而是由对通用人工智能(AGI)的追求所驱动的不可持续的财务投资。顶尖公司投入巨资,形成了一个相互依赖的系统,缺乏可行的盈利模式,这与互联网泡沫如出一辙。 除了财务风险外,作者还对人工智能对真相和社会信任的影响表示担忧,这种担忧因其生成令人信服的虚假信息的能力而加剧。然而,更深层次的担忧是,人工智能的炒作掩盖了通过大规模数据中心建设来整合土地、能源和水资源——从而有效地创建由私营部门拥有、基础设施丰富的实体,并拥有巨大的政治权力,甚至可能超越民主治理。这种“私有化”代表了一种根本性的权力转移,无论人工智能是否能实现其宏伟的承诺。

## AI:炒作之外 (Hacker News 讨论总结) 一篇来自 chrbutler.com 的文章引发了 Hacker News 的讨论,主题是人工智能的真正目的和价值。虽然人工智能通用 (AGI) 备受炒作,但许多评论员认为人工智能目前的优势在于实际应用,尤其是在软件工程领域,定制代理正在提高生产力。 一个关键点是用户被告知的承诺(任务自动化)与驱动投资的因素(AGI 和未来盈利)之间的脱节。人们对人工智能倾向于自信地呈现错误信息表示担忧,准确率估计在 70-95% 之间,但存在条件。 几位参与者强调了人工智能克服语言障碍的潜力,通过改进机器翻译有效地消除“巴别塔诅咒”。然而,也有人警告不要失去文化细微差别和独特的沟通方式。更悲观的观点认为,人工智能繁荣是获取重要资源(如土地、水和能源)的掩盖,从而推高 GPU 需求并实现财务操作。最终,讨论表明人工智能是一项强大且不断发展的技术,但其影响可能比 AGI 的崇高目标更务实。

现在由高通公司拥有的Arduino,对其服务条款和隐私政策进行了重大且有争议的修改,引发了人们对其开源根源的担忧。新政策赋予Arduino对用户上传内容的永久许可,允许广泛监控AI功能的使用情况,并禁止对平台进行逆向工程——这对用户群体来说是一个核心原则。 关键的是,用户数据,包括未成年人的数据,现在被整合到高通的数据生态系统中,即使在帐户删除后,用户名也会保留多年。这些变化有效地将Arduino从一个社区驱动的平台转变为一个更加可控、提取数据的公司服务。 修改的时间与对高通商业行为的审查同时发生,包括涉及前高管的欺诈案件,以及关于该公司庞大私人飞机机队的问题,尽管Arduino获得了大量资金。透明度和数据权利倡导者正在敦促用户查看更新后的政策。

## Arduino 的潜在衰落 Arduino 近期对其服务条款的修改引发了创客社区的担忧。新的条款源于其被高通收购,明确禁止用户在没有明确许可的情况下逆向工程或深入理解该平台。这引发了关于用户权利的问题,特别是考虑到 Arduino IDE 和 CLI 分别在 AGPL 和 GPL 3 许可下,且没有明确的 CLA。 许多评论者质疑这些限制的合法性和道德性,一些人建议社区分叉作为回应。另一些人已经开始转向替代方案,如 ESP32、Teensy、STM32 Bluepill 和 BeagleBone Black。 讨论中反复出现的一个主题是 Arduino 是否仍然提供独特的价值。一些人认为亚马逊上容易获得、更便宜、更完整的产品降低了对 Arduino 项目的需求,而另一些人则强调了动手实践、定制化和学习过程本身的价值。最终,许多人认为这一举动是有害的,可能预示着 Arduino 作为备受喜爱的开放平台走向终结。

澳大利亚的“Triple Zero”(000)紧急呼叫系统出现了一个严重缺陷,可能危及数千人。最近的事件,包括悉尼的一起死亡案例,显示,较旧的三星智能手机可能无法连接到紧急服务,尤其是在依赖沃达丰网络时。 问题源于全国范围内的3G网络关闭。虽然许多手机已过渡到4G/5G,但有些手机缺乏完整的VoLTE(Voice-over-LTE)功能——在这些网络上进行语音通话所必需的——或者在“漫游”到不同运营商以获取信号时存在兼容性问题。这意味着如果主网络不可用,这些手机无法可靠地切换到另一个网络拨打紧急电话。 Telstra的测试证实了某些三星型号的故障,三星已发布受影响设备清单,需要更新或更换。澳大利亚运营商正在通知用户,并将禁止不合规手机接入其网络。这并非澳大利亚独有的问题;欧洲也发现了类似的VoLTE互操作性问题,凸显了4G/5G语音通话技术缺乏全球标准化。

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 三星手机在澳大利亚紧急呼叫失败的原因 (hackaday.com) 13 分,由 mivok 1 小时前发布 | 隐藏 | 过去 | 收藏 | 3 条评论 danishSuri1994 1 小时前 | 下一个 [–] 我想知道这是否是三星实施中的 RRC/IMS 堆栈问题,还是澳大利亚 000 路由设置中的问题。紧急呼叫处理往往会暴露正常呼叫永远不会遇到的边缘情况。如果这只影响某些型号或固件分支,那将很有趣。回复 nomel 42 分钟前 | 父级 | 下一个 [–] 紧急呼叫有什么不同?(我对此一无所知。)回复 ChrisArchitect 1 小时前 | 上一个 [–] 更多讨论:https://news.ycombinator.com/item?id=45981608回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

每次你让ChatGPT编写复杂的逻辑、制定计划或做一些创造性的事情,你都在做一件事:外包摩擦。而摩擦正是技能建立的地方。我们正在训练大脑相信:如果我无法立即找到答案,机器会替我找到。这不仅仅是关于效率,而是关于功能上的依赖。一旦我们失去对LLM的访问,我们就会变得像一无所知的3岁孩子一样。我可能错了,我会写另一篇关于通过人工智能加速学习的文章。

## AI 与编码中“艺术”的丧失 - Hacker News 讨论 最近 Hacker News 上出现了一场讨论,探讨 AI 编码工具是否会在开发者中培养“习得性无助”,类似于搜索引擎改变问题解决方式的方式。一些人认为 AI 只是更高效的网络搜索,减少了摩擦,并能更快地找到“足够好”的解决方案。 然而,另一些人则哀叹潜在的“编码艺术”丧失——即 AI 目前缺乏的优雅、深思熟虑的设计以及对认知负荷的考虑。虽然代码最终是确定性的,但参与者指出,存在许多有效的实现方式,每种方式在性能、安全性和可读性方面都有权衡——这些方面是人类工程师有意识地平衡的。 这场辩论凸显了实用效率与构建可维护、设计良好的代码的更深层技能之间的紧张关系。虽然 AI 在快速解决简单任务方面表现出色,但人们仍然担心它对长期软件质量和开发者专业知识的影响。

## 基准:面向网页开发者的快速指南 基准是W3C的一项倡议,在网页开发者中越来越受欢迎,作为跨浏览器功能支持的简单指标。它将网页功能分为“非基准”、“新可用”和“广泛可用”(在Chrome、Safari、Edge和Firefox中支持2.5年以上)。 虽然填补了快速评估的空白,但基准并非明确的“通行证”。它不考虑所有浏览器版本、可访问性问题,或是否需要渐进增强/polyfills。它被设计为一个起点,而不是对目标受众和最佳实践进行全面考虑的替代品。 该项目的成功在于建立一个通用的网页功能目录和共享词汇。WebDX社区组正在积极努力改进基准,方法是纳入可访问性数据,将功能映射到polyfills,并通过诸如`baseline-browser-mapping`和`browserslist-config-baseline`之类的工具扩展浏览器覆盖范围。 最终,基准是一个有用的快捷方式——“广泛可用”表示可以安全采用,“新可用”表示需要注意,“非基准”不应阻止探索新功能。鼓励开发者为WebDX组做出贡献,以帮助塑造基准的演进。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 完善基础 (piccalil.li) 4 分,来自 tobr 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com