每日HackerNews RSS

物理智能公司推出了一种名为实时分块(RTC)的新型算法,该算法解决了机器人视觉-语言-动作(VLA)模型推理速度慢的难题。与聊天机器人不同,机器人需要实时响应,而VLA模型的延迟会导致性能问题。 RTC通过允许模型在执行当前动作的同时规划未来动作来实现异步执行。它将实时分块定义为一个图像修复问题,从而解决了在动作块之间切换时出现的间断性问题,通过“冻结”前一个块中的动作来确保一致性。 测试表明,RTC显著加快了执行速度并提高了精度,尤其是在需要精细动作的任务中,例如点燃火柴或插入电缆。值得注意的是,RTC对高推理延迟(超过300毫秒)表现出鲁棒性,而高延迟是大型模型或远程推理的常见问题。RTC为实时VLA推理提供了一种简单有效的策略,随着模型的发展,它可以支持更复杂的实时系统。

作者在评论中强烈批评了Wayland——一个开源显示协议——作为Xorg的“现代替代品”的强制采用,认为其功能远不如Xorg。文章指出Wayland缺乏远程桌面、辅助功能和对遗留软件的支持等关键功能,阻碍了重要的使用场景。作者认为这是一种用功能较差的“现代”版本替换功能正常的软件的模式,并以微软的Skype和Windows设置为例。作者批评了GNOME大力支持Wayland并强制淘汰X11的做法,限制了用户的选择权。作者对Xorg的衍生项目Xlibre表示兴奋,认为其目标是使现有可靠的系统现代化,而不是强迫用户使用像Wayland这样有缺陷且不完整的解决方案。虽然作者反对不必要的代码分叉,但认为Xlibre是一个必要的替代方案,并有可能优于Wayland。作者希望Xlibre能够提供一个完整且稳定的解决方案。

TankerTrackers.com 通过油轮追踪、政府统计数据、EIA预测和卫星图像,绘制出一幅全面的“石油画像”,从而深入了解往往不透明的全球石油市场。其关键在于分析石油库存变化,利用Planet公司每日更新的卫星数据,对报告的产量和出口数据进行视觉验证,尤其针对那些石油活动缺乏透明度的国家。 这一过程包括利用谷歌地球建立参考点来测量油罐直径。油罐高度则通过石油公司的公开信息或图像分析确定,即通过侧面照片测量尺寸。油罐的储油量是通过分析阴影来估算的:油罐北侧的阴影指示油罐的总高度,而油罐内部的阴影则显示浮顶的深度(以及油罐的满油程度)。通过比较一段时间内的卫星图像,TankerTrackers.com 能够识别出库存波动,并将此数据与油轮运输情况交叉比对,从而判断石油是否正在被炼制或转移,最终更深入地了解全球石油趋势。

Hacker News上的一篇讨论围绕着利用卫星图像计算石油储罐占用率的文章展开。 一位评论员对人们使用电子表格进行图像测量表示惊讶,这解释了为什么一些人认为AI是一种潜在的更好(尽管有缺陷)的替代方案。其他人证实这项技术已经存在多年,一些人甚至将其应用于谷物仓储量的估算。 人们对这项技术的实际应用和盈利能力提出了疑问,提到了Orbital Insights的挣扎和Ursa Space Systems持续的服务。讨论还涉及浮顶罐的机械原理、其密封机制和消防系统。最后,简要地提到了冷战时期分析卫星图像上的板条箱以确定其内容物的“板条箱学家”。

高效的LLM智能体不需要复杂的框架。更简单、可组合的模式,专注于通过检索、工具和记忆来增强LLM,更易成功。智能系统分为工作流(预定义代码路径)和智能体(动态决策)。 工作流包括提示链、路由、并行化(分段或投票)、协调器-工作器和评估器-优化器。智能体最适合于步骤数量不可预测且需要信任LLM决策的开放式任务。智能体成功的关键在于清晰的工具集和详尽的文档,需要投资于智能体-计算机接口(ACI)。 虽然框架可以加快初始开发速度,但要理解底层代码以避免额外的抽象和复杂性。通过明确显示规划步骤来优先考虑透明度。从简入手,评估结果,只有在改进结果时才增加复杂性。关注可维护性和用户信任。

这篇Hacker News帖子讨论了Anthropic关于“构建有效的AI智能体”的文章,该文章将智能体定义为动态地指挥其流程和工具使用的LLM。Simonw强调了文章中智能体和工作流的区别,并链接了他关于这篇文章和Anthropic多智能体研究系统的笔记。 评论者们就Anthropic对工作流的定义的准确性展开了辩论,一些人认为现代工作流是动态的,类似于智能体。另一些人强调,区别在于“预设路径”的程度,工作流比自由形式的智能体具有更多结构。讨论还涵盖了多智能体系统的实际挑战,包括成本、控制以及模型能力与多个智能体需求之间的权衡。 一个关键点是从小处着手的重要性,使用直接的LLM API调用而不是复杂框架,因为复杂框架可能会掩盖提示并阻碍调试。讨论还涉及并发性、任务队列和工具的使用,一些人建议为工具调用生成代码,并为长期存在的智能体生态系统提出潜在的去中心化架构。最终,这篇帖子探讨了AI智能体开发的实际问题和未来方向。

Threads正在推出重要的联邦宇宙(fediverse)整合功能,包括一个专门用于显示来自Mastodon和Flipboard等平台内容的Feed。这个新的Feed位于“关注”Feed的顶部,按时间逆序显示帖子,不进行算法排序或Threads的内容审核。Meta将此视为一个独立的空间,类似于RSS阅读器,面向希望在一个专用区域查看来自各种在线资源内容的用户。 用户现在也可以直接在Threads中搜索联邦宇宙用户,简化了发现过程。虽然这是Threads中最大的联邦宇宙整合,但ActivityPub仍然是独立的。用户必须选择加入共享,连接单独的账户,并在专用Feed中查看联邦宇宙内容。Meta承认需要教育用户了解联邦宇宙,并解释了这些功能的逐步推出。尽管面临挑战,Meta仍然致力于连接Threads和联邦宇宙,即使最终的整合方式仍不明确。

Hacker News 讨论了 Threads 向信息流添加 Fediverse 内容。一个关键特性是非算法的、反时间顺序的信息流,被视为远离超优化信息流的积极一步。 人们担心 Meta 可能会采取“拥抱、扩展、消灭”(embrace, extend, extinguish)策略,旨在通过独特的特性主导 Fediverse 客户端,从而可能扼杀其他项目。文章提到了 Google 和 RSS、Slack 和 IRC 以及 Apple 和短信的例子。一些人认为 Meta 可能会优先在其“中立”信息流中显示 Threads 内容。 另一些人则为这一举动辩护,强调数百万用户能够访问非算法内容的好处。讨论还涉及开放协议和竞争的性质。它还提出了一个问题:Fediverse 是否能够颠覆拥有自己独特文化的社区?Mastodon 实例管理员和个人用户可以屏蔽其他实例。人们担心 Meta 可能会利用 Fediverse 数据训练 AI,从而引发版权问题。一些人建议使用向商业平台收取内容使用费的许可证。

AMD的CDNA 4架构,其代表作是MI355X GPU,在CDNA 3设计的基础上进行了改进,重点提升了机器学习中的矩阵乘法性能。虽然仍然采用类似的chiplet架构,但CDNA 4略微减少了每个XCD的CU数量,但却通过更高的时钟速度来补偿。这使得MI355X能够更有效地与英伟达的B200在机器学习工作负载方面竞争,在某些情况下,每CU的矩阵吞吐量提升了一倍。 AMD在向量运算和更高精度数据类型方面仍然保持优势。MI355X通过HBM3E增强了内存子系统,与前代产品和B200相比,带宽和容量都有所提高。更大的本地数据共享(LDS)和改进的数据移动指令进一步优化了性能。 虽然英伟达的Blackwell在每个SM的片上缓存/共享内存分配方面更大,但AMD通过更高的整体CU数量来弥补。CDNA 4代表了对CDNA 3的战略改进,优先考虑效率以及针对机器学习和高性能计算的定向改进。

AMD的CDNA 4架构专注于加速AI中的小型矩阵运算,其特点是增强的本地数据共享(LDS)以提高线程性能。LDS的大小显著增加,写入吞吐量和数据转置能力也得到提升。 业界翘首以盼统一的UDNA架构,它可能融合计算和Radeon的功能,但其可扩展性仍存在不确定性。AMD的MI300芯片在推理领域获得越来越多的关注,Meta和OpenAI等大型公司都进行了大规模采购,即将推出的MI400也前景光明。 一个关键问题是AMD的软件堆栈,人们普遍认为它落后于Nvidia,尽管AMD正在改进软件和工具,并增加了软件方面的招聘。用户报告了ROCm易用性的进步,例如可以直接编译llama.cpp。AMD还参与了Ultra Ethernet网络技术,作为Infiniband的替代方案。对于使用FP64的高性能计算,最好等待MI430。

这篇博文探讨了图结构数据的时序预测,利用现实世界数据集中(通常存储在关系数据库中)数据之间相互关联的特性。提出的端到端流程利用图Transformer来预测图中特定节点的时序,从整个图结构中提取信号,而这些信号可以使用关系深度学习 (RDL) 从关系数据库中自动提取。 核心框架根据过去的时序数据、日期时间编码、日历特征和图实体编码进行预测,后者通过图Transformer或图神经网络获得。它强调了捕捉时间和关系依赖性的重要性。 博文还比较了传统的基于回归的预测方法和使用条件扩散模型的生成方法。虽然回归的目标是点预测,并且存在均值坍塌的问题,但生成模型可以生成未来值的分布,从而实现概率推理,捕捉高频细节,并在无需对数据分布进行先验假设的情况下量化不确定性。博文展示了与基线方法相比有前景的初步结果。

Hacker News上的一篇帖子讨论了Kumo.ai的博文“使用图神经网络进行时间序列预测”。 cye131批评了这种方法,认为图神经网络不适合时间序列预测,并且这家初创公司在推广其销售的技术时存在利益冲突。rusty1s,这篇论文的作者之一,澄清说该模型关注的是通过将历史数据与以图结构组织的外部信息相结合来丰富预测,而不是仅仅依赖于图神经网络。他们强调了模块化架构和学术同行评审。 其他用户讨论了Facebook Prophet作为基准的实用性,一些人称赞它处理季节性的能力,另一些人则推荐其他方法,如L1正则化自回归特征。也有人批评该网站具有侵入性的滚动行为。 最后,一个用户质疑这项技术在股市上赚取数十亿美元的潜力,而另一个用户认为其价值在于简化ETL、特征工程和模型设计流程,潜在地减少了企业的劳动力需求。

特斯拉计划在德克萨斯州奥斯汀市推出机器人出租车服务,但此举因可能将表面光鲜置于安全之上而受到批评,人们对其准备程度表示担忧。埃隆·马斯克多次未能实现完全自动驾驶的最后期限,这与Waymo已建立的自动驾驶叫车服务形成鲜明对比。特斯拉的机器人出租车计划涉及奥斯汀市的一个地理围栏区域、远程操控和有限的交叉路口,这与之前承诺的适用于所有特斯拉车辆的无人监督自动驾驶大相径庭。由于缺乏安全驾驶员的测试以及用于宣传该技术的经过操纵的图像,担忧情绪加剧。众包数据表明,在没有驾驶员干预的情况下,发生事故的风险很高,而特斯拉正在努力阻止公布碰撞数据。批评人士担心,马斯克渴望在自动驾驶竞赛中“获胜”的愿望,正在促使特斯拉在真正做好准备之前就推出可能存在危险的服务,尽管存在安全隐患和测试不足的问题。

Hacker News 上的一条讨论线程关注特斯拉即将推出的机器人出租车服务,重点讨论了安全问题以及特斯拉纯视觉方案与 Waymo 基于激光雷达的方案的可行性。一位持有大量特斯拉看跌期权的用户表达了强烈怀疑,他引用了特斯拉销量暴跌和 FSD(完全自动驾驶)系统不足的证据。评论者们就特斯拉能否兑现承诺展开了辩论,一些人强调了特斯拉“移动目标”的历史以及潜在的责任问题。其他人指出特斯拉股价的不理性,认为这是由“狂热”追随者推动的,并质疑马斯克的动机。几位用户分享了他们使用 FSD 的经验,指出了其在恶劣天气条件下的局限性。讨论对比了特斯拉海量训练数据与 Waymo 更高质量的多传感器数据,暗示 Waymo 的方案更胜一筹。人们还担心数据保真度、特斯拉不同车型间的硬件差异以及在没有先进模拟能力的情况下进行严格测试的难度。

作者偶然发现qBittorrent中大量失效的Tracker,其中包括open.demonii.si。出于对潜在流量的好奇,作者购买了该域名,并在VPS上使用opentracker搭建了一个简单的种子追踪器。甚至在Tracker启动之前,1337端口就收到了大量流量。一小时后,Tracker处理的流量激增,峰值达到170万个种子和310万个节点。统计数据显示大量的连接活动、announce请求和scrape请求。这表明仍有大量的BT客户端指向这个失效的Tracker。随后,作者思考了托管一个无意中服务合法和版权材料的Tracker的法律风险。意识到潜在的风险,特别是考虑到是用信用卡购买的域名,作者迅速关闭了服务器并释放了域名,建议将其作为公共服务供其他人使用。

一个Hacker News的帖子讨论了复活一个已死的种子追踪器(torrent tracker)的合法性和影响。原文详细描述了作者获得一个以前用作种子追踪器的已失效域名,并观察到数百万个对等节点仍在尝试连接的经历。 评论者们争论运行这样的追踪器是否构成协助侵犯版权,引用了美国法律和“恶意”(mens rea,意图)的重要性。一些人认为“内容中立”的追踪器是合法的,另一些人则强调了无论合法与否,版权持有者提起诉讼的风险。潜在的法律骚扰的寒蝉效应也被讨论到。 该帖子进一步探讨了由于恶意追踪器数据而导致的种子客户端中的潜在安全漏洞。它还涉及到使用复活的追踪器进行DDoS攻击或作为FBI蜜罐的可能性。提到了替代的去中心化追踪方法,例如DHT,以及对种子搜索引擎的潜在影响。最后,谈话涉及到当今的盗版问题,即对用户的风险是否高于对追踪器运营者的风险,以及当如此多的媒体内容可以免费流媒体播放时,种子下载的吸引力是否下降。

奥斯瓦尔德幸运兔,由沃尔特·迪士尼和乌布·艾沃克斯于1927年为环球影业创作,在迪士尼于1928年失去其版权并创作米奇老鼠之前,曾是一位受欢迎的卡通明星。2006年,迪士尼通过与NBC环球交易体育评论员阿尔·迈克尔斯,重新获得了奥斯瓦尔德的版权。奥斯瓦尔德回归迪士尼后,出现在《艾匹克米奇》等电子游戏中,在游戏中他与被抛弃感和对米奇的嫉妒感作斗争。 迪士尼强调奥斯瓦尔德的个性,旨在将他塑造为一个独特且易于产生共鸣的角色。尽管几十年来未出现在动画中,奥斯瓦尔德在2013年的短片《Get a Horse!》和《Once Upon a Studio》中再次出现。2023年,一些奥斯瓦尔德的原创短片进入公共领域,导致了新的项目,例如即将上映的恐怖电影《奥斯瓦尔德:兔子洞》。他也是迪士尼无限2.0中的一个城镇居民。2022年,奥斯瓦尔德出现在迪士尼制作的一部新的短片中。尽管过去曾被忽视,奥斯瓦尔德却获得了新的欢迎,通过游戏、商品和主题公园的露面吸引了新一代观众。

更多

联系我们 contact @ memedata.com