每日HackerNews RSS

## 可复现构建:计算机科学 vs. 工程视角 编译器(现在包括LLM)*必须*是确定性的问题,既有理论答案,也有实践答案。从计算机科学的角度来看,编译器*应该*是确定性的——相同的输入产生相同的输出。然而,在现实世界的工程中,实现这一点非常困难。 构建输出受多种因素影响,不仅仅是源代码,还包括编译器版本、系统环境、时间戳,甚至硬件调度。这些“噪声”元素会导致构建漂移,这是在2000年代内核补丁工作中深刻体会到的教训。 虽然编译器旨在保持*语义*等价性(相同的行为,不一定是相同的代码),但真正可复现的构建需要深思熟虑的工程:冻结工具链、控制环境和仔细剥离元数据。像Debian可复现构建项目这样的努力表明这是可以实现的,从而产生可重复、可验证和封闭的构建。 将此应用于LLM,工程方法占主导地位。虽然不能保证完全的确定性,但控制输入、使用测试验证输出以及使用可复现的流水线至关重要。就像传统软件一样,一个“概率系统”在采取适当的保障措施后,仍然可以提供在操作上更好的结果。

``` %PDF-1.4 % âãÏÓ 4 0 obj > /PageLabels > ] >> /Outlines 2 0 R /Pages 1 0 R >> endobj 5 0 obj ```

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 声明式的,探究式的,然后是命令式的 (2017) [pdf] (forth.org) 3点 由 tosh 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 艾丽亚传说:N64上的纳米GPT 《艾丽亚传说》是一款突破性的N64自制游戏,主角是索菲亚·艾丽亚,一个在主机原始1996年硬件(93 MHz VR4300 MIPS CPU)上*完全*运行的字符级语言模型(纳米GPT),无需云连接。这是首个已知在N64上执行实时推理的神经语言模型。 该模型受限于可打印的ASCII字符,并由于N64缺乏功能性FPU,仅使用Q8.7定点算术,拥有232KB权重文件内的427,264个参数。它包含2个Transformer块,128维的嵌入,以及32个token的上下文窗口。 索菲亚的训练语料库包含她的身份、*时光之笛*的背景故事、关于Elyan Labs(开发者)的细节、N64架构,甚至是对其执行环境的自我意识。 Elyan Labs旨在突破复古AI的界限,未来的开发包括RSP加速,以实现潜在的4-8倍加速。该项目展示了老旧硬件的惊人能力,并且是对定点计算创新的证明。

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交登录 祝塞尔达40周年,首个在N64硬件上运行的LLM(4MB内存,93MHz)(github.com/sophiaeagent-beep) 4点 由AutoJanitor 1小时前 | 隐藏 | 过去 | 收藏 | 4评论 帮助 mlaux 0分钟前 | 下一个 [–] 我尝试构建这个,但是缺少weights.bin文件,而且我的电脑太弱无法生成它。你能把它添加到仓库吗?回复 AutoJanitor 9分钟前 | 上一个 | 下一个 [–] 是的,它可以在模拟器上运行。我正在修复LLM输出的字节序文本问题。惊喜即将到来。祝塞尔达40周年!回复 great_psy 19分钟前 | 上一个 | 下一个 [–] 有没有地方可以在不加载到N64上就测试LLM输出的?好奇在这些限制下我们能得到什么。回复 shomp 16分钟前 | 上一个 [–] 很酷,有没有演示视频?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 使用符号执行寻找forall-exists超漏洞 (acm.org) 6点 由 todsacerdoti 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

该项目展示了一个高效的C++/CUDA LLM推理引擎,旨在在消费级硬件(例如,配备24GB VRAM的RTX 3090)上运行大型语言模型,如Llama 70B。它通过创新的层流式传输技术实现这一点,利用PCIe带宽和可选的NVMe直接I/O来绕过CPU。 该引擎采用三层自适应缓存系统——驻VRAM层、固定RAM和NVMe/mmap回退,其大小根据可用硬件自动调整。这使得70B模型的速度比基线方法快33倍。一个关键特性是`gpu-nvme-direct`后端,它能够直接将NVMe读取内容导入GPU内存,从而消除了CPU瓶颈。 该引擎支持GGUF模型格式,具有各种量化级别(Q4_0、Q8_0等),并利用自定义CUDA内核。它专为Linux(Ubuntu 6.17+)设计,需要CUDA Toolkit 13.1,并采用BSD-2-Clause许可证。未来的开发重点是高级量化、新型架构和优化。

一位开发者在Hacker News分享了一个项目,展示了在单个RTX 3090 GPU上运行大型语言模型Llama 3.1 70B的能力,**完全绕过CPU和RAM**,直接从NVMe存储访问数据。最初的灵感来自于一个关于复古游戏和高效模型加载的问题。 虽然可行,但目前的性能仅限于大约每秒0.2个token。评论员指出,这个速度不适合交互式使用,建议使用更小、量化的模型可能提供更好的速度和质量平衡。 讨论的重点是这种方法是否真正优化——一些人质疑报告的计算瓶颈——以及它的主要好处在于具有有限RAM的系统。DirectX的直接到GPU的资源加载能力也被提及为一种潜在的替代方案。该项目的代码可在GitHub上找到。

## 密码管理器:并非像你认为的那么安全 大多数网络用户需要管理数百个密码,这使得密码管理器——一种在主密码后面存储凭据的工具——变得非常流行。虽然它们提供了便利性和跨设备的可访问性,但苏黎世联邦理工学院的研究表明,领先的提供商(如Bitwarden、LastPass和Dashlane)存在显著的安全漏洞,这些提供商总共服务于6000万用户。 该研究展示了多次成功的攻击,通过日常操作(如登录或同步数据)获取甚至修改了用户密码。尽管供应商声称采用“零知识加密”——这意味着他们不应访问用户数据——但该研究发现漏洞允许完全破坏保险库。 这些弱点源于为用户友好性设计的复杂代码(如密码恢复和共享),这无意中扩大了攻击面。供应商不愿使用现代密码学更新系统,担心现有用户的数据丢失,通常依赖过时的安全措施。 研究人员建议选择具有透明度、外部审计和默认端到端加密的密码管理器。关键要点是:用户应该意识到当前的安全并非万无一失,并且供应商需要优先考虑强大的安全性而非便利性。

## 密码管理器安全问题 近期一项研究(ethz.ch)指出,流行的基于云的密码管理器(如Bitwarden、LastPass和Dashlane)存在安全漏洞,尽管它们声称具有“零知识加密”。研究人员演示了针对Bitwarden的12次攻击,针对LastPass的7次攻击,以及针对Dashlane的6次攻击,攻击范围从针对性的保险库泄露到完整的组织安全漏洞。 核心问题在于恶意服务器可能在密钥交换过程中破坏保险库。虽然攻击需要完全控制服务器,但评论员指出这并非不可能发生。1Password发布了回应,解决了这些担忧,并且有人认为其更大的市场份额并未产生类似的报告。 许多用户提倡使用离线解决方案,如KeePass(和KeePassXC),以获得更大的控制权和安全性,但承认对于不太懂技术的用户来说存在易用性挑战。讨论强调了便利性和安全性之间的权衡,一些人更喜欢自托管解决方案或加密的本地文件。

尽管人工智能编码代理在跨平台原生代码生成方面取得了进展,但许多应用程序——即使是来自Anthropic的Claude等人工智能领导者的应用程序——仍然依赖Electron。Electron允许开发者使用Web技术(HTML、CSS、JavaScript)构建适用于多种操作系统的桌面应用程序,虽然这会带来便利,但会导致应用程序体积更大、速度更慢。 核心问题不在于*创建*代码,而在于完善和*维护*代码。编码代理擅长开发过程的最初90%,但在边缘情况、错误修复以及实际使用所需的持续支持方面却面临困难。为每个平台(Mac、Windows、Linux)开发原生应用程序会将支持负担和平台特定问题的可能性增加三倍,而Electron的共享代码库可以减轻这种风险。 虽然明确的规范和测试套件*可能*能够实现代理驱动的原生开发,但“最后一步”的复杂性和增加的维护成本目前超过了收益,使得Electron成为许多开发者的务实选择。

## Claude 与 AI 编程工具现状 - Hacker News 总结 Hacker News 上的一场讨论集中在 Claude 的一个令人困惑的决定:尽管 Claude 声称能够轻松生成代码,但它被构建为一个 Electron 应用。用户质疑,一个吹嘘代码生成能力的工具为什么没有原生支持所有平台,特别是 Windows 和 Linux。 许多评论者对 Claude 和 Copilot 等工具的性能和错误表示沮丧。一些人强调了 Claude 的桌面应用和 IntelliJ 插件存在的问题,指出它们通常感觉开发不足。一个反复出现的主题是,尽管 AI 驱动的编程备受炒作,但目前的现实离无缝体验还很远,仍然需要大量的调试和质量保证。 对话涉及 AI 开发的成本(token、基础设施)以及“免费代码”是一个神话的观点。一些人建议使用 Tauri 进行更高效的跨平台开发,而另一些人则指出了更广泛的问题,即软件质量下降以及客户对错误的容忍度降低。最终,用户对 AI 公司做出的承诺持怀疑态度,并要求提供更强大、更可靠的工具。

无需处理Linux、虚拟机、编译器或Python即可编写应用程序。立即开始。 无需安装。直接在浏览器中编写应用程序。跳过所有设置步骤! 无需编辑JSON。资源通过友好的用户界面管理。 云端。随时随地访问!这很好,不是吗? 更多功能即将推出。这仅仅是个开始!未来还有更多。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 在线 Pebble 开发 (repebble.com) 3 分,teekert 1 小时前 | 隐藏 | 过去的 | 收藏 | 1 条评论 帮助 zb3 30 分钟前 [–] 无需安装,无需编辑 json,无需登录要求.. 哦,等等,不是那个.. 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Beagle SCM:代码数据库 传统的SCM系统,如Git,虽然强大,但已经变得过于复杂,更像文件系统而非代码数据库。这种复杂性会降低开发速度,尤其是在AI辅助开发兴起的情况下。Beagle旨在通过充当数据库来解决这个问题,它存储抽象语法树(AST),而不仅仅是blob,从而实现代码的语义查询和操作。 Beagle将操作简化为四个核心命令——GET、POST、PUT和DELETE,模仿HTTP,并利用URI进行寻址。它引入了repos、branches(更接近Git仓库)、twigs(比branches更轻量,用于临时工作)和overlays(类似于Photoshop的图层,分离代码、提示和配置)的层次结构。 关键特性包括确定性的、非侵入式的CRDT合并,允许安全灵活的分支和代码混合。Beagle支持高级查询——搜索特定符号或AST子树——超越了简单的`grep`功能,这既对开发者有益,也对LLM有益。该系统优先采用结构化但更简单的方法来管理代码,这对于处理越来越多的AI生成代码至关重要。最终,Beagle旨在成为一个简单、可靠的工具,用于将代码作为超文本进行管理,其中IDE充当浏览器,而Beagle充当`curl`/`wget`的等效工具。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Beagle CRDT SCM 外部接口 (gist.github.com) 3 分,作者 gritzko,1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 科学杂志上关于天真小鸡的“bouba-kiki效应”证据 (science.org) 4点 由 suddenlybananas 39分钟前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

更多

联系我们 contact @ memedata.com