正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1769315756-F6cu8Kyb24XwQJOXpgRLlsTCiIj6BxgO 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1769315756-F6cu8Kyb24XwQJOXpgRLlsTCiIj6BxgO
正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1769315756-F6cu8Kyb24XwQJOXpgRLlsTCiIj6BxgO 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1769315756-F6cu8Kyb24XwQJOXpgRLlsTCiIj6BxgO
[提交于2026年1月8日 (v1),最后修改于2026年1月14日 (此版本,v2)] 查看论文PDF:大型语言模型推理硬件的挑战与研究方向,作者:马晓宇和David Patterson 查看PDF 摘要:大型语言模型 (LLM) 推理很困难。底层Transformer模型的自回归解码阶段使得LLM推理与训练根本不同。由于最近的人工智能趋势,主要挑战在于内存和互连,而非计算。为了应对这些挑战,我们强调了四个架构研究机会:具有HBM类似带宽的10倍内存容量的高带宽闪存;用于高内存带宽的近内存处理和3D内存-逻辑堆叠;以及用于加速通信的低延迟互连。虽然我们的重点是数据中心人工智能,我们也回顾了它们在移动设备上的适用性。 来自:马晓宇 [查看邮箱] [v1] 2026年1月8日 星期四 15:52:11 UTC (832 KB) [v2] 2026年1月14日 星期三 20:37:46 UTC (983 KB)
## vm-curator:一个用于QEMU/KVM虚拟机的Rust TUI vm-curator是一个快速、用户友好的终端界面,用于管理QEMU/KVM虚拟机。它通过直观的TUI简化了虚拟机发现、创建、启动和管理。主要功能包括虚拟机库的自动扫描、分层组织以及一个包含50多个预配置操作系统配置文件的5步向导——包括跨发行版的自动UEFI检测。 值得注意的是,vm-curator支持使用NVIDIA GPU(在RTX-4090和驱动程序590.48.01上测试)的准虚拟化3D加速,但*不是*完全的GPU直通。快照管理、启动脚本编辑器和USB直通也包含在内。 该工具提供Vim风格的导航、搜索和通过`config.toml`文件进行自定义。它期望虚拟机以特定的目录结构(默认情况下为`~/vm-space`)组织,并使用`launch.sh`脚本进行配置。 vm-curator是一个个人项目,专注于精简、透明的体验,优先考虑稳定性和性能,为寻求高性能虚拟机而无需libvirt复杂性的用户提供服务。欢迎贡献,尤其是界面ASCII艺术!
微软2026年1月补丁星期二Windows 11更新问题频发,在一周内需要发布*两次*紧急修复补丁。最初的更新导致关机、休眠和远程桌面连接出现问题,并通过1月17日发布的第一个紧急补丁得到修复。 然而,*那个*修复意外地导致许多用户无法使用Outlook和OneDrive、Dropbox等云存储应用。最新的紧急更新KB5078127专门解决了这个问题,恢复了受影响的应用和将PST文件存储在OneDrive上的Outlook配置的功能。 这些问题源于最初的1月13日安全更新,并凸显了Windows质量控制方面存在重大问题,对微软来说,新年开局不顺利。建议用户安装最新更新以解决这些持续存在的问题。
此错误报告详细描述了在OpenEuler 2.0 (LTS-SP2)内核6.6.0-100上,NVIDIA开源GPU内核模块存在的问题。具体来说,在使用570.133.20版本驱动程序和OpenRM在B200 GPU上运行时,`nvidia-smi`在运行约66天12小时后会无限期挂起。 `dmesg`输出显示与`knvlink`未能更新和发现Rx后检测链路掩码(针对对等设备0和1)相关的重复错误。该问题发生在长时间运行后,并且已观察到一次。 报告强调此问题仅针对*开源*内核驱动程序中的错误,并请求确认该问题是否在使用专有驱动程序时发生。报告还确认正在使用稳定、非RC内核。包含一个日志文件(`nvidia-bug-report.log.gz`),但未提供其他信息。
亚历克斯·霍诺尔德最近创造历史,成为第一个无绳、无安全网徒手攀登台北101的人。虽然他不是第一个攀登这座摩天大楼的人,但他超越了“法国蜘蛛人”阿兰·罗伯特,后者在2004年台北101开幕时使用安全装备攀登了它。 罗伯特是一位经验丰富的城市攀登者,他对霍诺尔德的壮举发表了评论,并曾就这座建筑的分段结构向他提供建议。罗伯特本人也征服了帝国大厦和哈利法塔等标志性建筑,通常采用徒手攀登的方式,但他因其大胆的攀登而被捕超过120次。 两位攀登者都热爱挑战极限。现年63岁的罗伯特秉持着拥抱风险的哲学,他说:“生活必须充满危险”,并积极寻求“舒适区之外”的体验。他的攀登有时是受邀的活动,但经常涉及为了挑战而无视法律限制。
客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。网站的必要部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置造成的。请检查您的连接,禁用任何广告拦截器,或尝试使用不同的浏览器。
L10N::CY - Raku 的威尔士语本地化
$ draig -e 'dywedyd "Helo Byd"' Helo Byd # 必须设置 RAKUDO_RAKUAST=1 环境变量
use L10N::NL; dywedyd "Helo Byd"
L10N::CY 分发包含提供 Raku 编程语言威尔士语本地化的逻辑。它安装了一个 draig 可执行文件,该文件将自动激活威尔士语本地化。并且允许在选定的程序中使用 use L10N::CY 语句来使用威尔士语本地化。
创建一种新的编程语言 - Draig
Richard Hainsworth [email protected]
版权 2024, 2025 Raku 本地化团队
此库是自由软件;您可以根据 Artistic License 2.0 重新分发和/或修改它。
## Tiny Tapeout实验航天器:AI加速器与JTAG调试
该项目旨在在短短两周内,使用GlobalFoundries 180nm技术通过Tiny Tapeout实验航天器,设计一个小型的2x2矩阵-矩阵乘法柱状阵列(AI加速器的核心组件)*和*强大的片上调试基础设施——JTAG TAP。该项目最初主要是一个调试基础设施练习,柱状阵列被添加为被测设计。
利用现有的流程(Tiny Tapeout/Librelane/OpenROAD)和个人自动化脚本对于满足截止日期至关重要。该设计优先考虑柱状阵列中的计算-内存比效率,并包含定制的Booth Radix-4乘法器。一个关键特性是用于探测内部寄存器的定制JTAG指令(USER_REG),并通过OpenOCD进行仿真验证。
尽管存在限制——引脚数量、时钟频率和缺乏SRAM——该设计已成功完成并提交制造。作者强调了迭代设计的重要性以及开源工具在实现快速原型设计方面的力量。该项目是迈向独立ASIC设计最终目标的一步,通过参与Tiny Tapeout等项目来积累技能和经验。芯片目前正在制造中,如果成功,将可供购买。