## 计算大型堆砂身份:加速的故事
该项目专注于高效计算大型“身份堆砂”,这是对一个迷人数学概念的可视化。 最初的算法太慢——生成 100x100 的身份需要几秒钟,阻碍了对更大尺寸的探索。 目标是实现显著更快的计算,最终计算出 16384x16384 的身份,耗时不到一小时,相比于之前已知最大的例子(10,000x10,000,耗时 10 天)有了巨大改进。
主要有两种方法:“差分法”和“迭代燃烧法”。 作者改进了这两种方法,最终开发了一种利用堆砂与使用快速傅里叶变换和多重网格法求解泊松方程之间的关系的新方法。 这使得能够有效地将任何堆砂“投影”到数学理想状态(“零晶格”)上。
加速的关键在于认识到堆砂身份的尺度不变性,并递归地应用这种投影,从较小、预先计算的身份开始。 通过对“稳定化”函数进行细致的优化,也获得了显著的性能提升——这是算法的核心组件——利用了 AVX256、OpenMP、内存对齐以及利用对称性等技术。
虽然进一步的优化是可能的(AVX512、GPU 实现、改进的多重网格技术),但这项工作展示了在计算这些复杂结构方面取得了实质性的飞跃,为进一步的探索和可视化打开了大门。 代码可供那些有勇气探索它的人使用。
迈克尔·杰弗里·亚洲的经历凸显了人工智能兴起背后隐藏的人为代价。在肯尼亚,亚洲每天花费数小时标记色情内容并参与模拟的在线关系——本质上为人工智能性机器人提供劳动力——而报酬微薄。这项工作由算法控制,要求改变人物设定,对他的身心造成严重损害,导致失眠、创伤后应激障碍和性功能障碍,最终破坏了他的个人生活。
现在,作为数据标注者协会(DLA)秘书长,亚洲倡导改善这些经常被剥削的工人的工作条件。数据标注者对于训练和完善人工智能至关重要,但他们获得的报酬极低,缺乏足够的心理健康支持,尽管他们驱动着Meta、OpenAI和Gemini等科技巨头的估值。
DLA正在争取公平工资、福利以及结束限制性保密协议,将这种情况定义为现代跨国公司延续的殖民剥削。由于数据标注是肯尼亚科技劳动力中的重要组成部分,该运动寻求更广泛的团结以及对人工智能依赖弱势劳动力的伦理影响的认识。
## AurionOS:一个注重学习的操作系统
AurionOS是一个32位x86操作系统,由一位13岁的开发者用C语言和x86汇编从头开始构建,作为一个学习项目。它专为希望深入理解计算机的人设计,摒弃了现代抽象,以揭示硬件和CPU的核心逻辑。
该操作系统具有自定义引导加载程序、内核、内存管理(使用堆管理器)、VESA图形和窗口管理器,以及一个完整的TCP/IP协议栈,包括DHCP。它还包括一个自定义扇区文件系统(AurionFS),支持FAT12,以及一个拥有超过100个命令的命令行 shell。新命令可以轻松地直接在内核中添加。
AurionOS通过系统调用提供内核服务,目前处于测试阶段,正在进行错误修复。最好使用QEMU、VirtualBox或VMware来体验它。虽然实机启动正在开发中,但该项目完全开源,采用MIT许可证,体现了“每一字节都很重要”的原则。
## DDR4 内存初始化:摘要
DDR4 内存在使用前需要一个多阶段的初始化过程。该过程由 JEDEC 定义,包含四个关键阶段:**上电与初始化**、**ZQ 校准**、**Vref DQ 校准**和**读/写训练**。
**上电** 涉及将 DRAM 上线的特定序列,包括施加电源、取消复位以及加载模式寄存器以设置核心运行参数,如频率和 CAS 延迟。 **ZQ 校准** 使用外部参考电阻,将内部数据引脚 (DQ) 电阻微调至 240Ω,以补偿温度和电压引起的差异。 **Vref DQ 校准** 为数据线上的逻辑 0 和 1 建立精确的电压参考,这对于 DDR4 中使用的伪开漏 (POD) 终止方式至关重要。
最后,**读/写训练** 对齐时钟和数据信号,优化时序以实现可靠的数据传输。这涉及诸如写电平均衡、MPR 模式写入、读中心对齐和写中心对齐等算法,以考虑整个系统中的信号传播延迟。
根据应用的不同,可以启用**周期性校准**(ZQ 和读中心对齐)以在不同的运行条件下保持信号完整性。 成功完成这些步骤会将 DRAM 置于运行的空闲状态,准备好进行数据访问。