这段代码可视化了“Bonsai 8B”语言模型与可比模型的性能,重点关注基准测试、准确率/大小权衡、吞吐量、能耗和智能密度。 界面包含用于不同可视化的选项卡面板。**基准测试**结果(IFEval、GSM8K等)显示为条形图,用户可以通过下拉菜单选择不同的基准测试。**准确率与大小**以散点图显示,突出显示Bonsai 8B,并可选择帕累托曲线。另一个散点图(**散点图 - 无曲线**)在没有曲线的情况下呈现相同的数据。**吞吐量**和**能耗**使用条形图可视化,比较Bonsai 8B在不同硬件上的表现。最后,**智能密度**以另一个条形图呈现。 交互元素包括悬停提示、用于视觉定制的调色板选择器以及适应移动设备的响应式设计。动画用于逐步显示数据。当选择选项卡或调整窗口大小时,可视化内容会动态更新。
## 点系统:用于不断增长的零件收集的简单库存
面对快速增长的电子元件收集,作者需要一个简单的库存系统——一种超越大型分销商使用的复杂数据库的东西。解决方案?透明盒子、标签和彩色点贴纸。
从2017年开始,所有零件都被整理到标准化的透明盒子里,并进行分类和标记日期。该系统的核心是每年在每个盒子上贴*一个*彩色点。这可以追踪随时间的使用情况,揭示哪些元件经常使用,哪些则未被使用。
四年后,“数据”一目了然:必需品不是专业传感器,而是像胶水、胶带、电池和常见的电阻/电容等消耗品。该系统还凸显了令人惊讶的未充分利用的工具,如示波器。
盒子根据点密度分层——常用物品放在附近,不常用的物品放入存储,真正未使用的物品则被捐赠。这可以防止囤积,并确保空间保持易于管理。该系统的成功在于其简单性:几美元的贴纸,最少的努力,以及一个能够告知购买和清理决定的视觉仪表盘。它是一个“动态系统”,可以随着用户的项目而调整和发展。
## HYPERHELL:一场通往混沌的四维降临
HYPERHELL 是一款独特的第一人称射击游戏,灵感源自DOOM,挑战玩家在令人恐惧的四维迷宫中导航和生存。游戏采用创新的WebGPU技术构建(兼容现代Mac和Nvidia GPU/Chrome),有意让习惯了三维世界的玩家感到迷失方向。
玩家将与恶魔和堕落天使战斗,寻求一个由神秘实体“交易者”提供的逃生之路。这种逃生取决于一个艰难的选择:超越你三维的限制,或屈服于命运。
HYPERHELL 起源于一个核心问题——我们能否直观地理解四维世界?游戏利用了一种新颖的“不眨眼”机制,模拟一个四维“眼睛”(带有3D传感器的摄像头),以促进对更高维度的互动学习和理解。这个演示提供了一窥这种突破性的四维游戏设计方法。
## JSSE:由AI构建的JavaScript引擎
2026年初,开发者pmatos成功创建了JSSE,一个完全可用的JavaScript引擎,通过了test262的100%非暂存测试(98,426个场景)——完全通过使用Claude AI模型实现。值得注意的是,pmatos本人没有编写任何一行Rust代码。
该项目最初是作为“代理编码”实验开始的,源于构建一个基于Rust的浏览器的JavaScript引擎的挑战。使用Claude的“YOLO”模式(自动接受工具使用),AI在42天内自主规划、实现、测试和提交代码,最终产生了大约170,000行Rust代码。
该过程的核心涉及一个简单的循环:Claude会分析test262的差距,提出特性建议,并根据任务列表(PLAN.md)实现它们。Pmatos的参与总共只有大约四小时,主要用于设定优先级和解除代理的阻塞。
虽然目前性能较差(故意未优化),但该成功展示了AI驱动软件开发的潜力。该项目API使用成本约为4,619美元,凸显了通往复杂软件创建的经济高效途径。关键的学习包括明确计划的重要性、全面测试(test262)的力量以及在长时间AI对话中保持上下文的挑战。代码在GitHub上以MIT许可证提供。