受重新体验经典软件,如原始的《冒险》游戏在原始硬件上运行的兴趣驱动,一个名为“TOPS-10 in a Box”的项目旨在简化在现代个人电脑上运行1976-1983年的PDP-10系统。虽然SIMH等工具和在线档案存在,但对于不熟悉这些旧系统的人来说,设置所有内容可能具有挑战性。 此发行版提供了一个预配置的TOPS-10操作系统,包括FORTRAN和BASIC编译器,以及关键的,原始的Crowther和Woods完成的《冒险》游戏——以源代码和可执行文件的形式提供。这让玩家能够以最初设定的方式体验游戏,包括独特的“洞穴时间”和其不寻常的保存系统。 这个300MB的软件包是探索TOPS-10的起点,但用户需要单独下载SIMH模拟器。它面向渴望深入研究计算历史并试验复古软件的爱好者。
经过25年的努力,麦克马斯特大学的研究人员创建了CANDID——加拿大可报告疾病发生率数据集,这是一个包含超过一百万条传染病记录的综合数据库,数据可追溯到1903年。戴维·恩教授最初在被忽视的卫生部存储区域发现了原始资料——数十年的手写报告,克服了最初获取历史数据的阻力。
该数据集包括脊髓灰质炎、麻疹和结核病等疾病的每周、每月和每季度病例数,涵盖加拿大所有省份和地区。这个“美丽的数据集”使研究人员能够分析过去的爆发、模拟疾病传播并了解长期趋势。
目前,公众获取加拿大传染病数据的途径有限,仅发布年度全国统计数据。恩认为,在优先保护患者隐私的前提下,增加数据共享对于改善疫情准备和应对至关重要。CANDID现在已公开可用,为流行病学家提供了一项宝贵的资源,以便从过去吸取教训并加强未来的公共卫生策略。
## 联动臂:为机器人打造“学前班”
联动臂正在解决机器人领域最大的挑战——缺乏训练数据——通过创建一个用于大规模、真实世界数据收集的系统。他们受到数据丰富的AI领域(如语言模型和游戏)的启发,正在构建一支小型、耐用且廉价的机器人队伍,以探索和与物理世界互动。
这个“机器人学前班”将专注于收集有关材料属性的数据——纹理、重量、柔韧性——这些信息难以从视频中获得。这些机器人将通过经验学习,建立对其环境和自身能力的全面理解。
联动臂设计了定制硬件,优先考虑耐用性和可扩展性,具有履带、坚固的结构和高效的制造技术等特点。这些机器人表现出惊人的力量和灵巧性,能够执行诸如操作工具(剪刀、螺丝刀)和组装结构等任务。
作为一家公共利益公司,联动臂旨在 democratize 机器人技术,降低硬件成本以实现更广泛的访问和创新。他们目前正在扩大数据收集规模,并积极研究最佳学习算法,愿景是创造能够增强人类潜力并重塑工作方式的机器人。
## 世界模型与预测的力量
下一帧和下一词元预测是强大的预训练任务,因为它们迫使模型直接从数据中学习世界运作方式,所需的先验知识最少。减少对接下来发生的事情的不确定性,能够解锁越来越强大的能力——在语言模型中,随着上下文长度的增加,这一点表现得尤为明显。
这个原理延伸到从视频中学习的“世界模型”。为了预测未来的观察结果,模型必须推断世界的潜在状态以及它的变化方式,从而掌握物理学、因果关系和持久性。至关重要的是,需要*长*序列来学习维持内部“隐藏状态”——即使在未观察到的情况下也能理解事件(例如,正在注满的浴缸)。
与建立在手工规则上的传统模拟器不同,后者仅限于特定领域,世界模型*学习*从海量视频数据中进行模拟。这允许采用一种更通用、更可扩展的方法,模型可以动态地关注关键信息,而不是受预定义保真度的约束。这代表着向学习模拟本身转变,有望在表示复杂、长时效动力学方面取得重大进展。