“Wigglegram”是一种通过循环播放从不同角度拍摄的画面而产生的类 3D 立体图像。作者是一位犹豫不决的摄影师,无意中收集了同一场景的多个版本,后来发现自己的相机胶卷里存满了制作这些动画的原始素材。
为了实现自动化处理,作者编写了一个脚本,利用感知哈希(一种类似于以图搜图的技术)来识别视觉上相似的照片。通过计算图像哈希值之间的“汉明距离”,该脚本成功检测出可以拼接成 wigglegram 的照片簇。
由此产生的作品集涵盖了从偶然拍下的“动态电影”到精心构思的艺术摄影,内容包罗万象,包括宠物、设计项目和雕塑等。作者已将该脚本分享到 GitHub,供他人整理自己的照片库,将多年的数字杂物转化为引人入胜的视觉档案。
本项目探讨了使用一个微型 0.6B 参数大语言模型(Qwen 3)对家庭问答进行分类,以辅助基于检索增强生成(RAG)的聊天机器人。通过将问题映射到特定的元数据类别(如“泳池”或“暖通空调”),聊天机器人能够缩小搜索范围,从而提高响应的准确性。
初步测试显示,基准模型的表现较差,由于产生幻觉和类别混淆,准确率仅为 10%。为了提升性能,作者使用 Unsloth 框架和一个约 850 条数据的数据集对模型进行了微调。
第一次微调将准确率提升至 79%,但模型在处理语义重叠和输出格式不一致时表现不佳。为解决此问题,作者采用了“基于代码”的方法,为每个类别分配了互不重叠的双字母 ID。这一策略将准确率大幅提升至 92%,证明限制输出为严格、明确的标识符有助于微型模型保持可靠性。尽管仍存在一些语义混淆(特别是在“与水相关”的类别之间),但该微调模型现已能够作为有效的分类器服务于家庭助理。该项目表明,通过针对性的训练和巧妙的输出工程,参数规模在 1B 以下的模型能够可靠地执行专门的分类任务。
为了支持 Markdown、HTML、富文本、PDF 及其专有的 .MNML 格式等多种格式的导入导出,Minimal 使用 Swift 开发了一套复杂的转换引擎。
团队没有构建混乱的格式间直接转换网络,而是实现了一种“中间表示法”(Intermediate Representation, IR)。作为中央枢纽,IR 将添加新格式的复杂度从指数级的多链路噩梦降低为线性的“一对一”关系。每增加一种新格式,只需编写特定的解析器和渲染器与 IR 进行交互即可。
该系统包含一种“折衷”机制,用于追踪并在不兼容类型转换时报告数据丢失或格式变更。对于无损工作流,专有的 .MNML 格式可确保完美的往返转换。
除了简单的文件转换外,该引擎还与应用程序的用户体验深度集成,支持拖放导入、系统级共享扩展以及专门的剪贴板处理。这些功能实现了顺畅的工作流,例如将笔记以 Markdown 格式直接“快速导出”至大语言模型(LLM)。通过将文件解析与应用逻辑解耦,Minimal 构建了一种灵活且可扩展的架构,使文件可移植性成为核心特性,而非事后的补充。
1983年,Commodore加拿大公司面临一项独特的工程障碍:尽管国际市场可以轻松将VICModem连接到模块化电话上,但当时加拿大的贝尔(Bell)垄断公司执行着严格的“硬接线”电话政策。由于贝尔拥有所有用户设备并禁止改装电话,标准的VICModem起初无法兼容加拿大的通信基础设施。
为了解决这个问题,Commodore与贝尔达成协议,将他们的调制解调器与定制品牌的北电(Northern Telecom)拨号电话进行捆绑销售。然而,随后的监管障碍——禁止临时断开电话线路——使得他们无法按预期使用这些调制解调器。
最终,Commodore通过开发VIC-1605适配器绕过了这些限制。这是一个手动切换盒,允许用户在电话和调制解调器信号之间切换,而不会违反电信法规。
如今,这款北电Commodore电话被视为计算机历史上极为罕见的收藏品。这个“加拿大特有”的异类,是一个引人入胜的案例研究,展现了僵化的电信垄断和区域性基础设施限制,如何迫使早期科技公司采取创造性且往往繁琐的工程解决方案,从而推动家庭计算革命的发展。