Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.
Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.
## 教 LLM 一种小众的图表语言:Pintora
该项目探索训练大型语言模型 (LLM) 处理 Pintora,一种不太常用的图表语言,目标是实现图表生成和编辑功能。作者发现现有的 LLM 可以轻松处理 Mermaid 和 PlantUML 等流行语言,但在处理小众选项时性能会下降。
由于资源限制,该项目专注于参数量小于 30B 的模型,最终选择了 Qwen2.5-Coder-7B。初步测试证实该模型缺乏 Pintora 知识,而是生成 PlantUML。训练分为两个阶段:持续预训练 (CPT) 以学习 Pintora 语法,以及指令微调 (IFT) 以执行特定任务。
创建了一个包含 1000-1500 个示例的数据集,最初尝试手动创建,但最终使用 AI(Gemini 和 Claude)生成,然后经过严格清理以消除语法错误。训练在 Runpod 上使用 QLoRA 进行,以管理 VRAM 限制。
最终的模型在从随机提示生成语法上正确的 Pintora 图表方面达到了 **86% 的准确率**,证明了使用相对较小的数据集成功学习。作者分享了模型、数据集和评估结果,并暗示未来将探索强化学习以及 Strudel 等其他语言。他们还推广了他们的人工智能辅助图表工具 ChatUML。
## 揭秘:利用可靠技术 democratize 营销组合模型 位于圣保罗的 Uncover 正在颠覆传统的营销组合模型 (MMM) 领域,该领域的服务通常成本高昂,仅供大型企业使用。他们的目标是为所有规模的企业提供可访问的、实时的营销投资分析——衡量投资回报率、优化媒体支出和跟踪促销效果。 与用户跟踪方法不同,MMM 依赖于统计分析,吸引那些优先考虑数据隐私的公司。Uncover 的平台集成了来自各种来源的数据(销售、CRM、经济数据等),并利用强大的查询引擎进行复杂的数据查询和可视化。这使得每周都能获得洞察,成本仅为传统的咨询公司 MMM 的一小部分。 为了确保可靠性,Uncover 选择 Gleam,这是一种后端编程语言,具有与 Elm(用于其前端)相似的错误预防能力。这大大减少了错误并提高了测试速度——测试执行速度比以前的后端代码快 50 倍。 Uncover 将 Gleam 视为一种“安全、明智”的选择,利用其互操作性和强大的 BEAM 平台构建具有弹性的网络服务。他们正在探索 Gleam 在全栈开发方面的潜力,并为它的前端能力发展做出贡献。
这篇帖子详细介绍了作者使用UCD程序构造模块中学到的原理,以及埃兹赫尔·W·戴克斯特拉的结构化编程思想来解决最近的Advent of Code问题的方法。核心思想是形式化程序验证——定义前置条件和后置条件,并推导定理来证明正确性。 作者使用量化符号细致地构建了一个“领域模型”,以表示问题的逻辑。这包括定义函数(如`C.n`)并通过定理建立基本情况和递归关系。这个过程展示了如何将问题分解为更小、可证明的步骤。 虽然这种形式化方法可以得到经过严格验证的解决方案,但将其翻译成Gleam等实用语言时,会导致代码复杂且可读性降低。作者承认这种权衡,指出该方法对于绝对正确性至关重要的关键软件具有价值,尽管它不适用于日常编程。最终,这项练习是对理论概念应用于实际编码挑战的有效实践。
客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。网站的必要部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置造成的。请检查您的连接,禁用任何广告拦截器,或尝试使用不同的浏览器。
用于数据科学的R包。tidyverse是一个具有明确观点的R包集合,专为数据科学设计。所有包共享潜在的设计理念、语法和数据结构。使用以下命令安装完整的tidyverse:install.packages("tidyverse")
## 西雅图的AI反弹 最近与一位受人尊敬的前微软同事共进午餐时,发现西雅图科技工作者对人工智能普遍持负面态度——这与作者的人工智能地图Wanderfugl在其他地方获得的积极反响形成了鲜明对比。这并非针对产品本身,而是对微软等大型科技公司内部有毒环境的一种反应。 由于公司范围内推动采用(并表现出拥抱)微软的人工智能工具——通常不如替代方案——工程师们感到压抑和贬低。与“Copilot使用效率低下”相关的裁员引发了怨恨,许多人感到被贴上了“非人工智能人才”的标签,并看到职业发展停滞不前。 这形成了一个自我限制的循环:害怕使用强制工具失败,抑制独立创新,以及对任何标有“人工智能”的东西的普遍敌意。作者将此与微软过去的一种赋权和实验文化形成对比,现在已被僵化的结构和普遍的幻灭感所取代。西雅图曾经充满活力的科技圈现在正面临着信任危机,阻碍了新的创业,并扼杀了人才。
## 李群:超越离散对称性 简单的形状,如三角形,表现出离散对称性(特定的旋转使其保持不变),而更复杂的物体,如飞盘,则具有*连续*对称性——无限多的旋转可能性。这些连续对称性由**李群**描述,这是一个强大的数学概念。与基本群不同,李群具有平滑的几何结构——可以被可视化为圆形、甜甜圈,甚至更复杂的流形。 这种几何性质是关键。数学家索福斯·李最初探索这些群是为了求解微分方程,但他发现了它们内在的数学价值。一个关键特征是它们与**李代数**的联系,李代数通过用直线近似弯曲的群结构来简化计算。 李群不仅仅是抽象数学;它们是理解自然世界的根本。支配引力等基本力的对称性由李群定义,解释了粒子配对和能量量子化等现象。埃米·诺特的开创性工作进一步揭示了深刻的联系:由李群描述的每种对称性都对应于物理学中的一个守恒定律(如能量守恒)。今天,李群仍然是数学家和物理学家必不可少的工具,为理解对称性在宇宙中的普遍作用提供了一个框架。
Valve正在悄然革新PC游戏,超越Steam Deck,目标是让游戏在数十亿基于Arm的设备(如智能手机)上无缝运行。Valve认识到频繁移植的低效性,因此大力资助开源技术的发展——主要包括Proton兼容层和Fex模拟器,以弥合Windows PC游戏与Arm架构之间的差距。 Fex自2016年以来一直得到Valve的秘密支持,它将x86游戏代码翻译成可在Arm处理器上运行的代码。这项技术不仅为Steam Frame头显提供动力(使其能够运行Windows游戏),还为PC游戏在Android手机上原生运行,甚至可能在基于Arm的笔记本电脑和台式机上运行打开了大门。 Valve的目标不一定是创造“Steam Phone”,而是培养一个开发者无需移植,用户可以在更广泛的设备上访问其PC游戏库的生态系统。他们设想一个未来,Arm芯片在所有性能级别上与x86竞争,扩大PC游戏的影响范围,并降低玩家和创作者的门槛。