每日HackerNews RSS

## Respectlytics:注重隐私的移动分析 Respectlytics 是一款自托管的移动分析服务器,其核心设计原则是隐私保护——通过最小化数据收集来优先考虑*规避回报* (ROA)。它仅存储每个事件的 5 个必要字段:`event_name`、轮换的 `session_id`(仅在 RAM 中,每 2 小时刷新一次)、`timestamp`、`platform` 和近似 `country`(从 IP 推断得出,并立即丢弃)。**不保留任何个人数据、用户 ID、设备 ID 或精确的位置数据。** 该服务器易于使用 Docker 或 Python/PostgreSQL 环境部署。提供快速入门指南,以及全面的 API(包含事件摄取、摘要和漏斗分析端点)和 SDK。 主要功能包括基于会话的分析、严格的数据限制以及可选的 GeoIP 集成(使用 MaxMind)。数据保留时间可通过 `purge_old_events` 命令进行配置。 Respectlytics 采用 AGPL-3.0 许可,鼓励开放贡献。对于不兼容的使用场景,提供商业许可。还提供完全托管的云版本。**请咨询法律顾问,以确保符合相关的隐私法规。**

## Respectlytics:注重隐私的移动分析 开发者 cesncn 发布了 Respectlytics,这是一款以隐私为核心原则构建的开源移动分析解决方案。由于对现有 SDK 隐藏的数据收集行为和可疑的合规声明感到沮丧,Respectlytics 优先考虑数据最小化。 与竞争对手不同,Respectlytics 每次事件只收集五个数据点:事件名称、会话 ID、时间戳、平台和国家/地区——在国家/地区查询后立即丢弃 IP 地址。它积极*阻止*收集敏感标识符,如设备 ID 和广告追踪器。 该项目包括 Swift、Flutter、React Native 和 Kotlin 的 SDK(MIT 许可)以及一个可自我托管的分析服务器(Django + PostgreSQL,AGPL-3.0),可使用 Docker 轻松部署。 社区版也提供托管 SaaS 选项,没有限制。 开发者欢迎反馈,特别是关于在 API 级别拒绝不需要的数据以实现最大透明度的决定。

十五年来,英伟达一直有策略地限制消费级GPU的双精度(FP64)性能,使其与企业级GPU相比存在明显市场划分。虽然消费级显卡的FP32性能大幅提升(从2010年到2025年增长了77.63倍),但FP64仅提升了9.65倍,性能差距持续扩大——目前RTX 5090上为64:1。 这种差异并非技术限制,而是一种刻意的商业策略,因为FP64对于高性能计算至关重要,但对于游戏等典型的消费者任务来说并不必要。然而,人工智能的兴起正在打破这种模式。人工智能训练通常*更喜欢*较低的精度(FP16、BF16),这使得消费级GPU在计算工作负载方面出乎意料地强大。 现在,英伟达正在转变重点。随着FP64仿真技术(使用FP32甚至FP8张量核心)变得可行,并且人工智能推动了对低精度计算的需求,该公司最新的企业级GPU(如B300)正在*减少*专用的FP64硬件,转而采用更高效的人工智能核心。这代表着一种逆转——企业级硬件采用了以前与消费级显卡相关的限制——并预示着FP64将越来越多地通过仿真实现,潜在地模糊了消费级和企业级芯片之间的界限,低精度浮点数将成为新的分界因素。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 15年FP64分段,以及为什么Blackwell Ultra打破了模式 (nicolasdickenmann.com) 9点 由 fp64enjoyer 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

Mojang 正在将《我的世界:Java 版》的渲染从 OpenGL 过渡到 Vulkan,作为“鲜活视觉效果”更新的一部分,承诺带来视觉增强和性能提升。这一重大改变旨在利用现代特性,并保持与包括 macOS(通过翻译层)和 Linux 在内的 PC 操作系统兼容。 此次切换将要求模组制作者更新他们的作品,放弃 OpenGL,Mojang 鼓励提前准备并利用现有的渲染 API 以简化过渡。虽然缺乏 Vulkan 支持的旧硬件可能会变得不兼容,但 Vulkan 具有广泛的 GPU 支持。 玩家不会立即被强制切换;Mojang 计划今夏在开发快照中发布 Vulkan 和 OpenGL 并存的版本,允许在两者之间切换。最终,一旦 Vulkan 稳定且性能良好,OpenGL 将被移除。此次更新代表了《我的世界:Java 版》未来发展的重要一步。

## Minecraft Java 版将切换至 Vulkan 据 gamingonlinux.com 报道,Minecraft Java 版正在从 OpenGL 过渡到 Vulkan。考虑到该游戏仅专注于桌面平台,此举被认为是明智的,可以避免在移动平台上使用不稳定 Vulkan 驱动程序可能出现的问题。 Hacker News 上的讨论指出,微软的这一转变令人惊讶,微软最近开始采用 Khronos 标准,例如 SPIR-V 用于着色器编译,从而改善了与 Vulkan 和 DirectX 的互操作性。 一个主要担忧是潜在的着色器编译延迟,这是 Vulkan 的常见问题。然而,评论员认为 Minecraft 相对简单的体素渲染风格可能会减轻这些问题。有人开玩笑说,未来有可能使用 Nanite 和 Lumen 在 Unreal Engine 5 中重建游戏。

## HM 与双向类型系统:为你的语言提出的错误问题 关于 Hindley-Milner (HM) 和双向 (Bidir) 类型系统的争论,常常被框定为二选一的选择,但这是一种错误的二分法。核心问题不是 *选择哪个* 系统,而是 *你的语言是否需要泛型*。 泛型需要合一——推断和求解类型变量的过程(例如 Rust 中的 `Vec<T>`)。HM 本质上包含合一。然而,双向类型系统并不局限于缺乏合一;它 *支持* 合一,使其成为 HM 的超集。你可以实现一个带有或不带有合一的双向系统,提供灵活性。 如果没有泛型,一个更简单的依赖于类型注解的双向系统就足够了,尤其是在学习练习或领域特定语言 (DSL) 中,在这些情况下,最小化复杂性是关键。然而,对于通用语言,泛型越来越被认为是必不可少的,从而推动了对合一的需求。 最终,双向类型系统提供了一种更具适应性的方法。选择它并不会排除合一,并且允许你根据语言的特定需求定制系统——无论是一个功能齐全的泛型语言,还是一个精简的、注重注解的 DSL。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 如何选择 Hindley-Milner 和双向类型 (thunderseethe.dev) 9 分,thunderseethe 发表于 1 小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 486.713通往罗马的路线:摘要 “486.713通往罗马的路线”是一个数据可视化项目,通过大规模的移动模式来研究“殊途同归”的说法。该项目利用路由算法和OpenStreetMap数据与GraphHopper,绘制了从各个地点到罗马的大量可能路线。 结果以大尺寸lambda打印(120厘米 x 80厘米)和交互式网络地图的形式呈现,提供详细信息和“探索”应用程序。这些可视化展示了道路基础设施如何反映地理、政治和区域背景。 除了罗马,该项目还扩展到分析东京、柏林和旧金山等城市的城市流动“指纹”和“街道DNA”,从而深入了解独特的城市结构。 最终,它将数据艺术和信息可视化巧妙地结合在一起。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 通往罗马的道路 (2015) (benedikt-gross.de) 5 分,由 robin_reala 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Azure SQL 与 LangChain:为您的应用程序带来生成式 AI 微软已为 Azure SQL 和 Microsoft Fabric 中的 SQL 数据库引入了原生向量搜索功能,并推出了 `langchain-sqlserver` 包,以实现与 LangChain 的无缝集成。这使得开发者只需几行代码,就能轻松地将生成式 AI 功能添加到应用程序中。 一个教程使用哈利·波特书籍系列作为数据集,存储在 Azure Blob 存储中,演示了这一点。该过程包括将文本分块、使用 Azure OpenAI 生成嵌入向量,并将它们存储在 Azure SQL 中作为向量存储。 重点介绍了两个关键用例:一个问答系统,可以从书籍中提供丰富的上下文答案;以及一个同人小说生成器,可以根据用户提示创建新的故事。两者都利用向量存储中的相似性搜索来检索相关信息。 该教程指导用户完成安装、数据加载、嵌入向量生成、向量存储初始化和查询。代码示例可在 GitHub 上找到 ([https://github.com/Azure-Samples/azure-sql-db-vector-search](https://github.com/Azure-Samples/azure-sql-db-vector-search))。微软鼓励通过评论和 Azure SQL 反馈门户提供反馈,以进一步改进这项令人兴奋的新功能。

微软博客一篇帖子简短地提供了一份指南,介绍如何访问完整的《哈利·波特》系列作品,用于训练大型语言模型(LLM),并链接到Kaggle上的一个数据集。 这篇帖子最初的主题是关于基于SQL的人工智能应用,引发了Hacker News上关于使用受版权保护的材料进行人工智能训练的合法性和伦理的讨论。 用户指出,LLM已经能够重现书籍的重要部分——一项研究表明,使用Sonnet 3.7模型,第一部《哈利·波特》小说达到了95.8%的逐字准确率。 该数据集的可用性引发了关于J.K.罗琳的团队为何没有采取行动的问题,猜测范围从相对较低的下载量(1万次)到《哈利·波特》系列作品的潜在盈利能力降低了追究轻微侵权的动机。 也有人对微软的内容审查流程表示担忧,因为最近发生了一起涉及据称抄袭的单独事件。 这篇帖子已被存档。

CMake 对 Swift 6.0 的完整支持目前受到 Swift 编译器 (swiftc) 和 Ninja 构建系统的一些兼容性问题阻碍。具体来说,Swift + Ninja 会忽略 `CMAKE_OSX_DEPLOYMENT_TARGET`,导致版本不匹配和警告。一个临时解决方法是手动设置 Swift 编译器的目标。 另一个问题与 CMake 策略 CMP0157 相关,swiftc 无法正确处理安装名称,需要一个构建后命令来调整库 ID。对此的修复已于 2024 年 8 月 2 日合并,并将回移植到 CMake 3.29 和 3.30 版本。 最后,swiftc 无法识别在导入目标依赖项中定义的某些编译和链接选项,因此需要一个解决方法来修改这些标志在导入之后。这些问题正在积极解决,以在 CMake 中实现稳定、非实验性的 Swift 6.0 体验。

请记住,食物文化不断地相互引进和输出。这不是测试食物的起源地。答案基于图片拍摄地点。例如,面条起源于中国,但韩国和日本都以不同的方式进行了改良。

Hacker News 的讨论围绕着网站“All Look Same”(alllooksame.com),这是一个挑战用户区分中国、日本和韩国人脸的测验。用户报告得分各异,许多人发现即使有在这些国家长期居住的经验,也很难区分。 一些评论员指出东亚人群体之间共享的基因,使得视觉区分具有挑战性,尤其是在考虑到当前的时尚趋势时。有些人为该测验辩护,认为承认相似之处并不一定具有种族歧视,而另一些人则指出,期望存在明显差异可能存在偏见。 该网站本身看起来很旧(域名创建于 2001 年),目前加载速度非常慢,但仍然可以访问。得分范围很广,从最低的 1/18 到一些人达到 9/18 左右,突出了这项任务的难度。Hacker News 上关于该网站的先前讨论可以追溯到 22 年前。

## 一次性软件的兴起与API的力量 成为新手父母激发了他对睡眠追踪的需求,现有的Fitbit无法满足。现有的用户体验并非为新生儿父母的零碎睡眠而设计,因此这位工程师利用AI编码工具快速构建了一个自定义界面,以可视化他的数据并解答关于他疲惫程度的关键问题。 虽然有用,但他意识到这并非一个可行的产品——它缺乏基本功能,并且完全依赖于Fitbit的核心功能。这突显了“一次性软件”的出现,这种软件可以利用AI轻松创建,以满足高度特定且临时的需求。 关键在于**API**的持久价值。Fitbit现有的API实现了这种个性化,展示了暴露核心产品能力如何培养客户忠诚度,*而无需*企业构建所有可能的功能。 展望未来,AI代理正在进一步扩展“界面表面”,可能会完全绕过应用程序。那些在*服务层面*(如订阅)进行盈利的企业将处于最佳的蓬勃发展地位,因为他们控制着潜在的价值。未来在于拥抱开放的API,认识到在界面廉价的世界里,持久的产品本身就是服务——核心能力,而不是它的呈现方式。

## 黑客新闻讨论:一次性接口与计算的未来 最近一篇关于一次性接口的文章引发了黑客新闻的讨论,核心围绕着从个人计算向服务器端模式的转变。主要观点是,资本现在更倾向于投资大型数据中心和私有高速互联网——这类似于重返大型机时代。 评论者指出,随着身份货币化成为关键,接口的价值正在下降,并且“市场会为事物找到自己的用途”。 提出的解决方案包括用于产品持久性的强大API,以及利用WebMCP实现无缝用户体验和API控制。 一个关键点将这一趋势与“维修权”运动联系起来,认为API访问能够实现真正的定制化。 最终,讨论表明,未来软件将变得越来越一次性,而成功将取决于构建耐用、可重用的系统,并通过集中式远程数据中心访问信息。

冲洗并重复数千行。 “sub”序列贪婪地匹配字符,这就是为什么此列表从4位数字开始;如果从1到9开始,我们只会得到一堆个位数替换。 这也意味着对于5位或更多位数的数字,例如123456,字体将一次匹配4位数字并生成“1234”的字形,然后是“56”。 字形外观本身是使用Chris Heilmann的Cistercian数字生成器的SVG路径定义的。 感谢Chris!有关我用于生成Cistercian字体的完整代码,请参见GitHub仓库:bobbiec/cistercian-font。 请注意,代码大部分是由AI生成的——尽管我对其进行了审查,但我也没有专业知识来发现如果存在严重错误。 我在玩转演示时注意到,象限的顺序非常不寻常。 如果从最低有效数字(个位)到最高有效数字(千位)计数,你会得到这种反Z形:

一个黑客新闻的讨论集中在一个新字体上,该字体设计用于使用连字显示十三世纪僧侣数字。该字体的创建者数字化重现了这些历史数字,引发了用户对类似项目的兴趣。 一位评论者分享了他们使用MusGlyph的经验,这是一种专注于音乐符号连字的字体,以及使用FontForge自定义和网络子集化连字密集字体的挑战。另一位用户则提到了FRBCistercian字体,它使用组合方法,而不是单独定义每个连字。 对话还涉及了创建此类字体的复杂性——质疑为什么没有比手动定义数千个连字更有效的方法。用户指出,该字体的连字主要帮助在特定情况下进行加法运算(例如加到1、4、6、8或0),在有限的场景中使过程在视觉上直观。总的来说,该帖子突出显示了字体技术和连字设计的一个小众但引人入胜的应用。

更多

联系我们 contact @ memedata.com