每日HackerNews RSS

我们正在开发一些令人兴奋的新功能。请勾选下方选项,告诉我们您感兴趣的内容,我们会及时更新。 1. **深度搜索** - 运行更深层次(但速度较慢且成本较高)的搜索,以获得更高的字段覆盖率和更详细的信息。 2. **人物搜索** - 通过姓名和(地点或公司)而非电子邮件地址进行搜索。 3. **Github 个人资料搜索** - 通过 Github 个人资料搜索,了解您的关注者。 4. **公司搜索** - 通过公司名称或网站搜索,了解其规模、收入、融资、行业、创始人等信息。 5. **公司中的人物搜索** - 通过公司和职位搜索,查找该公司中担任该职位的人员。 加入候补名单。

## Yolodex:实时客户信息丰富 API - 摘要 Yolodex (yolodex.ai) 是一款新的 API,旨在利用单个电子邮件地址快速丰富客户资料,使用公开数据。它会返回一个 JSON 格式的资料,包括姓名、地点、年龄、职业、社交媒体账号和兴趣。开发者创建它是因为发现现有的解决方案(如 Apollo、Clearbit 等)数据陈旧、质量存疑且定价不灵活。 Yolodex 提供简单、按使用付费的模式(每个丰富资料 0.03 美元,如果没有找到数据则免费),并声称其数据来自开源情报 (OSINT),实时更新。初步 Hacker News 反馈显示,数据准确性和覆盖范围存在显著问题——许多用户即使使用常见的电子邮件地址,也大多得到空结果。一些用户还注意到响应时间较慢。 开发者正在积极寻求关于速度、数据覆盖范围、定价和潜在用例的反馈,以改进 API 的性能和相关性。他们尤其希望了解用户将如何将其与现有解决方案进行基准测试。

一位旅行者对酒店为了美观而牺牲浴室隐私的趋势感到沮丧——特别是完全取消浴室门的情况,因此创建了一个网站,旨在确保最基本的期望得以满足:一个可用的浴室门。 该网站汇集了一份酒店列表,通过直接联系进行验证,并按价格和城市分类。 保证完全关闭且非玻璃浴室门的酒店会被推荐,而缺乏门的酒店则会被公开记录。 该项目依赖众包;旅行者被鼓励通过电子邮件或Instagram(附照片)提交“无门”酒店的体验,以公开谴责,旨在迫使酒店恢复未来客人的隐私和尊严。 这是一项充满激情的努力,旨在对抗一种令人沮丧且日益普遍的旅行不便。

## 将 iOS 6 移植到第 3 代 iPod Touch 本文详细介绍了在第 3 代 iPod Touch 上成功运行 iOS 6 的复杂过程——苹果官方已停止在该设备上支持 iOS 5.1.1。作者通过剖析 iOS 内部结构并克服众多兼容性障碍实现了这一点。 关键组件包括修改启动加载程序 (iBoot)、修补 DeviceTree 以反映硬件差异,以及重建 kernelcache。一个关键步骤是使用 macOS 工具 (`kcgen`) 通过动态加载和链接必要的 kexts (内核扩展) 来创建功能正常的 kernelcache。为了正确识别设备并启用激活,需要对 MobileGestalt 等框架进行大量修补。 该项目还涉及重新实现 iBoot 漏洞以访问文件系统,并使用必要的硬件配置和固件调整根文件系统。作者通过公共仓库提供代码和脚本,强调理解 DeviceTree 差异和启动参数对于类似尝试的重要性。未来的计划包括探索越狱的可能性,并尝试将 iOS 移植到其他不受支持的设备,例如初代 iPad。

## Fara-7B:一款紧凑且强大的计算机使用代理 Fara-7B 是微软首个旨在*使用*计算机的代理小语言模型(SLM),而不仅仅是生成文本。它仅有70亿参数,性能可与更大的模型相媲美,同时提供设备端部署、降低延迟和提高隐私等优势。 与传统的聊天模型不同,Fara-7B 使用鼠标和键盘与计算机交互,视觉感知网页并执行诸如点击和输入等操作——模拟人类交互。它在包含14.5万个基于网页的任务的合成数据集上进行训练,擅长自动化日常网络活动,例如购物、预订旅行和信息收集,完成任务的步骤比同类模型更少(约16步,而同类模型约为41步)。 Fara-7B 在 WebVoyager 和名为 WebTailBench 的新基准测试等网络代理基准测试中取得了最先进的成果,证明了其在各种任务中的有效性。它可通过 GitHub 进行本地使用,也可以部署在 Azure Foundry 上以便于访问,或者在有 GPU 资源的情况下使用 VLLM 自行托管。微软鼓励社区探索和反馈,建议在沙盒环境中进行初步测试。

2015-06-16T13:12:39-05:00 Canon iR-ADV C7055 2015-06-17T10:08:26-04:00 2015-06-17T10:08:26-04:00 Adobe PSL 1.1e for Canon application/pdf uuid:b1678055-0000-001e-8f33-335e00000000 uuid:11c6e885-f13b-4367-84c9-10287f30f24a HyTSw oɞc [5laQIBHADED2mtFOE.c}08׎8GNg9w߽

这个Hacker News讨论围绕着1986年的一份PDF文件,标题为“音频活性衰变的奇妙化学”。用户们回忆起发现这篇论文并探索其中的数学概念,特别是不同编号基数的变化。 讨论的关键点是数学方法中出现的数字92,以及它与元素周期表中92种元素的奇妙联系。一位用户澄清这并非直接对应,因为地球上只有83种稳定的元素,或者如果包括持续衰变产生的元素,则为90种。然而,潜在的新碱土金属(ununennium和unbinilium)的发现可能会使数量达到92。 对话还涉及Conway的“看与说”数字,以及Numberphile视频声称其与元素周期表无关,一些人对此表示怀疑。分享了与自动机理论和Haskell实现分析该序列相关的研究链接。

## LLM驱动的文件系统:摘要 该项目探索使用语言模型(LLM)来实现文件系统,源于作者对LLM能力以及压缩与人工智能之间联系的好奇。核心思想是训练LLM基于FUSE操作(如读取、写入、删除)来预测文件系统状态。 创建了一个环回FUSE文件系统来记录操作并生成训练数据,数据以XML格式表示。在这些数据上微调Qwen3-4b模型,实现了约98%的预测文件系统变化准确率。这使得构建一个功能性的FUSE文件系统成为可能,其中*每个*操作都通过查询LLM来处理。 关键见解出现在应用算术编码——一种可逆压缩技术——到XML文件系统表示时。微调后的LLM表现出卓越的自压缩能力,压缩率比传统的squashfs等工具高出高达8倍。这突显了LLM如何利用学习到的模式来高效地表示数据,特别是基于文本的结构,如文件系统元数据。 虽然目前是一个带有局限性的“玩具”实验(LLM依赖性、上下文窗口大小),但结果表明LLM压缩在未来可能具有优势,尤其是在边缘计算或不频繁数据访问场景中。该项目的源代码已开源,供进一步探索。

## LLM 与数据压缩:一种新方法 最近 Hacker News 的讨论集中在大型语言模型 (LLM) 作为数据压缩工具的惊人有效性上,尤其是在 enwik8 和 enwik9 等基准数据集上。最初的说法表明 LLM 实现了最先进的压缩效果,甚至超越了传统算法。 然而,关于公平比较的争论浮出水面。人们担心基于 LLM 的压缩是否准确地考虑了模型本身的大小(解压缩器)——这是 Hutter Prize 等基准测试中的一个关键因素。虽然一些 LLM 显示出潜力,特别是 Fabrice Bellard 的 `nncp`,但其他 LLM 在包含解压缩器大小时并没有优于既定方法。 这场讨论凸显了将 LLM 应用于压缩的挑战,包括上下文窗口大小的限制以及主要适用于文本数据的局限性。尽管存在这些限制,这个想法仍然引起了很多人的共鸣,并激励人们进一步探索使用 LLM 进行文件系统级别的压缩——这是某些系统工程师长期以来的雄心。

欧盟理事会就备受争议的儿童性虐待监管条例(CSAR),通常被称为“聊天控制”,达成了一项期待已久的协议。经过三年多的辩论,该法案尽管存在重大的隐私问题,仍获得通过。 争议的核心在于规定要求消息服务——即使是端到端加密的服务——扫描儿童性虐待内容(CSAM)。尽管最新版本使这种扫描成为*自愿的*,但隐私专家仍然深感担忧,认为存在侵犯基本权利和破坏强加密的风险。 该条例还为在线服务引入了风险等级,可能会迫使高风险平台为风险缓解技术做出贡献。一个新的欧盟机构将负责监督实施。 尽管丹麦司法部长保证将打击虐待行为,但批评人士认为该协议为加强监控铺平了道路。理事会现在将与欧洲议会进入谈判,以最终确定该条例,面临着在保护儿童与数字隐私之间取得平衡的挑战。

谷歌最近在Pixel 10上增加的类似AirDrop的功能,名为“快速分享”,并非变通方案,而是欧盟新法规的直接结果。《数字市场法案》(DMA) 迫使苹果采用可互操作的无线标准,特别是Wi-Fi Aware,用于文件共享——这是该公司放弃为其AirDrop提供动力的专有系统的举措。 这一旨在提高竞争力的改变,无意中为Android设备利用相同技术打开了大门。虽然谷歌并未与苹果直接合作,但DMA的要求在不损害安全性的前提下,实现了“快速分享”的功能。 然而,苹果正在积极寻求废除DMA,欧盟也在重新考虑其对科技监管的方法,这意味着Pixel 10用户之间的跨平台能力并非长期保证。 这项优势源于监管压力,不一定预示着未来科技巨头之间的合作。

这次Hacker News讨论围绕着一篇关于Google Pixel 8可能支持AirDrop的提交,很可能受到欧盟《数字市场法案》(DMA)的影响。最初的帖子被标记为重复,引发了用户之间的争论。 争论的核心在于什么构成“重复”讨论。一些用户认为标记过于严格,扼杀了新的讨论,尤其是当之前的讨论已经过去几天了。另一些人,包括像“tomhow”这样的版主,则为这种做法辩护,解释说应该将相同的话题合并,*除非*有新的信息或分析。 在这种情况下,虽然文章本身不是新的(来自Ars Technica的转载),但一些人认为DMA的背景值得进行新的讨论。最终,这次对话凸显了在像Hacker News这样大型在线论坛中管理重复话题和促进有效讨论的挑战。还提供了一个指向更广泛讨论线程的链接。

台湾正体现了一种日益增长的趋势:企业通过提供小额奖励来积极推广应用程序下载。然而,交出你的手机或下载这些应用程序,除了恼人的广告外,还存在重大风险。 作者警告了“监控资本主义”,在这种模式下,公司收集数据以实施“监控定价”——根据个人 perceived 的财务状况收取不同的费用。这会将权力从市场转移到公司手中,由公司决定商品价值,而不是稳定的经济。 同样令人担忧的是,应用程序服务条款中隐藏着“绑定仲裁”条款。这些条款迫使用户进入私下、公司控制的争议解决程序,绕过法院系统,并可能剥夺法律权利——正如迪士尼与一起意外死亡索赔案件中所悲剧性地说明的那样。 作者预测这种趋势将会恶化,扩展到自动驾驶汽车、智能设备,甚至新闻订阅等场景。核心建议是:**不要下载该应用程序。** 通过抵制这些压力来保护你的数据和权利。

更多

联系我们 contact @ memedata.com