发现精彩内容,分享生活点滴
连接你我精彩世界
工具输出压缩:让AI代理少花冤枉钱,节省60-90%的上下文成本
开发团队发现AI代理最大的成本不是模型本身,而是工具输出占用的庞大上下文。他们开源了一个压缩工具,能智能保留关键信息,大幅降低token消耗。
2026-01-13 17:11:10阅读全文
英伟达新研究:让LLM在推理时学习,实现恒定推理延迟
英伟达最新研究TTT-E2E让大语言模型能够在推理时通过上下文学习,将信息压缩到权重中,解决了长上下文场景下的延迟和性能问题。
2026-01-13 17:08:33阅读全文
GPT-5.2 Pro驱动的智能体在数学优化中取得突破,刷新球面编码记录
一个由GPT-5.2 Pro驱动的自主研究智能体在实验数学领域取得新进展,优化了球面编码问题中的已知最佳解,其策略突破了此前难以优化的“卡住”配置。
2026-01-13 17:02:13阅读全文
Anthropic发布交互式提示工程教程:从入门到高阶的实用指南
Anthropic在GitHub开源了一套结构清晰的交互式提示工程教程,覆盖从基础提示结构到复杂提示设计的完整学习路径。
2026-01-13 16:19:52阅读全文
当AI尝试构建行走巨兽: Strandbeest模拟器的挑战与局限
开发者用Gemini 3和Nano Banana构建了仿生步行机模拟器,测试AI处理复杂连杆系统的能力。结果发现,即使是最先进的模型,在从单腿扩展到多腿系统时仍会遇到困难。
2026-01-13 18:10:59阅读全文
一张图生成360度视图:Freepik新工具Change Camera实测
Freepik推出AI工具Change Camera,仅需一张图片即可生成完整360度视角。这对设计师和内容创作者意味着什么?
2026-01-13 16:15:21阅读全文
递归语言模型RLM:让AI学会自我迭代的推理库
Meta PyTorch团队开源了递归语言模型推理库,支持多种沙盒环境,让语言模型能够像程序员一样分解和递归处理复杂任务。
2026-01-13 16:14:26阅读全文
SkillsBench首周数据:技能加持让AI代理性能提升27%,社区两周突破440人
首个AI代理技能基准测试SkillsBench公布初期结果,显示技能可显著提升模型性能,Codex GPT-5.2和Claude Code Opus 4.5分别提升13%和27%。两周内社区快速扩张至440多名成员,52个真实世界任务已进入测试流程。
2026-01-13 16:12:48阅读全文
写作风格克隆新思路:从句子节奏入手,而非词汇模仿
一位Reddit用户分享了一种通过分析句子节奏、标点密度和词汇复杂度来克隆写作风格的方法,强调风格的本质在于文本的"DNA"而非表面词汇。
2026-01-13 16:10:25阅读全文