Wink Pings

发现精彩内容,分享生活点滴

连接你我精彩世界

工具输出压缩:让AI代理少花冤枉钱,节省60-90%的上下文成本

开发团队发现AI代理最大的成本不是模型本身,而是工具输出占用的庞大上下文。他们开源了一个压缩工具,能智能保留关键信息,大幅降低token消耗。

2026-01-13 17:11:10阅读全文

英伟达新研究:让LLM在推理时学习,实现恒定推理延迟

英伟达最新研究TTT-E2E让大语言模型能够在推理时通过上下文学习,将信息压缩到权重中,解决了长上下文场景下的延迟和性能问题。

2026-01-13 17:08:33阅读全文

GPT-5.2 Pro驱动的智能体在数学优化中取得突破,刷新球面编码记录

一个由GPT-5.2 Pro驱动的自主研究智能体在实验数学领域取得新进展,优化了球面编码问题中的已知最佳解,其策略突破了此前难以优化的“卡住”配置。

2026-01-13 17:02:13阅读全文

Anthropic发布交互式提示工程教程:从入门到高阶的实用指南

Anthropic在GitHub开源了一套结构清晰的交互式提示工程教程,覆盖从基础提示结构到复杂提示设计的完整学习路径。

2026-01-13 16:19:52阅读全文

当AI尝试构建行走巨兽: Strandbeest模拟器的挑战与局限

开发者用Gemini 3和Nano Banana构建了仿生步行机模拟器,测试AI处理复杂连杆系统的能力。结果发现,即使是最先进的模型,在从单腿扩展到多腿系统时仍会遇到困难。

2026-01-13 18:10:59阅读全文

一张图生成360度视图:Freepik新工具Change Camera实测

Freepik推出AI工具Change Camera,仅需一张图片即可生成完整360度视角。这对设计师和内容创作者意味着什么?

2026-01-13 16:15:21阅读全文

递归语言模型RLM:让AI学会自我迭代的推理库

Meta PyTorch团队开源了递归语言模型推理库,支持多种沙盒环境,让语言模型能够像程序员一样分解和递归处理复杂任务。

2026-01-13 16:14:26阅读全文

SkillsBench首周数据:技能加持让AI代理性能提升27%,社区两周突破440人

首个AI代理技能基准测试SkillsBench公布初期结果,显示技能可显著提升模型性能,Codex GPT-5.2和Claude Code Opus 4.5分别提升13%和27%。两周内社区快速扩张至440多名成员,52个真实世界任务已进入测试流程。

2026-01-13 16:12:48阅读全文

Vercel发布Agent Browser:给AI一双操作网页的手

专为AI代理设计的浏览器自动化工具,零配置、高性能,让模型从理解信息转向执行操作。

2026-01-13 16:11:05阅读全文

写作风格克隆新思路:从句子节奏入手,而非词汇模仿

一位Reddit用户分享了一种通过分析句子节奏、标点密度和词汇复杂度来克隆写作风格的方法,强调风格的本质在于文本的"DNA"而非表面词汇。

2026-01-13 16:10:25阅读全文