Wink Pings

发现精彩内容,分享生活点滴

连接你我精彩世界

量化模型评测:我想为不同精度的模型做个基准测试

受社区讨论启发,计划建立一个量化模型基准测试,评估精度损失与VRAM、性能增益的关系,涵盖编程、数学、翻译、常识等领域。

2025-10-22 21:03:33阅读全文

用 Ollama 写论文?别指望一键生成

尝试用 AI 工具写长论文时,常遇到内容重复或中途中断的问题。调整上下文长度、分步构建内容框架或许更有效,但别指望完全替代自己的思考和修改。

2025-10-22 21:01:44阅读全文

DeepSeek-OCR实测:压缩比与准确率的平衡点

测试DeepSeek-OCR发现,10倍压缩下仍能保持97%准确率,视觉token压缩效果显著,但超过12倍后准确率急剧下降。

2025-10-22 20:04:31阅读全文

超级智能的7种认知超能力

Nick Bostrom在《超级智能》中描绘了超人工智能可能具备的七种远超人类的认知能力,从战略规划到社交操纵,每一种都令人深思。

2025-10-22 20:01:36阅读全文

Perplexity那份42页的工作指南,以及一场小小的网络闹剧

一份号称Perplexity内部流出的AI工作指南在X上引发关注,但很快被证明只是一份公开的产品宣传材料。事情本身不大,但背后的互动模式值得玩味。

2025-10-22 19:29:32阅读全文

LoRA微调模型推理提速1.5倍:我们如何解决PEFT服务的性能瓶颈

Databricks团队通过定制化推理引擎,在保持模型质量的同时,将LoRA微调模型的推理吞吐量提升至开源引擎的1.5倍。关键在于量化策略、内核重叠和流式多处理器分区等技术创新。

2025-10-22 19:29:32阅读全文

我们的人机协同翻译流程:让AI干体力活,人做灵魂注入

分享一套经过实践检验的翻译工作流,通过AI与人工的精细分工,在保证质量的同时大幅提升效率。

2025-10-22 19:29:32阅读全文

OCR 模型评测:当 PaddleOCR-VL 对上 MinerU2.5、MonkeyOCR 和 GPT-4o

我们对比了 PaddleOCR-VL 与 MinerU2.5、MonkeyOCR、GPT-4o 在复杂版式文档上的表现。结果发现,PaddleOCR-VL 在布局检测准确率、阅读顺序一致性方面表现稳健,而其他模型出现了元素遗漏、版式误判甚至内容幻觉的问题。

2025-10-22 19:29:32阅读全文

Lovart AI:一个整合了图像、视频和3D生成的AI设计工具

Lovart AI作为首个搭载Seedream 4.0和Nano Banana的AI设计助手,将主流图像、视频、3D模型生成能力集于一身,支持图片编辑、音乐生成和语音合成。本文通过实际案例展示了其在3D模型制作、室内设计和电商素材生成方面的应用。

2025-10-22 19:29:32阅读全文

开源是另一种形式的人才垄断

和姚冬老师聊到一个观点:开源本质是人才垄断。通用压缩算法都开源,但顶尖研究员集中在中美等少数国家,其他国家难以追赶。大模型领域也在重复这个模式。

2025-10-22 19:29:32阅读全文