发现精彩内容,分享生活点滴
连接你我精彩世界
量化模型评测:我想为不同精度的模型做个基准测试
受社区讨论启发,计划建立一个量化模型基准测试,评估精度损失与VRAM、性能增益的关系,涵盖编程、数学、翻译、常识等领域。
用 Ollama 写论文?别指望一键生成
尝试用 AI 工具写长论文时,常遇到内容重复或中途中断的问题。调整上下文长度、分步构建内容框架或许更有效,但别指望完全替代自己的思考和修改。
DeepSeek-OCR实测:压缩比与准确率的平衡点
测试DeepSeek-OCR发现,10倍压缩下仍能保持97%准确率,视觉token压缩效果显著,但超过12倍后准确率急剧下降。
超级智能的7种认知超能力
Nick Bostrom在《超级智能》中描绘了超人工智能可能具备的七种远超人类的认知能力,从战略规划到社交操纵,每一种都令人深思。
Perplexity那份42页的工作指南,以及一场小小的网络闹剧
一份号称Perplexity内部流出的AI工作指南在X上引发关注,但很快被证明只是一份公开的产品宣传材料。事情本身不大,但背后的互动模式值得玩味。
LoRA微调模型推理提速1.5倍:我们如何解决PEFT服务的性能瓶颈
Databricks团队通过定制化推理引擎,在保持模型质量的同时,将LoRA微调模型的推理吞吐量提升至开源引擎的1.5倍。关键在于量化策略、内核重叠和流式多处理器分区等技术创新。
OCR 模型评测:当 PaddleOCR-VL 对上 MinerU2.5、MonkeyOCR 和 GPT-4o
我们对比了 PaddleOCR-VL 与 MinerU2.5、MonkeyOCR、GPT-4o 在复杂版式文档上的表现。结果发现,PaddleOCR-VL 在布局检测准确率、阅读顺序一致性方面表现稳健,而其他模型出现了元素遗漏、版式误判甚至内容幻觉的问题。
Lovart AI:一个整合了图像、视频和3D生成的AI设计工具
Lovart AI作为首个搭载Seedream 4.0和Nano Banana的AI设计助手,将主流图像、视频、3D模型生成能力集于一身,支持图片编辑、音乐生成和语音合成。本文通过实际案例展示了其在3D模型制作、室内设计和电商素材生成方面的应用。
开源是另一种形式的人才垄断
和姚冬老师聊到一个观点:开源本质是人才垄断。通用压缩算法都开源,但顶尖研究员集中在中美等少数国家,其他国家难以追赶。大模型领域也在重复这个模式。