DeepSeek 掀起低成本革命，这个国产大模型怎么兼顾高精度、低能耗？

来源：光锥智能

图片来源：由无界AI生成

2025年开年，DeepSeek在国内外大模型行业掀起了地震。除了深度推理模型DeepSeek-R1在回答问题上的表现优异之外，DeepSeek的存在，给国内大模型圈注入了紧张又鲜活的空气。

其一，凭借技术优势，DeepSeek一举进入国际大模型头部梯队，这给国内大模型公司看到了弯道超车的可能性。

其二，DeepSeek的训练成果，打破了算力受限的问题，证明通过算法优化，同样可以以低算力训练出高质量的模型。

当算力“卡脖子”的隐忧被放下，兼顾能耗和精度的大模型应该解决哪些问题？在这个层面上，国内大模型公司纷纷交出了各自的答卷。

最近，由中国科学院自动化所孵化的AI企业中科闻歌发布的雅意大模型旗舰版——YAYI-Ultra在破解大模型落地"精度-能耗"困局前给出了自己的答案。

作为覆盖全球100+模型的权威评测体系，OpenCompass榜单历来是观察大模型技术路线的"晴雨表"，在其近日发布的OpenCompass大模型公开学术榜单中，中科闻歌YAYI-Ultra，以64.5分首次闯入前十，成为TOP10中五个中国大模型之一。

在OpenCompass最新大语言模型公开学术实时榜单中，YAYI-Ultra排名综合得分64.5，排名第十，其中：

代码生成：LiveCodeBench排名第五，表现优于GPT-4o-20241120版本

复杂指令理解：IFEval排名第九

知识推理能力：MMLU-Pro排名第九

在侧重中文理解的C-Eval评测中，YAYI-Ultra在允许自主验证的公开访问榜单位列第二，展现了在中文场景下的技术优势。

一手实测：超长文输出
复杂任务规划精准拿捏

根据官方信息，YAYI-Ultra在图表理解、复杂任务、长文理解与生成方面表现突出，我们立马上手从六个维度（多模态图表深度理解、复杂图像理解、复杂任务智能规划（Function Call）、数据统计分析及超长文本理解与生成）实测下YAYI-Ultra表现到底如何。

01 视觉理解再升级：懂语言，更懂图表

上来我们先来读个图表试试。

prompt：2000年前后，哪个价格区间的物业费占比变化最多？

分享链接： - 区块链日报

免责声明：本站所有内容不构成投资建议，币市有风险、投资请慎重。