1. 首页
  2. 新闻

DeepSeek 掀起低成本革命,这个国产大模型怎么兼顾高精度、低能耗?

来源:光锥智能

图片来源:由无界AI生成

2025年开年,DeepSeek在国内外大模型行业掀起了地震。除了深度推理模型DeepSeek-R1在回答问题上的表现优异之外,DeepSeek的存在,给国内大模型圈注入了紧张又鲜活的空气。

其一,凭借技术优势,DeepSeek一举进入国际大模型头部梯队,这给国内大模型公司看到了弯道超车的可能性。

其二,DeepSeek的训练成果,打破了算力受限的问题,证明通过算法优化,同样可以以低算力训练出高质量的模型。

当算力“卡脖子”的隐忧被放下,兼顾能耗和精度的大模型应该解决哪些问题?在这个层面上,国内大模型公司纷纷交出了各自的答卷。

最近,由中国科学院自动化所孵化的AI企业中科闻歌发布的雅意大模型旗舰版——YAYI-Ultra在破解大模型落地"精度-能耗"困局前给出了自己的答案。

作为覆盖全球100+模型的权威评测体系,OpenCompass榜单历来是观察大模型技术路线的"晴雨表",在其近日发布的OpenCompass大模型公开学术榜单中,中科闻歌YAYI-Ultra,以64.5分首次闯入前十,成为TOP10中五个中国大模型之一。

在OpenCompass最新大语言模型公开学术实时榜单中,YAYI-Ultra排名综合得分64.5,排名第十,其中:

代码生成:LiveCodeBench排名第五,表现优于GPT-4o-20241120版本

复杂指令理解:IFEval排名第九

知识推理能力:MMLU-Pro排名第九

在侧重中文理解的C-Eval评测中,YAYI-Ultra在允许自主验证的公开访问榜单位列第二,展现了在中文场景下的技术优势。

一手实测:超长文输出
复杂任务规划精准拿捏

根据官方信息,YAYI-Ultra在图表理解、复杂任务、长文理解与生成方面表现突出,我们立马上手从六个维度(多模态图表深度理解、复杂图像理解、复杂任务智能规划(Function Call)、数据统计分析及超长文本理解与生成)实测下YAYI-Ultra表现到底如何。

01 视觉理解再升级:懂语言,更懂图表

上来我们先来读个图表试试。

prompt:2000年前后,哪个价格区间的物业费占比变化最多?

分享链接: - 区块链日报

免责声明:本站所有内容不构成投资建议,币市有风险、投资请慎重。

相关推荐