DeepSeek 掀起低成本革命,这个国产大模型怎么兼顾高精度、低能耗?
来源:光锥智能
图片来源:由无界AI生成
2025年开年,DeepSeek在国内外大模型行业掀起了地震。除了深度推理模型DeepSeek-R1在回答问题上的表现优异之外,DeepSeek的存在,给国内大模型圈注入了紧张又鲜活的空气。
其一,凭借技术优势,DeepSeek一举进入国际大模型头部梯队,这给国内大模型公司看到了弯道超车的可能性。
其二,DeepSeek的训练成果,打破了算力受限的问题,证明通过算法优化,同样可以以低算力训练出高质量的模型。
当算力“卡脖子”的隐忧被放下,兼顾能耗和精度的大模型应该解决哪些问题?在这个层面上,国内大模型公司纷纷交出了各自的答卷。
最近,由中国科学院自动化所孵化的AI企业中科闻歌发布的雅意大模型旗舰版——YAYI-Ultra在破解大模型落地"精度-能耗"困局前给出了自己的答案。
作为覆盖全球100+模型的权威评测体系,OpenCompass榜单历来是观察大模型技术路线的"晴雨表",在其近日发布的OpenCompass大模型公开学术榜单中,中科闻歌YAYI-Ultra,以64.5分首次闯入前十,成为TOP10中五个中国大模型之一。
在OpenCompass最新大语言模型公开学术实时榜单中,YAYI-Ultra排名综合得分64.5,排名第十,其中:
代码生成:LiveCodeBench排名第五,表现优于GPT-4o-20241120版本
复杂指令理解:IFEval排名第九
知识推理能力:MMLU-Pro排名第九
在侧重中文理解的C-Eval评测中,YAYI-Ultra在允许自主验证的公开访问榜单位列第二,展现了在中文场景下的技术优势。
复杂任务规划精准拿捏
根据官方信息,YAYI-Ultra在图表理解、复杂任务、长文理解与生成方面表现突出,我们立马上手从六个维度(多模态图表深度理解、复杂图像理解、复杂任务智能规划(Function Call)、数据统计分析及超长文本理解与生成)实测下YAYI-Ultra表现到底如何。
01 视觉理解再升级:懂语言,更懂图表
上来我们先来读个图表试试。
prompt:2000年前后,哪个价格区间的物业费占比变化最多?
分享链接: - 区块链日报
免责声明:本站所有内容不构成投资建议,币市有风险、投资请慎重。