AI 技术创新，DeepSeek 之外的应用侧新叙事

• 2025-02-14 13:46:45 • 新闻 •

图片来源：由无界AI生成

2025年的春节假期刚刚过去，但是DeepSeek引发的冲击波仍然余温未散。

通过FP8训练、多词元预测、改良MOE架构、多头潜在注意力机制（MLA）、无SFT强化学习等方法，DeepSeek-V3以极低的训练成本实现了超越Qwen2.5-72B和Llama-3.1-405B等顶尖开源模型和部分闭源模型的性能，DeepSeek-R1更是表现出了超越OpenAI o1的推理效果。

DeepSeek系列模型的成功，为原来以算力为核心逻辑驱动的大模型行业开辟了新的道路，让全球的基础型大模型迈上了一个崭新的台阶。

然而，在DeepSeek等以“技术叙事”为主旋律的基础型大模型之外，还有一类大模型的研发进展值得关注，那就是围绕核心产品、核心场景进行AI技术创新的应用型大模型。

中国一直以来就是应用大国。

2024年，在算力供给逐渐跟上、推理价格大幅下降的大背景下，国产AI应用异军突起——无论是文生图、文生视频领域的即梦AI、妙鸭相机、快手可灵，还是AI搜索领域的纳米搜索（原360AI搜索）、天工AI搜索，还是AI陪伴领域的星野、猫箱，抑或是AI助手类的豆包、夸克、Kimi、通义等，都在2024年迎来了用户量的爆发。

这一个个AI应用，离不开背后模型能力的支撑。对AI应用来说，应用型大模型比拼的不是模型参数，而是应用效果。

例如此前Kimi之所以能够在短时间内获得较高的关注度，与其背后大模型的长文本读取和解析能力密不可分；夸克的2亿用户量和7000万月活得益于其背后夸克大模型的“用户友好”；可灵AI强大的文生视频、图生视频功能则依赖可灵大模型的支持。

基础型大模型的进化还远未到尽头，但随着2025年越来越多的公司开始布局AI应用，应用型大模型的发展将会是配合AI应用全面爆发的必要前提。

1.为什么大厂做AI应用更有优势

随着大模型技术的成熟与突破、算力基础设施的日渐完善、国家政策的持续加码、Sora/Suno等杀手级应用的不断涌现、AI Agent/具身智能/AI玩具/AI眼镜等领域投融资的强劲增长，2025年是AI应用的爆发年，几乎已经成为科技界的广泛共识。

并且这种共识还因DeepSeek的火爆而加速。因为DeepSeek将行业基础模型能力水位推高，给AI应用营造了一个更好的发展环境。

据「甲子光年」观察，2024下半年至今，高瓴资本、经纬创投、百度风投、英诺等知名投资机构加大了对于AI应用的投资力度，尤其是瞄准AI应用领域的早期项目下注；有投资人表示，截至2024年末，一级市场真实获得融资的AI应用项目数量，比实际公布出来的项目数量至少多两倍。

分享链接： - 区块链日报

免责声明：本站所有内容不构成投资建议，币市有风险、投资请慎重。