1. 首页
  2. 新闻

AI 技术创新,DeepSeek 之外的应用侧新叙事

图片来源:由无界AI生成

2025年的春节假期刚刚过去,但是DeepSeek引发的冲击波仍然余温未散。

通过FP8训练、多词元预测、改良MOE架构、多头潜在注意力机制(MLA)、无SFT强化学习等方法,DeepSeek-V3以极低的训练成本实现了超越Qwen2.5-72B和Llama-3.1-405B等顶尖开源模型和部分闭源模型的性能,DeepSeek-R1更是表现出了超越OpenAI o1的推理效果。

DeepSeek系列模型的成功,为原来以算力为核心逻辑驱动的大模型行业开辟了新的道路,让全球的基础型大模型迈上了一个崭新的台阶。

然而,在DeepSeek等以“技术叙事”为主旋律的基础型大模型之外,还有一类大模型的研发进展值得关注,那就是围绕核心产品、核心场景进行AI技术创新的应用型大模型。

中国一直以来就是应用大国。

2024年,在算力供给逐渐跟上、推理价格大幅下降的大背景下,国产AI应用异军突起——无论是文生图、文生视频领域的即梦AI、妙鸭相机、快手可灵,还是AI搜索领域的纳米搜索(原360AI搜索)、天工AI搜索,还是AI陪伴领域的星野、猫箱,抑或是AI助手类的豆包、夸克、Kimi、通义等,都在2024年迎来了用户量的爆发。

这一个个AI应用,离不开背后模型能力的支撑。对AI应用来说,应用型大模型比拼的不是模型参数,而是应用效果。

例如此前Kimi之所以能够在短时间内获得较高的关注度,与其背后大模型的长文本读取和解析能力密不可分;夸克的2亿用户量和7000万月活得益于其背后夸克大模型的“用户友好”;可灵AI强大的文生视频、图生视频功能则依赖可灵大模型的支持。

基础型大模型的进化还远未到尽头,但随着2025年越来越多的公司开始布局AI应用,应用型大模型的发展将会是配合AI应用全面爆发的必要前提。

1.为什么大厂做AI应用更有优势

随着大模型技术的成熟与突破、算力基础设施的日渐完善、国家政策的持续加码、Sora/Suno等杀手级应用的不断涌现、AI Agent/具身智能/AI玩具/AI眼镜等领域投融资的强劲增长,2025年是AI应用的爆发年,几乎已经成为科技界的广泛共识。

并且这种共识还因DeepSeek的火爆而加速。因为DeepSeek将行业基础模型能力水位推高,给AI应用营造了一个更好的发展环境。

据「甲子光年」观察,2024下半年至今,高瓴资本、经纬创投、百度风投、英诺等知名投资机构加大了对于AI应用的投资力度,尤其是瞄准AI应用领域的早期项目下注;有投资人表示,截至2024年末,一级市场真实获得融资的AI应用项目数量,比实际公布出来的项目数量至少多两倍。

分享链接: - 区块链日报

免责声明:本站所有内容不构成投资建议,币市有风险、投资请慎重。

相关推荐