DeepSeek 的“服务器繁忙”让所有人抓狂，背后究竟是怎么回事？

图片来源：由无界AI生成

DeepSeek频频回复的“服务器繁忙，请稍后再试”，正在让各地用户抓狂。

此前不太被大众所知的DeepSeek，因2024年12月26日推出对标GPT 4o的语言模型V3而声名鹊起。在1月20日DeepSeek又发布对标OpenAI o1的语言模型R1，之后因为“深度思考”模式生成的答案优质度高，以及其创新揭示出模型训练前期成本可能骤降的积极信号，令该公司和应用彻底出圈。之后，DeepSeek R1就一直在经历拥堵，它的联网搜索功能间歇性瘫痪，深度思考模式则高频率提示“服务器繁忙”，此类现象让大量用户倍感困扰。

十几日前，DeepSeek开始经历服务器中断，1月27日中午，DeepSeek官网已数次显示“deepseek网页/api不可用”，当日，DeepSeek成为周末期间iPhone下载量最高的应用程序，在美区下载榜超越了ChatGPT。

2月5日，DeepSeek移动端上线26天，日活突破4000万，ChatGPT移动端日活为5495万，DeepSeek为ChatGPT的74.3%。几乎在DeepSeek走出陡峭增长曲线的同时，关于其服务器繁忙的吐槽纷至沓来，全世界用户都开始遭遇问几个问题就发生宕机的不便，各类替代访问也开始出现，比如DeepSeek的平替网站，各大云服务商、芯片厂商和基础设施公司都纷纷上线，个人部署教程也到处都是。但人们的抓狂却没有缓解：全球几乎所有重要厂商都宣称支持部署了DeepSeek，但各地用户却依然在吐槽服务的不稳定。

这背后到底发生了什么？

1、习惯了ChatGPT的人们，受不了打不开的DeepSeek

人们对“DeepSeek服务器繁忙”的不满，来自于此前以ChatGPT为主的AI顶流应用们，甚少出现卡顿。

自OpenAI服务推出以来，ChatGPT虽然也经历了几次P0级别（最严重的事故级别）宕机事故，但总体来说，它相对可靠，已然在创新和稳定性之间找到平衡，并逐步成为类似传统云服务的关键组成部分。

ChatGPT大范围宕机次数并不算多

ChatGPT的推理过程相对稳定，包括编码和解码两个步骤，编码阶段把输入文本转换成向量，向量包含输入文本的语义信息，解码阶段，ChatGPT使用先前生成的文本作为上下文，通过Transformer模型生成下一个单词或短语，直到生成符合需求的完整语句，大模型本身属于Decoder（解码器）架构，解码阶段就是一个个token（大模型处理文本时的最小单位）的输出过程，每向ChatGPT提问一次，就启动一次推理流程。

分享链接： - 区块链日报

免责声明：本站所有内容不构成投资建议，币市有风险、投资请慎重。

相关推荐