分享好友 最新资讯首页 最新资讯分类 切换频道
Deepseek爆火之后的现状如何?
2025-07-27 12:28
图片

这份报告深入探讨了及其在人工智能领域的竞争和市场动态,内容涵盖发布影响、技术进步、用户使用趋势、token经济学、硬件限制、竞争格局等。先把原文的内容大概总结一下。


SemiAnalysis原文总结


1. DeepSeek R1 的发布与市场影响

DeepSeek R1 自 2025 年 1 月 20 日推出已超过 150 天,其性能被认为与 OpenAI 的推理模型相当,但其定价策略极具颠覆性:输入/输出token价格仅为 10 美元。这一低价策略震撼了全球 AI 市场,引发了广泛讨论。许多人担心 DeepSeek(及其背后的中国 AI 生态)可能会通过低定价将 AI 模型商品化,从而压低整个行业的价格水平。

事实证明,这种担忧并非空穴来风。DeepSeek R1 的发布后,推理模型的价格普遍下降,例如 OpenAI 的输出token价格下降了 8 美元以上,迫使其调整旗舰模型的价格。这种价格战可能对行业的可持续发展构成挑战,因为过低的定价可能无法覆盖高昂的研发和计算成本。

根据 Reuters(2025-05-29)的报道,DeepSeek 的低成本和短开发时间震惊了全球市场,导致美国科技股价值蒸发数十亿美元,投资者重新评估 AI 巨头的估值。

2. 技术进步与强化学习

模型通过扩展强化学习(RL)得到了显著升级,尤其在编码领域表现突出。强化学习被视为 AI 模型发展的新范式,它不仅提升了性能,还使模型更加高效和实惠。

SWE-Bench显示,DeepSeek R1 在降低成本的同时,性能得到了显著提升。2025 年 5 月 29 日,DeepSeek 发布了 R1-0528 升级版,通过增加计算资源和算法优化,显著提升了推理深度。在 AIME 2025 测试中,准确率从 70% 提升至 87.5%,每题平均使用token从 12K 增加至 23K,显示了更强的推理能力。

然而,这种改进并非没有代价。报告指出,DeepSeek 通过增加延迟和降低吞吐量来实现低成本,这在一定程度上损害了用户体验。

3. 用户使用趋势

尽管 DeepSeek 的模型(如 R1 和 V3)在第三方托管平台上的使用量激增,自首次发布以来增长近 20 倍,但其自托管模型的用户增长却较为乏力。这可能是因为用户更倾向于使用其他开源提供商的服务,尽管 DeepSeek 的定价看似非常便宜。

这一现象反映了用户对服务质量、稳定性和体验的重视超过了单纯的价格因素。根据 TechTarget的报道,DeepSeek 的移动应用曾短暂超越 OpenAI 的 ChatGPT 成为 Apple App Store 排行榜第一,但其直接用户增长随后放缓,更多用户转向第三方托管服务。

4. token经济学(Tokenomics)

AI 模型的token经济学,即模型提供者在定价和性能之间的权衡。关键性能指标包括:

DeepSeek 的策略是通过高批量处理(在单个 GPU 上同时处理更多用户)来降低每token成本,但这导致了较高的延迟和较低的吞吐量。相比之下,其他提供商在相同价格下提供了更好的用户体验,这可能是 DeepSeek 自托管模型用户增长缓慢的原因。

以下是关键性能指标的对比表:

提供商
延迟(毫秒)
吞吐量(token/秒)
上下文窗口(token)
每token成本(美元)
DeepSeek R1
中等(64K)
0.01
Parsail
0.01
Microsoft Azure
中等
中等
0.015

5. 硬件与计算限制

DeepSeek 的低成本策略依赖于高批量处理,这减少了推理计算资源的使用。报告指出,这种策略反映了 DeepSeek 的主要目标:不是追求盈利或提升用户体验,而是通过开源策略扩大全球影响力,推动通用人工智能()的发展。

然而,中国在规模化推理模型方面面临出口管制的限制。DeepSeek R2 的延误传闻被认为与出口管制有关。尽管如此,其训练能力并未受到太大影响,最新版本 R1-0528 在编码领域表现显著提升。这表明中国在 AI 训练方面仍有较强的技术能力,但推理规模化可能需要克服硬件和政策上的障碍。


分析两个问题


下面我们来聊两个问题。

在这篇报告中,这两个图,虽然大家没有SemiAnalysis这种定量的数据,但我们也能感受到。

图片

图片

Deepseek的使用量其实是越来越低的,这个问题文中只是从token经济学的角度进行了分析,而且是跟其他几个国外的大模型进行对比。但我认为其实少了很重要的一部分。

就笔者而言,自从豆包和腾讯元宝接入Deepseek后,我就再也没用过Deepseek官方的工具。既然都是一样的模型,腾讯和字节服务器响应又快,没必要跟大家去挤Deepseek的服务器,后面习惯了豆包和元宝后,甚至Deepseek的手机app也给删了,再也没用过。

而且笔者绝对算是AI的重度用户,除了平时代码中可能会用到个别AI平台的api需要费用之外,豆包和元宝从来没有花过钱。即便是豆包和元宝,我用的依然还是Deepseek的模型,但这部分的token,SemiAnalysis的数据中不会统计。

SemiAnalysis的这篇分析还提到了Deepseek R2,之前the information的消息说Deepseek R2的delay是由于出口管制,这个问题在星球中也讨论过。

我当时认为R2 delay跟出口管制关系不大。 在Deepseek刚爆火的时候,网上就很多机构分析过Deepseek之前通过合规渠道买到的用于训练的高端服务器的数量,当初合规渠道能买到的最高端的就是H20,也主要是用于推理,而且R2的训练早就开始了,从开始下单H20,再到部署、跑起来,都是需要时间的。当然还有些这边不方便说的原因,大家应该也都能想到。

SA认为出口管制对Deepseek训练的影响不大,而且影响了推理能力,也就是他们有没有足够的GPU,无法提供更好的服务。R1 - 0528 相较于之前的模型有显著进步,尤其在编码领域。此外,还有很多与计算约束无关的原因可能导致其训练进度放缓,比如遵守额外的审查和安全要求。

最新文章
潮讯:华为鸿蒙电脑将支持侧载;OPPO测试真磁吸无线充;华为智选品牌升级为“鸿蒙智选”;苹果自适应电源模式只有部分机型能用
之前跟大伙分享过几个安卓必备宝藏 App。不少机友直呼没看过瘾,别急,机哥今天就分享几个更猛的——在华为开发者大会 2025 电脑
通山大畈镇念好“三字”经 打造示范镇
走进大畈,蓝天白云、青山碧水,大片水果采摘园如雨后春笋般拨地而起,绿油油的油茶基地鲜绿可人;走进村落,“徽派建筑”整齐坐
伟恒企业集团
伟恒集团以现代农业开发为主体,集商业贸易、绿色食品配送等多元化经营,是一家致力于优化农业产业结构、改善绿色有机食品的培育
恒信泰富中国
我是恒信泰富中国的商业顾问: 苏先生,我们公司恒信泰富中国地址在广东深圳,具体地址是:深圳市福田区彩田南路2022号中深花园大厦
轻松健康集团亮相2025中国互联网大会 以 AI 重构健康保障全链条
【环球网财经综合报道】2025年7月23日,2025中国互联网大会在北京国家会议中心正式开幕。作为中国互联网行业的年度盛会,本届大
第十批北京老字号名单出炉!15家北京老字号品牌概览
11月23日,北京老字号协会公布了第十批北京老字号认定结果,中华书局、宝兴隆等15家企业被认定为北京老字号,其中包括古董文化、
破壁・共生・焕新:2025 广州建博会勾勒大家居十年变革蓝图
人潮涌动,新品迭出,黑科技云集。2025年7月,第27届中国建博会(广州)以30万平方米展区、近2000家展商、逾20万有商业价值的高
郑州商业“破圈”时刻,亳都·新象品牌发布:超30%首进品牌,解码郑州消费升级
□ 大河报·豫视频记者 赵志雯 张腾飞5月28日,传统风貌与现代商业交织的亳都·新象,让全国商业进入“河南时间”。当日,亳都·
顺丰、鲜生活、京东物流、万纬物流、普冷、菜鸟…谁家冷链能在2025实现新突破?
今年前三季度,冷链物流总额为6.4万亿元,同比增长4.2%。2024年冷链物流在政策支持、技术创新和市场需求的推动下,发展速度和突
吴涛及副县级以上领导集中收看纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会实况
本网讯(全媒体记者 唐成 王贤波)9月3日,纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会在北京隆重举行。县委书记、县