欢迎访问深圳市南山区数字经济产业协会!

深圳市南山区数字经济产业协会

Shenzhen Nanshan Digital Economy Industry Association

【会员动态】副会长单位智云算能 | DeepSeek智算三重奏:高并发调度、行业落地竞速与技术路线博弈
来源: | 作者:数字媒体人 | 发布时间: 2025-03-25 | 38 次浏览 | 分享到:

在生成式AI大模型(DeepSeek)爆火的背景下,智能算力中心正面临前所未有的挑战。

一方面,高并发的推理请求如潮水般涌来,运营方需要在“通用算力池”和“专用推理集群”之间权衡取舍,实现资源的高效调度。另一方面,各行各业竞相部署大模型应用,从金融风控到政务服务,但落地进度和数据安全诉求各异,直接影响部署形态。最后,支撑这些大模型推理的算力基础设施也在酝酿变革:液冷、存算一体、光电互联三大技术路径齐头并进,哪一个将成为未来智算中心降低推理成本的主力?

本文将围绕调度架构、行业应用、基础设施三个层面展开,结合最新案例与数据,剖析DeepSeek推理浪潮下智算中心的“三重奏”。



高并发推理需求下的算力平衡术:

通用与专用的博弈



随着DeepSeek-R1/V3模型的推理请求量突破亿级,单次推理的显存与算力需求直线上升。在此背景下,智算中心的算力调度就像一场大型音乐会的指挥,既要照顾到全体乐器的协同工作,又要保证每个独奏的精准演绎。


01
通用算力池的弹性之美

   通用算力池依托资源虚拟化与动态调度技术,能够灵活应对流量波动。以阿里云为例,其基于Prometheus监控系统与Ray Serve框架的弹性伸缩能力,可实时调整GPU资源分配,通过错峰处理的方式,大幅提高资源利用率。华为昇腾云则通过专家并行(EP)技术与计算-通信重叠策略,将吞吐量提升至73.7k tokens/s,展现出通用算力池在资源优化上的无限潜力。

02
专用推理集群的效能爆发

   然而,面对更高的并发需求,专用推理集群的优化能力更为显著。DeepSeek的GPUStack工具能够实现异构多机分布式推理,通过自动负载均衡,让70B模型在混合硬件环境中高效运行,成本利润率高达545%。在金融高频交易与医疗影像分析等对延迟敏感的领域,这种专用架构的表现尤为出色。

03
混合架构的未来之路

   未来的智算中心架构或将走向“混合模式”:通过智能调度系统将通用池用于长尾请求,而专用集群则聚焦于高峰期的核心业务。总的来看,在DeepSeek高并发推理场景下,“通用池”与“专用群”并非对立,而是通过虚拟化和调度策略实现协同:既用“共享大脑”提高算力利用,又按需划出“专属区域”确保服务质量。正如业内总结的那样,未来智算中心将呈现“中心训练+边缘推理”的混合部署,大型通用算力中心与专用推理节点协同工作,以兼顾效率与性能。对于智算运营者来说,这场资源调度战役打得好,既可大幅降低TCO成本,又能从容应对DeepSeek模型带来的浪涌流量。


行业竞逐大模型落地:

先行者与部署考量



随着DeepSeek等大模型能力的展现,各行业正掀起一场AI应用落地竞赛。不过,不同行业在“起跑速度”和“赛道规则”上差异明显:有的冲在最前,迅速部署试水;有的谨慎观望,稳步推进。这其中,业务价值、数据安全和监管要求成为影响部署形态的关键因素。下面我们就盘点几个率先行动的行业及其应用场景:

01
金融行业

银行、券商等对大模型表现出极高热情,投入巨资打造自身的金融大模型应用。如工商银行近期宣布完成了DeepSeek大模型的私有化部署,构建“工银智涌”AI平台,已在信贷、风控等20多个业务条线落地超过200个应用场景

截至3月中旬,已有20余家银行接入了DeepSeek系列模型,金融业AI转型呈现竞相追赶之势。典型应用包括智能风控审核、投研辅助分析、智能投顾和财报自动生成等。

然而,金融领域对大模型也最为挑剔:模型输出必须合规可靠。一些银行反馈,引入大模型后生成内容需要大量人工校对,“幻觉”错误在关键业务上仍无法容忍。因此大模型更多被定位为业务助手而非决策者,许多机构选择在内网私有部署模型以确保数据机密安全。这就导致金融业落地虽多但相对“冷静”:快速试点的同时,也在不断调优模型与风控策略,逐步扩大应用范围。

02
医疗领域

医疗领域对大模型的需求同样迫切,但受限于安全和专业性,进展相对谨慎而有序。当前大模型在医疗中的探索主要集中于诊前问询、诊断辅助和医疗文本处理等场景。例如,深圳市人民医院在今年2月实现了DeepSeek模型的院内本地部署,计划在智慧医疗、智慧服务、智慧管理方面深入探索。

另外,在医学科研和新药研发上,大模型也开始辅助文献综述、方案设计等工作。然而,由于医疗领域对准确率和责任要求极高,目前大模型多是助手定位。医院通常采取“小范围、多轮次”的验证方式,例如在单科室试点,再逐步扩展至全院,并全程由资深医生监督结果。数据隐私方面,患者数据基本不离开医院本地,有些解决方案由厂商提供大模型本地部署或专有云部署,以符合医疗数据法规。这些因素决定了医疗AI落地虽然潜力巨大,但整体节奏较为稳健,属于“谨慎的先行者”。

03
制造领域

在制造领域,大模型可用于研发设计生产运维两方面。一方面,工程技术人员可以借助DeepSeek查询庞大的技术文档和专利数据库,从中获取设计思路或问题解决方案,加速产品研发。另一方面,在工厂生产线上,模型作为智能助手可以帮助解析设备故障日志、回答一线工人的技术提问,甚至结合传感器数据进行异常检测(尽管严格来说对于实时传感数据分析,专用算法可能更有效,但大模型擅长整合多源信息和知识库)。

深圳作为制造业重镇,已在探索“大模型+制造”。依托其强大的电子产业集群,深圳不少硬科技企业正尝试让大模型下沉到工业终端。

04
政务领域

最近的标志性案例来自深圳福田区,一次性上线了70名基于DeepSeek开发的AI数智员工作为公务员助手,覆盖公文处  理、民生服务、应急管理、招商引资等240个政务场景。

不仅深圳,广州、呼和浩特、赣州、无锡、临沂等多地政府也宣布将DeepSeek模型接入政务系统,用于12345市民热线工单分类、政务知识问答、政务数据分析等,使政务服务加速迈入智能时代。

值得注意的是,政务行业非常强调数据安全和自主可控:上述地方基本都选择在政务外网或信创环境本地部署DeepSeek大模型,并针对国产CPU/GPU做适配优化。

可见,政府部门是大模型应用的先行者之一,但他们更倾向于封闭环境试点,在确保信息安全的前提下逐步扩大应用。

综合来看,金融和政务目前走在大模型落地的前列,一个有商业驱动力,一个有政策牵引力,均已投入实际应用但仍在摸索最佳实践。医疗则更加慎重,属于潜力巨大但进展平稳的领域,需要平衡创新与风险。制造业则以自己特有的方式应用着AI模型,重效果轻概念,逐步向全流程智能迈进。

不同行业对DeepSeek这类大模型的部署形态,深受其业务节奏和数据敏感度影响:数据越敏感(如金融账户、患者隐私),越倾向于本地私有化部署;对准确性要求越高(如医疗诊断、政务审批),越需要循序渐进、人机共审,从而减小潜在错误成本。

可以预见,随着大模型能力提升和行业Know-How的融合,各领域的落地将加速拓展。但短期内,“因地制宜、稳中求进”仍是主旋律——这场产业落地战役比拼的不仅是技术,更是对行业需求和安全底线的深刻理解。

技术杠杆的竞合:

液冷、存算一体与光电互联




01
液冷:给算力引擎“降温”,立竿见影的节能方案

   大模型推理往往需要成百上千颗GPU协同工作,这些GPU如同一台台马力全开的发动机,散发出惊人的热量。有数据显示,液冷相比风冷可节省约30%的能源开销。通过优化PUE(电源使用效率),液冷让先进数据中心的PUE值降至1.1左右,远优于传统机房的1.4-1.6。据报道,某100柜规模(每柜20kW)的液冷数据中心每年可节电超过1亿瓦时,节省电费逾700万元。此外,液冷还能显著提高单机柜功率密度(60kW以上成为可能),节省机房空间。这对于拥挤的智算中心而言也是利好—同样面积下部署更多算力节点,摊薄场地和配套成本。

预计未来几年,液冷在数据中心冷却市场的占比将快速攀升(Omdia预测2028年液冷将占据约33%的市场份额)。因此可以断言,在这场基础设施战役的近期阶段,液冷将是主角:它以较低的技术门槛(相对于芯片革命)提供了可观的节能效果,是各大厂商当前竞相部署的现实方案。

02
存算一体:打破存储墙,让数据“零距离”计算的范式飞跃

   尽管存内计算可减少数据搬运能耗(占传统架构60%以上),但其商业化仍受限于工艺成熟度与生态兼容性。目前,存算一体芯片多在边缘端试水,如海康威视的智能摄像头采用存算方案,推理能效比提升5倍,但尚未触及数据中心级部署。

03
光电互联:从概念到实践的跨越

   光电互联技术通过引入硅光模块与CPO(光电共封装)技术,极大提升了数据传输效率与能耗比。谷歌的TPU v5集群已在光电互联上取得突破,但成本仍是规模化部署的主要障碍。

1.jpg
结语


智算中心的未来,既需应对DeepSeek等模型带来的算力洪流,又需在技术路线之争中保持敏捷。智算运营者需要在通用与专用之间找到最优调度策略,在大胆创新与稳妥安全之间拿捏行业落地节奏,并在拥抱新技术与确保投资回报之间权衡基础设施升级路径。当硝烟散去,我们将看到一个更加高效、智能、绿色的新型算力基础设施生态,为通用人工智能的未来保驾护航。






作为深圳政府备案的城市数字化服务商,智云算能能够为各行业提供高效的数字化解决方案,帮助企业在提升效率的同时实现绿色发展。未来,智云算能将继续支持各行各业的数字化转型,推动企业迈向更智能、更环保的新时代。