首页 > 原创写作 > 原创写作 > 华为云Tokens服务接入384超节点,中国算力需求过去一年半已激增300倍

华为云Tokens服务接入384超节点,中国算力需求过去一年半已激增300倍

发布时间:2025-08-30 10:15:13

8月28日,在8月27日举办的第四届828 B2B企业节上,华为云宣布其Tokens服务全面接入CloudMatrix384超节点。通过新型xDeepServe架构,单芯片Token处理性能提升至2400TPS(每秒处理Token量),时延降至50ms,较年初1920TPS实现显著突破。

此次突破也发生在国内算力需求激增300倍的背景之下。过去18个月,中国AI算力需求呈现指数级增长。数据显示,2024年初中国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,反映了我国人工智能应用规模快速增长,也对算力基础设施的需求提出了更大的挑战。

在以往按卡时计费的基础上,今年3月,华为云正式推出了基于MaaS的Tokens服务。针对不同应用、不同场景的性能和时延要求,还提供了在线版、进线版、离线版乃至尊享版等多种服务规格,为大模型、Agent智能体等AI工具提供了更为灵活、便捷、低成本的先进算力。

实际上,性能的突破考验的从不是单点的能力,而是从软件到硬件的全面重构,这恰恰是华为“大杂烩”能力的优势所在。

更为通俗的说,CloudMatrix384超节点架构就像是华为构建的一个“全自动化超级工厂”, 通过 UB 总线(超级传送带)连接 384 个 AI 芯片和 192 个 CPU,让数据像流水一样自由流动,彻底打破传统机房“服务器格子间”的物理限制。xDeepServe架构可以把大模型推理比喻成一个汽车组装车间,不同车间对应不同任务,有的专注语义理解,有的专注基础计算,有的专注专业任务,如果遇到复杂如长文本这类的任务,可随时给某个车间的公认加配NPU,避免资源浪费,最终实现单芯片的性能跃迁。另外,分布式引擎FlowServe会把CloudMatrix384 切成完全自治的 DP 小组,每个小组自带 Tokenizer、执行器、RTC 缓存与网络栈,完全自给自足,做到千卡并发也不“拥堵”。

目前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平台。

华为云积累了大量模型性能优化、效果调优的技术和能力,从而实现“源于开源,高于开源”,让更多大模型可以在昇腾云上跑得更快更好。

就在近日,国务院刚刚印发了《关于深入实施“人工智能+”行动的意见》,这意味着以Token为动力的智能社会已经到来,而华为云的系统级创新能力和全新的Tokens服务有助于AI加快落地。

原创写作更多>>

不存在“就业末日”,高盛CEO否认AI会使劳动力市场萎缩 黄仁勋2026年首度来华现身菜市场,体验上海市井风俗 苹果曾想让AI全面接管iPhone 17等,结果被高管否决 吉利自研全固态电池年内将完成首个Pack下线,并进行装车验证 初代手机没发货,特朗普移动旗舰T1 Ultra已在路上 中国联通确认:今年每月至少一款eSIM手机上市 eBay将向未经授权的AI购物智能体说“不” 诺奖得主、谷歌DeepMind创始人Hassabis要用AI“攻克人类疾病” 比亚迪2026款海豹05 DM-i&海豹06 DM-i超享版加推210km版本,8.98万元起 上汽大众ID.ERA 9X旗舰SUV外观细节公布:增程动力、大六座布局 微信下架数十部违规微短剧:低俗擦边、剧情荒诞离奇 零跑朱江明:车企绝对不能亏本卖车 25.9万辆!宝马德国莱比锡工厂2025年产量再创历史新高 新款阿维塔12官图发布,设计、动力、操控、智驾全域升级 一则“裁员”小作文拖累股价下跌?微软高管澄清:100%假消息 全球动力电池前瞻技术与创新论坛共探产业未来 捷途汽车7年达成200万辆销量里程碑 Turing融资6,300万美元后与电装合作研发自动驾驶汽车 丰田将车型生命周期延长至九年 爱芯元智仇肖莘:“技术通用、芯片专用”,助力汽车智能普惠 零跑Lafa5 Ultra预计2026年第二季度发布 中国汽车技术研究中心公开明确:将电池分为固态、固液混合、液态电池三大类 QNX:车规级操作系统 - 汽车电子软件的基石 广州车展,一汽奥迪带来了哪些车? 广丰铂智7亮相,重新定义合资纯电精品车 享界 S9 与 S9T 双旗舰登陆广州车展,以 “智能 + 豪华” 双轮驱动,在 30 万级以上高端市场向传统豪华品牌发起冲击 日产与奔驰就芯片供应危机发出预警 特斯拉聘请兰博基尼前高管推动印度市场销售 传安世半导体荷兰总部曾试图解雇另一中国高管 闻泰科技:重启安世半导体成品出口,必须恢复张学政CEO职务