DeepSeek-V3.2-Exp模型正式發布並開源
ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式發布並開源。模型引入稀疏 Attention 架構,這種架構能夠有效降低計算資源消耗並提升模型推理效率。目前,該模型已正式上架華為雲大模型即服務平台 MaaS,針對 DeepSeek-V3.2-Exp 模型,華為雲此次仍沿用大 EP 並行方案部署,基於稀疏 Attention 結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。
關聯標籤
關聯標籤








