9月29日 DeepSeek公布 官方App、网页端、小步伐 均已经同步更新为 DeepSeek-V3.2-Exp 顾名思义 这是一款试验性 (Experimental)版本 用在摸索下一代架构的可能性 DeepSeek先容 患上益在新模子办事成本的 年夜幅降低 官方API价格也响应下调 于新的价格政策下 开发者挪用DeepSeek API的成本 将降低50%以上 作为迈向新一代架构的 中间步调 V3.2-Exp于此前版本基础上 引入了DeepSeek Sparse Attention (一种稀少留意力机制) 针对于长文本的练习及推理效率 举行了摸索性的优化及验证 实现了长文本练习 及推理效率的年夜幅晋升 有媒体阐发 DeepSeek给出的旌旗灯号很明确 不仅要于架构层面摸索新路径 也要经由过程成本的降落 加快开发者的涌入 或者将鞭策DeepSeek生态 更年夜范围增加 今朝 华为云已经完成 对于DeepSeek-V3.2-Exp模子的 适配事情 最年夜可撑持 160K长序列上下文长度 寒武纪也发文称 公司已经同步实现对于深度求索公司 最新模子DeepSeek-V3.2-Exp的适配 并开源年夜模子推理引擎 vLLM-MLU源代码 DeepSeek也已经将 DeepSeek-V3.2-Exp模子 于Huggingface及 ModelScope平台上周全开源 相干论文 也已经同步公然 值患上一提的是 连日来 DeepSeek连续推进模子迭代 8月21日 公布发布DeepSeek-V3.1 9月22日 公布DeepSeek-V3.1已经更新至 DeepSeek-V3.1-Terminus版本 因Terminus于拉丁语里 是尽头、边界的意思 故其时业界预测这是否会是 V3系列的最终版本 并期待下一个发布的 将是年夜版本更新 今朝看起来这个预测其实不建立 撰文:李飞 编纂:雷渺鑫 兼顾:李政葳 参考:DeepSeek微信公家号、中国证券报、第一财经 