您现在的位置是:休闲 >>正文
刚刚,DeepSeek发布新模型,API价格下调 50%以上
休闲25588人已围观
简介刚刚,DeepSeek正式发布实验性模型 DeepSeek-V3.2-Exp。DeepSeek称其为“迈向新一代架构的中间步骤”。据介绍,该模型在V3.1-Terminus的基础上首次引入 DeepS ...
刚刚,刚刚DeepSeek正式发布实验性模型 DeepSeek-V3.2-Exp。发布DeepSeek称其为“迈向新一代架构的新模型A下调潮州市某某建筑科技运营部中间步骤”。
据介绍,价格该模型在V3.1-Terminus的刚刚基础上首次引入 DeepSeek Sparse Attention(一种稀疏注意力机制),探索长文本场景下训练与推理效率的发布优化。
官方表示,新模型A下调V3.2-Exp在公开评测集上的价格表现与V3.1-Terminus基本持平,但在成本和效率上实现突破。刚刚
受益于新机制,发布潮州市某某建筑科技运营部DeepSeek将API调用价格下调50%以上,新模型A下调新价格已即时生效。价格
V3.2-Exp已同步更新至DeepSeek官方App、刚刚网页端与小程序,发布并在HuggingFace和魔搭平台开源,新模型A下调相关论文也已公开。与此同时,DeepSeek开放了包括 TileLang与CUDA版本的GPU算子,以支持社区研究和快速迭代。
作为实验性版本,DeepSeek仍邀请用户在实际场景中进行更大规模的测试。为便于对比,公司临时保留了V3.1-Terminus的API接口,该通道将开放至2025年10月15日。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。

Tags:
相关文章
高铁超员临时停车,铁路部门回应:勿“买短乘长”
休闲“双节”假期,由于部分铁路旅客“买短乘长”,导致个别高铁列车出现了超员预警、临时停车的情况。铁路部门建议广大旅客,按照车票标注的车次、日期、区间、座号有序乘车,共同维护良好出行环境。 9月30日 ...
【休闲】
阅读更多热闹的收官战役,明年能剩几家车企?丨“油车”不死
休闲导语Introduction有“余成功”,也有没法“活着”的。作者丨王小西责编丨石 劼编辑丨何增荣又到了作为年度“收官”大戏的广州车展时刻,2024即将翻篇。天气倒是跟去年差不多,但有点闷闷的。办 ...
【休闲】
阅读更多中国将如何应对特朗普“关税大棒”?商务部回应
休闲特朗普在竞选美国总统时表示,计划对中国征收60%关税。这对中国出口将产生多大影响?就此问题,商务部国际贸易谈判代表兼副部长王受文在11月22日上午国新办举行的吹风会上回应,中国经济已经表现出非常强 ...
【休闲】
阅读更多