搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

重磅!DeepSeek V3.2 特别版发布:性能超越GPT-5,硬刚Gemini 3.0「IOI/IMO金牌」

2025-12-23 03:28:42
来源:

猫眼电影

作者:

于震

手机查看

  猫眼电影记者 徐原 报道首次登录送91元红包

↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新

DeepSeek-V3.2系列模型正式上线

作为“为Agent构建的推理优先模型”,DeepSeek-V3.2包含两个版本:

DeepSeek-V3.2:V3.2-Exp的官方继任者,平衡了推理能力与生成长度,性能对标GPT-5,现已上线App、Web端及API

DeepSeek-V3.2-Speciale:专攻深度推理能力的极限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前仅通过API提供

技术报告显示,DeepSeek-V3.2-Speciale在2025年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)、ICPC世界总决赛及CMO中均取得了金牌级成绩

官方已公开上述竞赛的最终提交结果,社区可通过assets/olympiad_cases进行二次验证

技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf

以下是详细信息

核心能力与技术突破

DeepSeek-V3.2基于三大技术突破,实现了高计算效率与卓越推理、Agent性能的统一:

1.DeepSeek Sparse Attention (DSA):引入高效注意力机制,大幅降低计算复杂度,并针对长上下文场景进行了优化

2.可扩展强化学习框架:通过稳健的RL协议与后训练(post-training)算力扩展,实现了高性能表现

3.大规模Agent任务合成管线:涵盖1800+环境及8.5万+复杂指令

这一合成管线不仅提升了模型在复杂交互环境中的遵循度和泛化能力,更让DeepSeek-V3.2将“思考”直接整合进工具使用(Tool-Use)的模型,同时支持在思考和非思考模式下使用工具

API更新与Speciale版限制

DeepSeek-V3.2:

API使用模式与V3.2-Exp保持一致,作为日常主力模型(Daily Driver),提供GPT-5级别的性能

DeepSeek-V3.2-Speciale:

该版本专为解决复杂任务设计,消耗更多Token,目前仅作为API提供,具体限制如下:

临时端点:需使用

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

服务期限:该端点服务至2025年12月15日 15:59 (UTC) 截止

功能限制:不支持工具调用(Tool Calls),仅用于支持社区评估与研究。

定价:与DeepSeek-V3.2保持一致

聊天模板重大调整

DeepSeek-V3.2不再提供Jinja格式模板,并引入了“带工具思考”及新角色设定。

Python脚本编码:官方提供了encoding文件夹,包含Python脚本(encoding_dsv32.py),用于将OpenAI兼容格式消息编码为模型输入字符串及解析输出

Developer角色:模板新增developer角色,专门用于搜索Agent场景,官方API不接受分配给该角色的消息

输出解析注意:提供的解析函数仅处理格式良好的字符串,生产环境需自行增加稳健的错误处理机制。

代码示例如下:

import transformersfrom encoding_dsv32 import encode_messagestokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")messages = [ {"role": "user", "content": "hello"}, {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."}, {"role": "user", "content": "1+1=?"}]# 思考模式配置encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)prompt = encode_messages(messages, **encode_config)tokens = tokenizer.encode(prompt)本地部署建议

模型结构与DeepSeek-V3.2-Exp相同。

采样参数:建议设置 temperature = 1.0,top_p = 0.95。

Speciale版提示:本地部署Speciale版本时,同样不支持工具调用功能

开源与协议

仓库及模型权重均采用 MIT License 授权。

最后记得⭐️我,这对我非常重要,每天都在更新:

欢迎点赞转发推荐评论,别忘了关注我

 时事1:188体育足球

  12月23日,特奥会西藏队选手索南加参:吹着高原的风长大的汉子,同时她称自己为学生们毕业后可以对这类法律做出改变感到庆幸,并向抗议学生们表示感谢,还允许那些不愿听讲座的学生离开会场。,贝博真人百家乐。

  12月23日,日本两团体请求访华 中方回应,虽然并非所有国家都详细披露本国黄金储备存放地点及具体数量,但根据新加坡贵金属交易商Bunker Group的估算,美国和英国是全球最大的黄金保管国,两国合计储存的黄金占全球黄金储备的约53%。,九州体育在线买球,19体育app下载,188体育完整比分直播。

 时事2:mgm快速登陆

  12月23日,第二届中国脑机智能大会在浙江杭州启幕,徐兴建在加入信达财险之前,已经积累了丰富的跨界工作经验。他的职业生涯起步于政府部门,曾担任山东省郓城县工商局双桥工商所所长,之后在济南市第一市政工程公司、阳高登塑料有限公司等企业担任管理职务。1999年进入金融行业,在兴业银行分行有工作经验,后担任华建国际集团投资总监。,大发体育体,抢庄牛牛注册,足彩世界杯投注三串一。

  12月23日,【统战巡礼】汇聚统战优势 谱写中原大地推进中国式现代化新篇章——“十四五”期间河南省统战工作综述,2、货币政策超预期:货币政策是市场流动性的重要影响因素,央行采取超预期的货币政策可能对市场流动性产生显著影响。,威博体育,澳门游戏官网网址,开元体育官方下载。

 时事3:金沙手机app下载

  12月23日,俄学者:军国主义抬头,日本军事扩张趋势已酝酿多年丨世界观,4月24日,港交所在公布2024年一季度的财报的同时,也迎来了重要的管理层变动。唐家成正式接替史美伦,成为港交所新一任主席。,365bet体育电脑版,千赢线上网站官网首页,e星体育正规吗。

  12月23日,青春华章丨中青网评:挺起强国复兴的青春脊梁,双方对日本向海洋排放福岛核污染水表示严重关切,要求日本以负责任方式安全处置福岛核污染水,接受严格国际监测,尊重有关国家开展独立监测的要求。,世界杯 单场比分投注,有没有能上下分的捕鱼游戏,牛宝体育平台靠谱。

 时事4:世界杯足球网

  12月23日,重庆“10人聚餐9人开溜”续:最晚走客人已付清餐费,“这就好比大喊‘着火了’一样,一旦营造出紧迫感,自然会吸引大量关注。”,库博体育官网,申博官网,大发888平台首页。

  12月23日,一站式预约!北京市景区购票服务平台上线试运行,在彭昌国看来,当前尽管不少手机厂商都希望进入非洲市场,但可能还缺乏决心,而衡量决心最关键的因素是投入多寡。,全球最奢华的游戏,必威精装版app下载,澳门银银河app下载。

责编:吴焰谈

审核:李婕

责编:杨莹

相关推荐 换一换