猫眼电影
猫眼电影记者 张德胜 报道首次登录送91元红包
财联社12月12日讯(编辑 史正丞)被谷歌逼到拉响“红色警报”后,OpenAI周四终于端出了最新前沿模型GPT-5.2系列。
图为OpenAI官网截图
OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。
GPT‑5.2有三种不同的版本:Instant是针对常规查询(如互联网检索、翻译和写作)进行速度优化的模型;Thinking擅长编程、数学、长文档分析等复杂结构化工作;顶级型号Pro,旨在为棘手问题提供最大程度的准确性和可靠性。
OpenAI特别强调,GPT‑5.2 Thinking是迄今为止最适合现实世界专业用途的模型。在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士,这些任务包括制作销售演示文稿、会计电子表格、制造流程图或短视频等。
在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士
另外在金融AI领域,GPT‑5.2Thinking的产出成果也明显好于GPT-5.1。
OpenAI给出的示例显示,GPT‑5.2 Thinking在制作人力资源规划模型、股权结构表和项目管理表格的任务中,产出成果较GPT‑5.1 Thinking有肉眼可见的进步。
OpenAI给出的示例
除了做PPT和Excel表格外,OpenAI也表示,GPT-5.2在编码、数学、科学、视觉、长文本推理以及工具使用等方面均刷新了基准成绩。公司称,这些能力的提升将有望带来“更可靠的代理式工作流程、可用于生产环境的代码,以及能够在大规模上下文和真实世界数据中运行的复杂系统”。
横向比较方面,GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5,涵盖现实世界的软件工程任务(SWE-Bench Pro)和博士级别的科学知识(GPQA Diamond),到抽象推理和模式发现(ARC-AGI套件)。
GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5
OpenAI产品负责人Max Schwarzer也在周四通报称,GPT-5.2 Thinking的回复较前代减少了38%的错误,使该模型在日常决策、研究和写作中更为可靠。
从周四开始,GPT‑5.2将向所有ChatGPT付费用户和API用户推送。所以这个新模型到底有多么适合“打工”,很快就能见分晓。
作为OpenAI对谷歌的反击,GPT‑5.2仅仅是打出的“第一拳”。
公司CEO奥尔特曼在周四宣布,下周会给用户们带来一些“小小的圣诞礼物”。他也在周四表示,Gemini 3对公司各项指标的影响比原本担心得要小。他还说,预计OpenAI将在明年1月“以非常强劲的姿态”退出目前的红色警报状态。
图为奥尔特曼社媒发文截图
OpenAI首席产品官Fidji Simo也在周四透露,现在已经开始在部分地区推出年龄估算系统,此举旨在控制ChatGPT对18岁以下用户回复的内容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入这一功能。
略有遗憾的是,周四的新品发布似乎聚焦于新模型的推理能力,没有推出新的图像生成器。而今年以来,为数不多的几次现象级新品发布都与图像、视频生成产品有关。奥尔特曼的“红色警报”备忘录中,也提及要改善图像生成能力。
此前有报道称,OpenAI计划在明年1月再发布一款新模型,具有更好的图像能力和更完善的个性化特点,但公司周四未对这一传言予以确认。
时事1:天博网页登陆不了
12月27日,解锁2026壁纸,承包你一整年的屏保浪漫,网传视频中,曾有事发地附近景区工作人员对此事发声。但多方人士告诉红星新闻记者,事发地位于景区外,距离景区约有1~2公里的距离。上述镇政府工作人员表示,景区边界有围栏等明显标识。当事游客没有从景区入口进入海滩,也没有购买景区门票,事发位置离景区确实有相当一段距离。,ku娱乐备用网址线路。
12月27日,朱炳仁、朱军岷铜雕作品入藏中国国家博物馆,据国家统计局网站,国家统计局今天发布了2024年4月份全国CPI(居民消费价格指数)和PPI(工业生产者出厂价格指数)数据。对此,国家统计局城市司首席统计师董莉娟进行了解读。,正规det365登录网站,亚娱下载,斗地主游戏大厅。
时事2:白小姐三点传密B
12月27日,石太高铁5G信号全线升级 赋能区域协同与数字生活,中亚五国是中国的西部近邻,其中三个国家与中国接壤——哈萨克斯坦、吉尔吉斯斯坦、塔吉克斯坦,这三国与中国的边境线长达3000多公里。中亚地区的稳定,对于维护中国国内特别是西北地区的稳定至关重要。,?载,永乐国际f6601cm,手机版舞会森林。
12月27日,看不见世界 那就让世界看见我们 “喂喂喂”足球队的滚烫人生,还有人写道,“我不相信白宫说的任何话,不过他们一旦否认,那就是另一回事了,往往后来它们都能100%得到证实。”,永利官网网址,澳门娱乐在线投注,cq9电子游戏平台。
时事3:开元app官网版
12月27日,沪上火车模型主题展人气旺 揭秘微缩世界“铁道狂想曲”,在到访中国前一周左右,马斯克宣布推迟访问印度的计划,当时他给出的理由是特斯拉公司的业务繁忙、自己脱不开身。《印度斯坦时报》《印度时报》等一众印度主流媒体28日在报道其此次访华的消息时纷纷打出“马斯克宣布推迟访印数日后即访华”的标题。印度“今日商业”网站28日直言,虽然此前疯传马斯克访印将会有宣布在印建特斯拉工厂的大动作,但在可预见的未来,特斯拉在印度建厂计划仍具有不确定性。,免费百人牛牛游戏,识破玄机,im电竞。
12月27日,国家数据局:就数据流通服务机构相关新政公开征求意见,最后结语,科技赋能融资租赁转型的时代已经到来。我希望融资租赁业务系统能成为连接资本、技术和市场的关键桥梁。,365bet体育外围,天博官方app下载,易博体育官网最新版本。
时事4:玩澳门永利的人现在怎么样
12月27日,广西三江:夕照熔金染侗乡,“从理论上讲,农林复合是不会造成荒漠化的,尤其是幼林期间。因为林地密度不大,如果是林下种植的话有利于固沙。当然也要具体问题具体分析,看科尔沁当地这些年的气候土壤条件。”朱清科说。他对本刊补充,允许林间种植,会更有利于农民的积极性,“他们是以短养长,因为现在种植经济林暂时没有收益,种花生就是以短期效益去助推更长远的效益。有了短期效益,农民才愿意去经营土地,会对土地有一些保护,比如浇水、除草等。”,188体育在线直播,狗万体育官方网站,2019男篮世界杯投注网站。
12月27日,山东济南系统性重塑卫生健康服务体系 织密民众健康保障网,过去十年,我国债务总规模和宏观杠杆率持续攀升,债务问题持续受到各界高度关注。如何认识债务增长和经济发展之间的关系,如何评估我国当前的债务风险?债务增长是否必然带来债务风险增加?如何平衡债务增长和债务风险的关系?,娱乐抢庄牛牛棋牌游戏,心博天下赌场网站,火狐体育怎么玩。
责编:王晓霜
审核:班婕妤
责编:何某某












