OpenAI最新模型打不动了?GPT-5.2因“降智”陷“差评潮”

2025-12-15 17:55:35 来源: 界面新闻

OpenAI推出不到一周的最新旗舰模型没能等来“好评如潮”。

近日,OpenAI在十周年之际发布了GPT-5.2系列模型,官方数据显示其在GDPval等专业基准测试中超越人类专家,是迄今为止在“专业知识工作方面”表现最好的模型。


(相关资料图)

据OpenAI官方披露,GPT-5.2在多领域实现技术突破:GDPval测试中覆盖44个职业的任务表现70.9%优于顶尖专家,SWE-bench Pro编程测试获55.6%的SOTA成绩,还将幻觉率较GPT-5.1降低38%。该公司CEO山姆·奥特曼称其为“许久以来最大的升级”,并透露计划2026年1月解除应对谷歌竞争的“红色警报”。

但该模型上线后遭到大量用户吐槽,认为其从常识问答到情感交互,“智商不稳定”。

SimpleBench常识推理测试显示,GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7,甚至在“garlic有几个r”的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的Gemini 3.0等竞品均稳定通关。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前AWS总经理Bindu Reddy直言,“不值得从GPT-5.1升级”。

网友晒出的网友晒出GPT-5.2在SimpleBench上的成绩单。

一些编程爱好者则发现,GPT-5.2生成的交通灯模拟代码画面仅达“黑白火柴人级别”,蒙娜丽莎ASCII艺术创作效果远逊于GPT-4o。情感交互中有用户倾诉“恐慌发作”,竟收到“很高兴听到这个消息”的回复,安慰失宠孩童时则机械强调“生物都会停止运作”,缺乏此前版本的亲和力和自然表达。

此外,该版本在处理连续对话时不稳定,甚至在明确选择“高级思考模式”时也会返回低质量的自动响应,令用户不得不重新调整使用方式。

还有用户表示,GPT-5.2的安全策略实施过于严格,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。

有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI推广时着重强调GPT-5.2的专业能力和基准测试成绩,但普通用户更关注日常对话、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差。

截至发稿,OpenAI尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。

当前,OpenAI仍面临来自谷歌的巨大竞争压力。谷歌此前推出的Gemini 3在编程、多模态理解等关键企业应用场景上实现了对ChatGPT的性能超越。11月,谷歌宣布Gemini月活跃用户已突破6.5亿,较7月报告的4.5亿实现大幅增长,而OpenAI披露的周活跃用户数接近8亿。

为此,奥特曼曾发布“红色代码”警报,决定暂时搁置包括Sora视频生成器在内的长期研发项目,转而在短期内全力通过提升用户活跃度来巩固ChatGPT的大众市场地位。但急转直下的口碑或在很大程度上影响ChatGPT的使用率,OpenAI能否拿出更强有力的“武器”反击谷歌仍存在不确定性。

关键词 谷歌 OpenAI GPT Gemini 5.2 模型 最新

精选 导读

OpenAI最新模型打不动了?GPT-5.2因“降智”陷“差评潮”

【OpenAI最新模型打不动了?GPT-5 2因“降智”陷“差评潮”】近日,Ope

发布时间: 2025-12-15 17:55
资讯   2025-12-15

新华指数|12月15日山东港口大商中心钢坯、热轧C料价格微幅上涨

新华财经北京12月15日电(陆子琛)截至12月15日,新华·山东港口钢

发布时间: 2025-12-15 17:09
行业   2025-12-15

世纪恒通:公司已在数据标注等领域与园区内其他企业建立合作

同花顺(300033)金融研究中心12月15日讯,有投资者向世纪恒通(301428

发布时间: 2025-12-15 15:16
宏观   2025-12-15

快讯:新北洋:截至2025年上半年,新北洋的新零售综合运营业

同花顺(300033)金融研究中心12月15日讯,有投资者向新北洋(002376)

发布时间: 2025-12-15 15:17
资讯   2025-12-15

摊牌!雷迪克点名批评詹皇抢东契奇绝平罚球,摆明敲打他谁是

摊牌!雷迪克点名批评詹皇抢东契奇绝平罚球,摆明敲打他谁是老大,湖人,

发布时间: 2025-12-15 14:31
行业   2025-12-15

银邦股份:淮北工厂项目已进入试生产阶段 头条焦点

人民财讯12月15日电,银邦股份12月15日在互动平台表示,公司淮北工厂项

发布时间: 2025-12-15 13:16
行业   2025-12-15

“妖股”直击:雷科防务16天8板,商业航天及卫星应用业务布

交易所数据显示,雷科防务股价今日呈现先抑后扬的走势。开盘后股价一度

发布时间: 2025-12-15 11:58
关注   2025-12-15

保险板块持续拉升 中国平安、中国太保双双涨超5%

此页面是否是列表页或首页?未找到合适正文内容。

发布时间: 2025-12-15 11:23
资讯   2025-12-15

【快播报】PriceSeek重点提醒:东营金茂苯胺价格上调利好

12月15日,东营金茂苯胺价格上调250元 吨,最新价格执行7900元 吨现汇

发布时间: 2025-12-15 10:11
宏观   2025-12-15

【热闻】科瑞技术:公司为客户提供超高精密部件等设备

同花顺(300033)金融研究中心12月15日讯,有投资者向科瑞技术(002957

发布时间: 2025-12-15 09:22
行业   2025-12-15

焦点消息!天罡股份:12月12日获融资买入122.74万元

同花顺(300033)数据中心显示,天罡股份12月12日获融资买入122 74万元

发布时间: 2025-12-15 08:24
关注   2025-12-15

和汽车转向系统相关的公司梳理(2025/12/12)|焦点热文

据南方财富网概念库数据显示,以下是相关概念公司:航天科技000901:20

发布时间: 2025-12-15 08:09
行业   2025-12-15

当前资讯!(视点)清污船护航长江碧水长流

下午,“华峰环保一号”满载返航,开始污染物转运上岸。长江宜都段全长

发布时间: 2025-12-15 06:24
行业   2025-12-15

东华软件:选举李建国为第八届董事会职工代表董事

东华软件:选举李建国为第八届董事会职工代表董事

发布时间: 2025-12-14 22:23
资讯   2025-12-14

粉笔与华图宣布展开战略合作-今日快看

粉笔与华图宣布展开战略合作

发布时间: 2025-12-14 22:29
宏观   2025-12-14

南微医学股票如何?688029分红怎么样?-重点聚焦

一、南微医学(688029)股票分红记录南微医学最新一次公布的分红方案为

发布时间: 2025-12-14 21:13
关注   2025-12-14

航行警告!渤海军事演习 禁止驶入

航行警告!渤海军事演习禁止驶入

发布时间: 2025-12-14 19:30
资讯   2025-12-14

“膨大剂”催熟草莓这个月大量上市?记者调查→

眼下冬意渐浓,各地草莓陆续上市。超市货架上,颗颗草莓饱满红艳,非常

发布时间: 2025-12-14 19:20
宏观   2025-12-14

演员何晴去世!前夫许亚军在美国,恐无法参加追悼会,儿子像

演员何晴去世!前夫许亚军在美国,恐无法参加追悼会,儿子像父亲,何晴,

发布时间: 2025-12-14 16:23
资讯   2025-12-14

视频丨2030年我国天然气产量将达3000亿立方米|今日观点

《中国油气行业“十四五”发展成就报告》显示,中国正加速迈向现代油气

发布时间: 2025-12-14 15:25
关注   2025-12-14