
![]()
新智元报道
编辑:KingHZ
【新智元导读】1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro文本IQ 130踩上门萨会员线,视觉IQ直接飙到145,杀进天才区。一年前「LLM过不了130」还是技术圈共识,今天,这堵墙彻底被砸碎!
1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。
GPT-5.5 Pro,在线文本智商133,视觉智商145,线下非公开智商测试得分130。
![]()
![]()
这是AI第一次正式跨过门萨会员线。
门萨 130墙这一脚是最响的一脚,但绝对不会是最后一脚。
门萨,全球最古老的高智商社团,1946年成立,入会标准只有一条——
智商IQ达到全人类前2%,分数线130。
普通人考几次都摸不到边的那条线,AI一次就过了。
![]()
而145,是门萨官网公开数据里「前0.1%」的位置,俗称天才区。
![]()
这并非孤例。就在本月初,GPT-5.4 Pro 已经在TrackingAI公开榜单上跑出150 IQ,登顶所有公开IQ跑分。
![]()
过去几个月里,也是OpenAI节奏从未停:视觉基座、推理升级、Agent产品线、API侧连环动作。
现在,AI赛场再次进入了OpenAI时代。
![]()
短板变王牌,
OpenAI引爆认知视觉革命
更炸的是文本和视觉的差距:GPT-5.5 Pro在文本部分跑出130分,刚好压线进门萨,但视觉部分直接飙到145。
15分的差距,不是测试误差。
这意味着模型在「看图找规律」这件事上的能力,比「读题做推理」高出整整一个标准差。
按照门萨的分布,130是前2%,145是前0.1%。也就是说,把GPT-5.5 Pro的视觉能力拿出去和真人比,真正的千里挑一。
这里有个细节值得多说一句:为什么是视觉,而不是文本,先把墙撞碎的?
门萨Norway采用3×3九宫格格式(八张图+空缺第九张),完全非语言、非文化依赖,考察抽象推理。
人类高智商群体(尤其是140+「天才区」)确实依赖瞬间模式识别:旋转(rotation)、镜像/反射(mirroring/reflection)、叠加/增减元素(superposition/addition-subtraction)等变换规则。
![]()
LLM做这种题的标准方法,是先把图片转成token再推理。
但token化的过程,丢的恰恰是空间结构和拓扑关系——也就是这类题最核心的信息。
所以,过去十二个月,所有顶级模型在视觉题上都是这个状况:文本勉强及格,视觉一塌糊涂。
Claude 4.7、GPT-5.4 Pro全部卡在 125 以下。
GPT-5.5 Pro的145意味着:这不是在模拟思考,这是在重构智能。 过去我们嘲笑AI「不懂常识」,而现在,它正在以高于98%人类的智力水平,俯视着我们的常识。
OpenAI联合创始人、总裁Greg Brockman转发用户展示,力荐GPT Image 2将《物种起源》等书籍瞬间转为详细信息图,促进高效学习。
![]()
![]()
这揭示了人类文明的一个重大转折点:知识的摄入媒介变了。
数千年来,人类依赖文字这种低带宽的线性媒介来传递智慧。
但GPT-5.5告诉我们,未来的学习不再需要你花费三个月去咀嚼一本厚书,AI会通过对长文本的深度语义理解,将其重构为一种「视觉认知流」。
这是「语义重组」。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
上下滚动查看图片
当AI的记忆力和上下文处理能力不再「健忘」,它就成了你大脑外的另一层皮质层。你不再是阅读知识,而是在俯瞰知识。
此外,ChatGPT现在一键直接把老旧破损的图片变成4K画质,而且免费!
![]()
Restore this old photo into professional portrait of DLSR - quality colour and detail, using an advanced upscaling algorithm comparable to the results from canon EOS R6 II. Ensure the restored the image looks natural, retains exact facial features, has great clarity......
「勤勉的小火车头」:说最温柔的话,做最狠的事
奥特曼用了一个极具迷惑性的词:「小火车头」(little engine)。
![]()
这个听起来甚至有些软萌的比喻背后,隐藏着 OpenAI 极度冷酷的商业意志。
昨天,OpenAI API新品登场:GPT-5.5及Pro版现已可用,显著提升智能水平和token效率,完美适配复杂任务场景,如编码、分析等高负载应用。
![]()
在LisanBench测试中,GPT-5.5是最强的双料非推理模型!
![]()
![]()
更令人胆寒的是, GPT-5.5的Token使用减少45.6%,智能分数却提升了1.77倍。
自从GPT-5以来,OpenAI模型的推理效率持续提升:
![]()
当前有效性比率排行榜中GPT 5.5独占鳌头:
GPT 5.5(Medium):99.44%
Opus 4.7 (xhigh): 99.35%
Sonnet 4.6 (16k): 99.28%
Opus 4.6 (16k): 98.74%
Gemini 3.1 Pro预览版(低):97.77%
测试之后,AI行业分析机构SemiAnalysis坦承:在某些任务上的表现,GPT-5.5已经显著超越了所有其他模型。
![]()
在数学上,GPT-5.5表现最佳;
在编程上,GPT-5.5和Opus 4.7各有千秋;
在智能体任务上,Claude和GPT-5.5远胜于其他所有模型。
![]()
![]()
这意味着什么?这意味着 OpenAI 正在同时「垄断智力」和「降维成本」。
对于竞争对手,这几乎是一场无解的「降维打击」。
特别是,Claude系列这次迎来了真正的对手,只剩下「神话中的Myhos」尚能一战。
![]()
已经有Claude忠实支持者,转为OpenAI Codex用户。
![]()
![]()
当你的产品比对手聪明一倍,延迟却只有对方的一半时,市场规则已经失效了,剩下的只有收割。
但对于开发者来说,这种「诚恳的能量」却带来了一种「西西弗斯式的焦虑」。
OpenAI加速狂飙,每月一炸
上个月,OpenAI 才刚刚发布了一个模型,再之前是去年12月,以及去年11月。
![]()
OpenAI正以快速、稳健的步伐持续推出新模型,在Artificial Analysis智能指数上稳步前行。
![]()
AI仍在加速 ,指数效应开始显现,奇点触手可及!
![]()
在可预见的未来,这一趋势有望延续。
「我们在短期内看到了相当显著的进步,在中期内看到了极其显著的进步,」OpenAI首席科学家Jakub Pachocki 说。「事实上,我认为过去两年其实出奇地缓慢。」
Brockman表示,该模型也是朝着创建「超级应用」迈出的又一步。
所谓「超级应用」,就是一个像瑞士军刀一样的多功能程序。Brockman与联合创始人奥特曼此前曾设想将 ChatGPT、Codex 和 AI 浏览器整合到一个统一的服务中,为企业客户提供支持。
值得注意的是,「超级应用」也是Elon Musk热衷的话题。
OpenAI官宣的「Crisp Pace」——每月一炸的更新频率,让所有的集成、优化和 Prompt 工程都变成了一次性用品。你昨晚刚熬夜调优好的工作流,今天可能就被 GPT-5.5 的原生能力直接覆盖。
![]()
被压缩的窗口期
这件事的真正分量,不在跑分本身,在节奏。
去年视觉天花板还停在119。今年直接跳到145。中间没有过渡,没有预告,只有一行更新。
在这种速度面前,一切「熟练度」都正在贬值。
正如尤瓦尔·赫拉利所言,历史上第一次,我们无法预测20年后人类的就业市场是什么样。但现在,这个窗口期可能被OpenAI缩短到了20个月。
那个「诚恳的小火车头」已经拉响了汽笛,它不打算等任何人。如果你感受到了颠簸,那是时代在换轨。
技能的半衰期正在被这种迭代速度反复缩短。不是十年,不是五年,是按月计算。
参考资料:
https://www.reddit.com/r/accelerate/comments/1svnxv9/gpt_55_pro_vision_is_actually_the_first_model_to/
https://startupfortune.com/gpt-55-lands-as-openai-accelerates-its-model-release-cadence-to-near-monthly/