一文看尽

出品 | 网易科技《态度》栏目
作者 | 袁宁
编辑 | 丁广胜
GPT-5终于发布了。文看尽佳木斯市某某搬家有限公司
根据目前的文看尽反馈,这场等了两年半的文看尽发布会,没有彻底颠覆世界,文看尽但也称不上失望。文看尽
一小时多的文看尽全程,更像是文看尽一次技术团队的集体“总复盘”——没有惊天动地的大招,却在细节里留下了不少耐人寻味的文看尽信号。
回想2023年GPT-4发布时,文看尽几乎所有人都以为半年内会见到GPT-5。文看尽
那时,文看尽AI行业还沉浸在一种快速迭代、文看尽持续突破的文看尽情绪中。然而现实是佳木斯市某某搬家有限公司,OpenAI沉寂了整整两年半。
等待发布的过程对大多数人来说,是一种复杂的心情:不希望AI快到让所有人立刻被取代,但也担心,当头部玩家放缓脚步,是否意味着行业迎来寒风。
过去,我们太容易把AI的每一步想象成“颠覆”。GPT-5的到来,某种意义上也似乎传递了一个信号:我们必须接受,这场技术变革将以更慢、但也更深的方式发生。
01 GPT-5和 ChatGPT 的重要更新
先快速梳理一下核心更新。
首先,GPT-5本身是一个集成模型。这意味着用户不再需要手动切换模式,为每个对话自动分配最合适的处理方式——需要深度推理的走推理模式,快速回复的直接处理。
同时,未来GPT-5将面向所有人开放,提供免费、plus和Pro三种模式。
它在多个维度上做了系统级升级:
- 根据官方表述整体来看:幻觉率下降显著、更快、更直接、更智能
- 编程能力更强:不仅能生成函数逻辑、前端样式,还能用自然语言解释生成意图,支持更高质量的人机协作。
- 语音互动更自然:支持根据语气调整回应风格。
- 健康能力增强:不只是解读医学术语,还能补充你未曾问出但关键的问题,引导用户提出更有效的健康对话。

此外,GPT-5也带来了新的API版本——GPT-5,GPT-5 mini,GPT-5 nano,价格分别为:
GPT-5:输入1.25美元/百万token,输出10美元/百万token
GPT-5 mini:输入0.25美元/百万token,输出2美元/百万token
GPT-5 nano:输入0.05美元/百万token,输出0.4美元/百万token
进一步打通了从轻量级接入到企业级部署的可能路径。
02一些值得关注的“有感”功能
这次发布还有几个非常“有感”的功能升级,针对日常用户的体验做了深度打磨:
- Google服务深度集成:用户可直接接入 Gmail、Google 日历、联系人,实现查看邮箱、安排会议、自动拉日程等操作。
- 自定义人格:你可以预设AI的性格,包括“Cynic”(吐槽型)、“Robot”(理性型)、“Listener”(陪伴型)、“Nerd”(学霸型),这意味着AI将不再是一个中性、唯一的声音,而可以有情绪、个性。
- 安全完成(Safe Completion)机制:当模型不能提供准确信息时,会部分回答+明确解释原因,而不是拒绝回答或者强行输出不靠谱结果。
- 聊天颜色自定义:虽然是小功能,但确实更贴近个人使用体验,支持订阅用户自定义界面风格。

03实际表现:并非解决了所有问题
从目前各路开发者与用户反馈来看,GPT-5的主要优势并不在“第一次体验的惊艳”,而是在长期上下文理解、复杂指令跟踪和用户意图检测能力上的持续进化。
在真实的工作流测试中,许多用户提到:
- 前端代码能力有明显提升
- 函数结构更合理,解释更清晰
- 多轮推理更稳定
- 对复杂指令的响应能力增强
- 运行速度快了,虽然UI层面的感知差异也可能误导


但也有部分用户提出,在情绪理解和文笔表现上,它可能在某些场景不如GPT-4.5细腻。
在游戏图像识别、图像偏见测试等多模态任务中,GPT-5的表现也不是完美,甚至在一些小众测试中略逊色于前代。
甚至发布会上还出现了52.8的图示高于69.1的错误,让人直呼“世界就是一个草台班子”。
不过从总体数据看,GPT-5仍然是当前综合能力最强的模型:
- 数学:AIME 无工具成绩94.6%(Pro版本96.7%)
- 编程:SWE-bench 完成率74.9%
- 多模态:MMMU 84.2%,图像/视频/科学综合冠军
- 健康:HealthBench Hard 得分46.2%,业界最高

04节奏变慢,是AI进化的必然?
比起革命,这场耗时两年半的发布,更像一次深度打磨的答卷。
到2025年7月,OpenAI年化收入已达120亿美元,ChatGPT周活跃用户突破7亿。
这家公司的每一次升级,都不只是技术进步,而是对全球产品形态、产业格局、伦理边界与安全标准的整体重塑。
它的核心用户群,也已从早期的好奇者,转向那些要用它提升效率、构建能力的开发者、企业与普通职场人。
GPT-5不是“震撼三观”的终局之作,但它象征着AI发展正进入下一个阶段:从“令人惊艳”到“真正可用”。
未来的大模型竞争,也许不再是比“谁更强”,而是看“谁更有用”,谁能成为最值得信赖的基础设施。
而未来的更新也可能不会再引发狂欢,而变成更安静的版本迭代——不惊动你,却让一切运转得更好。

相关文章
- 记者从首都机场了解到,预计首都机场今天夜间阴天,明天11月25日)0时至7时有小雨,7时至12时有小雨夹雪。针对明天的雨雪天气情况,首都机场提前对部分航班时刻进行调整,做好除冰雪人员和物资的准备工2025-08-12
西安00后软件工程师辞职摆摊卖蛋糕:更想跟人打交道,而非冷冰冰的键盘
今年9月,2000年出生的艾庆勇做出一个重要决定:辞掉软件工程师的工作,转行摆地摊卖蛋糕。如今摆摊已经过去两个多月。11月14日晚,艾庆勇告诉上游新闻报料邮箱:[email protected])记2025-08-12- 新京报贝壳财经讯 11月15日,最高人民法院正式发布“法信法律基座大模型”,这是国内首个法律行业AI基座大模型,也是国家级法律人工智能基础设施。 据介绍,“法信法律基座大模型”是在清华大学千亿参2025-08-12
- 阿尔茨海默病,又称老年痴呆症,它让无数患者和家庭陷入绝望,目前仍然无法治愈。但如今,已经有越来越多的药物,可以延缓早期阿尔茨海默病的进展。这些药物有效,但治疗费用却不菲。如果有一天,一年花18万可以延2025-08-12
第十五届中国航展迎来首个公众开放日 预计观众将达到11.5万人
据央视新闻客户端消息,今天15日)是第十五届中国航展的第四天,从今天起到17日,为本次航展的公众开放日,每天开放时间为9:00到17:00,普通观众可以在这几天近距离打卡航展。据了解,目前,中国航展公2025-08-12- 不管是否不小心,还是真心诚意地,美俄各自以不同的角度、方式看到中国航展上的中国新型战机,显示的无疑是我们的种种进步让人感受到了!文|海上客第15届中国航展正在珠海举行。说实在话,海叔真有种“乱花渐欲迷2025-08-12
最新评论