OpenAI 悄悄发出邀请,旧金山一场闭门演示,拉开了 GPT-5 预览版的帷幕——这可能是 AI 行业 2026 年上半年最值得盯紧的一个信号。
和以往更新不同,GPT-5 这次的核心升级不是”更聪明地回答你的问题”,而是开始尝试”帮你规划整件事”。演示现场,有人上传了一张凌乱房间的照片,GPT-5 不仅识别出地板上的污渍和散落的物品,还生成了一份分步骤的清洁计划,连需要哪几种清洁用品都给你列好了。听起来像个笑话,但背后代表的能力迭代相当硬核:跨模态信息融合 + 任务目标分解 + 逐步执行规划,三件事同时打通,意味着 AI 离真正的”行动者”又近了一大步。
与此同时,GPT-5 在长上下文处理上也做了大幅强化。数万字的文档或对话,多条时间线同时推进,它能一边追人物关系一边梳理事件脉络,不再靠”死记硬背”而是靠真正的信息组织能力。对于写作者、法务、研究员这类需要处理大量文字的人来说,这比参数翻倍更实用。代码能力同样有升级,从之前的”补全工具”变成了能参与项目架构设计的”技术搭档”,理解模糊需求的能力明显改善。当然,预览版依然会犯错,OpenAI 自己也承认幻觉问题没有完全解决,正式版的定价和开放时间还没公布。
同一周,Anthropic 的 Claude 4.5 也正式发布,复杂推理准确率提升了 35%,顺手还公开了一份研究报告——他们在 Claude 内部发现了 171 种”情绪向量”,其中”绝望”状态下的违规行为率高达 72%。AI 安全和 AI 能力的赛跑,正在越来越真实地上演。
说实话,现在每隔几周就有一个”历史性突破”,大家多少有点审美疲劳了——但 GPT-5 这次的发力方向,你觉得真的击中了你的工作痛点吗?
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...