150人团队挑战行业巨头：Luma AI发布Uni-1，自回归架构能否终结扩散模型霸权？

AI图像生成赛道从来不缺”搅局者”，但这次来的有点不一样。

硅谷初创公司Luma AI近日正式发布图像生成模型Uni-1，这支仅约150人的团队选择了一条与众不同的路：彻底抛弃扩散模型，转而采用自回归架构——和大语言模型生成文字的底层逻辑几乎一样，只不过输出的是像素。Uni-1能在生成图片前先”想一想”，对空间关系、物理规律、逻辑因果进行推理规划，而不是像传统AI那样靠”降噪”拼凑画面。在视觉推理基准RISEBench上，Uni-1的空间推理得分达到0.58，超过谷歌Nano Banana 2的0.47；逻辑推理得分是OpenAI GPT Image 1.5的两倍以上，成绩相当亮眼。

商业层面，Uni-1的定价策略也挺有意思——2K分辨率图像生成成本比主流竞品低10%到30%，官网已开放免费试用，API接入通道陆续上线。目前用户反馈普遍正面，有人说它”终结了提示词反复试错的噩梦”，不过在非拉丁文字渲染和极端场景处理上还需打磨。艺术风格化方面暂时不如Midjourney，但在需要理解复杂指令的任务里，它的表现已经让行业老玩家有些坐不住了。

自回归架构能不能真正动摇扩散模型近三年的地位，现在下结论还早——你觉得图像生成的下一个”范式革命”会从这里开始吗？