150人团队挑战行业巨头:Luma AI发布Uni-1,自回归架构能否终结扩散模型霸权?

科技22小时前发布 leso
5 0 0

AI图像生成赛道从来不缺”搅局者”,但这次来的有点不一样。

硅谷初创公司Luma AI近日正式发布图像生成模型Uni-1,这支仅约150人的团队选择了一条与众不同的路:彻底抛弃扩散模型,转而采用自回归架构——和大语言模型生成文字的底层逻辑几乎一样,只不过输出的是像素。Uni-1能在生成图片前先”想一想”,对空间关系、物理规律、逻辑因果进行推理规划,而不是像传统AI那样靠”降噪”拼凑画面。在视觉推理基准RISEBench上,Uni-1的空间推理得分达到0.58,超过谷歌Nano Banana 2的0.47;逻辑推理得分是OpenAI GPT Image 1.5的两倍以上,成绩相当亮眼。

商业层面,Uni-1的定价策略也挺有意思——2K分辨率图像生成成本比主流竞品低10%到30%,官网已开放免费试用,API接入通道陆续上线。目前用户反馈普遍正面,有人说它”终结了提示词反复试错的噩梦”,不过在非拉丁文字渲染和极端场景处理上还需打磨。艺术风格化方面暂时不如Midjourney,但在需要理解复杂指令的任务里,它的表现已经让行业老玩家有些坐不住了。

自回归架构能不能真正动摇扩散模型近三年的地位,现在下结论还早——你觉得图像生成的下一个”范式革命”会从这里开始吗?

© 版权声明

相关文章

暂无评论

none
暂无评论...