AI图像生成赛道从来不缺”搅局者”,但这次来的有点不一样。
硅谷初创公司Luma AI近日正式发布图像生成模型Uni-1,这支仅约150人的团队选择了一条与众不同的路:彻底抛弃扩散模型,转而采用自回归架构——和大语言模型生成文字的底层逻辑几乎一样,只不过输出的是像素。Uni-1能在生成图片前先”想一想”,对空间关系、物理规律、逻辑因果进行推理规划,而不是像传统AI那样靠”降噪”拼凑画面。在视觉推理基准RISEBench上,Uni-1的空间推理得分达到0.58,超过谷歌Nano Banana 2的0.47;逻辑推理得分是OpenAI GPT Image 1.5的两倍以上,成绩相当亮眼。
商业层面,Uni-1的定价策略也挺有意思——2K分辨率图像生成成本比主流竞品低10%到30%,官网已开放免费试用,API接入通道陆续上线。目前用户反馈普遍正面,有人说它”终结了提示词反复试错的噩梦”,不过在非拉丁文字渲染和极端场景处理上还需打磨。艺术风格化方面暂时不如Midjourney,但在需要理解复杂指令的任务里,它的表现已经让行业老玩家有些坐不住了。
自回归架构能不能真正动摇扩散模型近三年的地位,现在下结论还早——你觉得图像生成的下一个”范式革命”会从这里开始吗?
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...