智谱技术团队发布开源文生图模型CogView3及其升级版CogView3-Plus-3B,后者基于DiT框架和Zero-SNR扩散噪声调度,提高了性能并降低了训练推理成本。CogView3通过三级扩散过程生成图像,分辨率从512x512逐级提高至2048x2048。该模型在人工评估中表现优于SDXL模型,推理时间仅为后者的十分之一。模型已集成至“智谱清言”App。开源仓库及模型已发布于github和Hugging Face。