智谱开源文生图模型CogView4,中文的开源图片模型来了

智谱开源文生图模型CogView4,中文的开源图片模型来了

主要特点:
支持中英双语提示词输入,擅长理解和遵循中文提示词
首个能够在画面中生成汉字的开源文生图模型
支持生成任意宽高的图片以及任意长度提示词输入

后续还会开源对应的Controlnet、Comfyui支持和模型微调工具
图像模型在今年终于有了一点动静了,而且这个模型在 DPG-Bench基准测试中的综合评分排名第一
项目地址:

https://github.com/THUDM/CogView4

本文地址:https://www.163264.com/10649

(0)
上一篇 2025年3月2日 下午10:44
下一篇 4天前