
主要特点:
支持中英双语提示词输入,擅长理解和遵循中文提示词
首个能够在画面中生成汉字的开源文生图模型
支持生成任意宽高的图片以及任意长度提示词输入
后续还会开源对应的Controlnet、Comfyui支持和模型微调工具
图像模型在今年终于有了一点动静了,而且这个模型在 DPG-Bench基准测试中的综合评分排名第一
项目地址:
https://github.com/THUDM/CogView4
本文地址:https://www.163264.com/10649
主要特点:
支持中英双语提示词输入,擅长理解和遵循中文提示词
首个能够在画面中生成汉字的开源文生图模型
支持生成任意宽高的图片以及任意长度提示词输入
后续还会开源对应的Controlnet、Comfyui支持和模型微调工具
图像模型在今年终于有了一点动静了,而且这个模型在 DPG-Bench基准测试中的综合评分排名第一
项目地址:
https://github.com/THUDM/CogView4
本文地址:https://www.163264.com/10649