近日,DeepSeek宣布推出其最新多模态大模型Janus-Pro,标志着文生图领域的突破性进展。
在Geneval和DPG-Bench基准测试中,Janus-Pro-7B超越了OpenAI的DALL-E 3、Stable Diffusion和Emu3-Gen等主流模型。
作为JanusFlow大模型的升级版,Janus Pro采用MIT开源协议,允许商业场景中的无限制使用。
通过优化训练策略、扩展训练数据以及增大模型规模,Janus-Pro显著提升了多模态理解能力和文本到图像生成指令跟踪能力,同时增强了生成稳定性。
尽管目前Janus-Pro仅支持384x384分辨率图像生成,但其紧凑的模型尺寸和优异的性能令人印象深刻。
作为多模态模型,Janus-Pro具备丰富的功能,包括文本到图像生成、图像描述、地标识别、图像文本识别和知识介绍等。
0 条