内容持续更新中
Hugging Face推出的aMUSEd模型可以在几秒钟内生成图像,采用了轻量级的文本到图像模型,使用Masked Image Model(MIM)架构,大大减少了推理步骤,提高了生成速度和可解释性…
近年来,大语言模型(LLM)在人工智能领域取得了显著进展,尤其是在多模态融合方面。华中科技大学、字节跳动与香港大学的联合团队最近提出了一种新型的多模态生成框架 ——Liquid,旨在解决当前主流多模态…