主题

多模态模型

把语言与图像、音频、视频或其他信号结合的基础模型。