网站首页
编程语言
数据库
系统相关
其他分享
编程问答
部曲
2024-11-09
万字长文深度解读Movie Gen技术原理(5部曲):图像&视频联合生成模型 (2)
引言简介图像和视频基础模型时间自编码器(TAE)训练目标骨干架构文本嵌入和视觉-文本生成空间上采样模型扩展和训练效率预训练预训练数据训练微调STF微调数据集创建监督微调&模型平均推理推理提示重写提高推理效率评估评估维度评估