ky体育每经杭州4月18日电(记者叶晓丹)记者从阿里云获悉,4月17日晚ky体育,阿里巴巴开源通义万相“首尾帧生视频14B模型”,这是业界首个开源的百亿级参数规模首尾帧生视频模型,它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的720p高清视频,满足延时摄影、变身等更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型ky体育,或在GitHubky体育、Hugging Face、魔搭社区下载模型本地部署后进行二次开发ky体育。
首尾帧生视频比文生视频、单图生视频的可控性更高,是最受AI(人工智能)视频创作者欢迎的功能之一,但这类模型的训练难度较大,对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等均有高要求。
据介绍,基于现有的Wan2.1文生视频基础模型架构,通义万相首尾帧生视频模型进一步引入了额外的条件控制机制,通过该机制可实现流畅且精准的首尾帧变换;在训练阶段,团队还构建了专门用于首尾帧模式的训练数据,同时针对文本与视频编码模块、扩散变换模型模块采用了并行策略,这些策略提升了模型训练和生成效率,也保障了模型具备高分辨率视频生成的效果。
如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像ky体育,违者必究。
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
港股科技板块强势反弹!港股通互联网ETF(159792)盘中涨幅达3.1%
就在明年,“共和党可能遭‘血洗’”!特朗普铁杆盟友发出严厉警告:我不赞成这么做
警方通报:行拘!为等同伴上车,女子伸腿阻拦高铁关门,僵持近1分钟!网友愤怒:严惩
北理工通报:给予宫某开除党籍处分,免去行政职务,撤销其教授职称,解除聘用关系
A股迎来利好,大盘或将选择方向!“天工”机器人半马夺冠,高手这样看机器人板块