阿里通义万相2.1革新发布:解锁无限创意,重塑中文视觉叙事
1月10日消息,阿里旗下的通义万相宣布发布2.1版本的更新,此次更新在视频生成和图像生成两大功能上都有显著提升。
在视频生成领域,通义万相2.1通过其自主研发的高效VAE和DiT架构,显著提升了时空上下文建模的能力,使得1080P视频的高效编解码成为可能,甚至支持无限长视频的处理。这一技术突破不仅标志着中文文字视频生成功能的首次实现,也使该平台一举登上了VBench榜单的第一位。这无疑是中国人工智能技术在视频生成领域的又一重要进展,展示了国内科技公司在创新与应用方面的强劲实力。未来,随着此类技术的不断成熟与普及,我们有理由期待更多高质量、多样化的视频内容涌现,为用户带来更加丰富和个性化的体验。
据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等等。
注意到,通义万相2.1版本还具备复杂的运镜功能,能够模拟碰撞、反弹、切割、挤压等多种真实的物理现象,比如雨滴落在伞面上会激起水花。
通义万相2.1在图片生成领域迈出了重要的一步,它不仅支持文生组图,还采用了IC-LoRA图像生成训练方法,结合DiT架构,显著增强了文本到图像的上下文理解能力。通过这种技术,用户可以轻松地对多张图像进行拼接和联合描述,从而实现关联图像之间的组合生成,并且能够保持特征的稳定性和连续性。这一进步不仅为创意工作者提供了更为强大的工具,也标志着人工智能在图像生成领域的应用达到了新的高度。未来,我们或许可以看到更多由AI生成的高质量图像,这些图像不仅美观,还能更准确地传达出设计者的意图。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.007426秒