10秒生成高清视频!通义App联手通义万相2.5引领视觉革命
9月24日,在2025云栖大会上,阿里巴巴推出了通义万相Wan2.5preview系列模型,该系列包含文生视频、图生视频、文生图和图像编辑四大功能模型,通义App也已第一时间接入视频生成模型。这一发布标志着阿里在AI内容生成领域的持续深化与技术突破,展现了其在多模态AI应用上的领先地位。随着这些模型的落地,用户将能更便捷地体验到高质量的图文及视频生成服务,进一步推动AI技术在日常生活和商业场景中的应用普及。
据介绍,该视频生成模型可同步生成与画面相匹配的人声、音效及背景音乐,首次实现了音画同步的视频生成技术。
视频时长由5秒延长至10秒,并支持24帧每秒的1080P高清输出,进一步降低了用户进行电影级视频创作的难度。这一技术提升让普通用户也能更便捷地制作出更具专业感的影像内容,推动了短视频创作向高质量方向发展。
同时,模型指令理解能力持续增强,能够在视频生成过程中实现如运镜等复杂连续动作的精准控制。
用户在通义App的主对话界面输入生成视频的指令后,通义App会自动调用相关模型,为用户生成一段长达10秒的高清视频。这一功能的推出,标志着AI技术在视频生成领域的进一步突破,也为普通用户提供了更加便捷的内容创作方式。随着技术的不断成熟,未来这类应用有望在更多场景中发挥作用,提升用户体验与内容生产的效率。
目前,用户可每天免费生成最多15次,并支持导出无水印视频。
据了解,自今年2月以来,通义万相持续推出多款模型,包括文生视频、图生视频、首尾帧生视频以及全能编辑等功能,相关技术已在通义APP中上线,用户可直接体验。这一系列动作展示了其在AI视频生成领域的快速布局与技术积累。从内容创作到编辑优化,通义万相正逐步构建起一个更全面的AI视觉生态,反映出企业在人工智能应用层面的不断深化与创新。
此次,通义万相2.5在图像生成能力上进行了全面升级,能够生成中英文文字和图表,并支持图像编辑功能,用户只需输入一句话即可完成图片处理。 此次升级进一步提升了AI在视觉内容创作中的实用性,尤其在图文结合、信息可视化等方面展现出更强的适应性。对于需要快速生成或调整图像的用户来说,这一功能无疑提高了工作效率。同时,中英文支持也拓宽了其在全球范围内的应用空间,有助于推动多语言环境下的内容创作与传播。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.007643秒