首页 > 科技资讯
2025
03-06

腾讯混元开源全新视频创作神器:创造5秒神奇短视频,自动搭配音效

科技资讯
jinting
围观843次
0条评论
发布日期:2025年03月06日 17:05:02

腾讯混元开源全新视频创作神器:创造5秒神奇短视频,自动搭配音效

5秒创意无限,视频创作轻松有趣

   3月6日,腾讯混元在微信公众号上宣布,他们发布了一款新的图生视频模型,并且对外进行了开源。该模型不仅支持生成高质量的2K视频,还增加了对口型和动作驱动等功能,甚至能够自动生成背景音效。这一创新无疑为数字内容创作提供了新的可能性,使得非专业人士也能轻松制作出专业级别的视频内容。这不仅是技术上的一个重大突破,也预示着未来视频创作领域的巨大变革。

   通过图生视频功能,用户仅需上传一张图片,并简单描述期望的动态效果和镜头变化,混元便能根据要求使图片动起来,生成一段5秒的短视频,并自动添加背景音效。此外,上传一张人物图片并输入希望“对口型”的文本或音频,该人物图片就能实现“说话”或“唱歌”。利用“动作驱动”功能,还可以一键生成相同的跳舞视频。

   目前用户可通过混元AI视频官网(https://video.hunyuan.tencent.com/)进行体验,企业和开发者若需使用API接口,则需在腾讯云提出申请。

   此次开源的图生视频模型是对混元文生视频模型开源工作的进一步推进。该模型维持了总参数量130亿,能够广泛应用于各种类型的角色和场景,包括写实视频制作、动漫角色乃至CGI角色的生成。 这一进展无疑为视觉内容创作领域带来了新的活力。在当前数字内容爆炸式增长的背景下,如此强大且灵活的模型将极大地促进高质量视频内容的生产。它不仅降低了视频制作的技术门槛,也为创作者提供了更多可能性,使得个性化和创意化的视频内容得以更便捷地实现。同时,这也预示着未来AI在多媒体内容生成方面的潜力巨大,值得整个行业持续关注。

   开源内容包含权重、推理代码和 LoRA 训练代码,支持开发者基于混元训练专属 LoRA 等衍生模型。目前在 Github、HuggingFace 等主流开发者社区均可下载体验。

   混元开源技术报告表明,混元视频生成模型具有高度的灵活性与可扩展性。该模型在相同的数据集上同时支持图像生成视频和文本生成视频的任务。在确保超逼真画质、平滑表现大幅度动作、自然的镜头转换等特性的同时,模型能够捕捉到丰富的视觉和语义信息,并且能够综合图像、文本、音频和姿态等多种输入条件,实现对生成视频的全方位控制。

   目前,混元开源系列模型现已全面涵盖文本、图像、视频及3D生成等多种模态,在GitHub上已收获超过2.3万开发者的关注与点赞。

   附:混元图生视频开源链接 

   Github:https://github.com/Tencent/HunyuanVideo-I2V

   Huggingface:https://huggingface.co/tencent/HunyuanVideo-I2V

本文固定链接: https://www.news9999.cn/arts_content-63823.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 AirPods依旧霸榜,但增长遇冷:美国iPhone用户耳机偏好新趋势  2025-07-17 11:26:44 物理AI崛起:黄仁勋预言下一个科技浪潮  2025-07-17 11:21:27 苹果iPhone 17 Pro/Max将首配抗刮防眩光黑科技,量产难题已突破  2025-07-17 10:46:42 谷歌官宣8月20日重磅发布,Pixel 10系列或将引领智能手机新潮流  2025-07-17 10:46:11 OPPO K13 Turbo 首发水冷风扇黑科技,手机散热迎来新革命  2025-07-17 10:45:39 印航客机黑匣子惊现关键操作:机长关闭燃油开关引热议  2025-07-17 10:43:25 我国邮政寄递业务量首破千亿,同比增长16.9%创历史新高  2025-07-17 10:42:13 十年内,AI将读懂世界并动手做事?黄仁勋预言未来  2025-07-16 13:05:37 中国石化破局全球:AEH I航空液压油首获适航认证,中国跻身生产强国行列  2025-07-16 12:55:46 HTC VIVE 首款智能眼镜即将亮相,台北发布会引爆8月科技圈  2025-07-16 12:25:15 3D打印新革命!阿迪达斯Climacool Laced鞋款上市,160美元解锁未来穿搭  2025-07-16 12:12:31 「满级防水+风冷黑科技!OPPO K13 Turbo 颠覆性登场」  2025-07-16 12:11:49 2025英特尔技术之旅重磅来袭:9月底凤凰城引爆科技新风暴  2025-07-16 12:11:08 微软宣布Win10 LTSB 2015版本将于10月14日停更,用户需警惕!  2025-07-16 12:01:40 亚马逊推迟网页版 Alexa AI 上线,用户期待再延至七月末  2025-07-16 11:50:54 苹果 AI 框架 MLX 升级支持英伟达 CUDA,开发者成本有望大幅下降  2025-07-16 11:50:28 慧天 X5-14 IRH 颠覆登场:轻薄商务本的未来已来  2025-07-16 11:47:47 华为MatePad系列2025旗舰来袭:麒麟8/9芯片加持,平板性能全面升级  2025-07-16 11:45:58 字节跳动回应H20传闻:未提交采购申请,相关报道存误  2025-07-16 11:38:06 荣耀平板 GT2 Pro 霸气登场:骁龙 8 Gen3 + 10100mAh 大电池,今晚震撼亮相  2025-07-15 14:08:02 萝卜快跑上线武汉:88元畅享全天候无人驾驶出行  2025-07-15 13:22:00 上合数字经济论坛启幕,麒麟操作系统引领全球合作新范式  2025-07-15 13:19:01 微软Surface新品震撼上市:性能飙升50%,6888元起引爆科技圈  2025-07-15 12:39:01 字节跳动进军轻量MR领域:护目镜形态开启沉浸新体验  2025-07-15 12:35:27 黄仁勋:频繁用AI反促认知升级?真相揭秘  2025-07-15 12:12:38
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.008006秒