首页 > 科技资讯
2025
01-28

阿里通义Qwen2.5-VL开源:全新视觉理解模型引领三尺寸时代,支持长视频理解和事件捕捉

科技资讯
jinting
围观870次
0条评论
发布日期:2025年01月28日 07:54:24

阿里通义Qwen2.5-VL开源:全新视觉理解模型引领三尺寸时代,支持长视频理解和事件捕捉

视觉AI新边界:Qwen2.5-VL引领多维时代,深度长视频理解再升级

   1月28日,阿里通义千问官方发布消息,宣布推出全新的视觉理解模型Qwen2.5-VL,这是Qwen模型家族中的旗舰视觉语言模型。该模型提供了3B、7B和72B三种不同尺寸的版本。这一举措无疑为人工智能领域注入了新的活力,特别是在多模态理解和处理方面,展示了阿里在技术创新上的持续努力。随着技术的发展,我们期待看到更多基于此类模型的应用场景落地,从而更好地服务于社会和用户需求。

   附 Qwen2.5-VL 的主要特点如下:

   视觉理解:Qwen2.5-VL在识别常见物体方面表现出色,如花、鸟、鱼和昆虫,同时还能够解析图像中的文本、图表、图标、图形以及布局信息。

   代理:Qwen2.5-VL作为一款视觉Agent,已经展现出了强大的能力,不仅可以进行推理,还能动态地使用工具,这标志着它在处理视觉信息方面取得了显著进展。目前,这款技术已经让机器初步具备了操作电脑和手机的能力,这意味着未来人工智能在日常任务中的应用将更加广泛和深入。 这一突破不仅展示了人工智能技术的进步,也预示着人机交互方式即将发生重大变革。随着这类技术的进一步发展和普及,未来的智能设备将能够更好地理解用户的需求,并以更自然的方式与人类互动。这无疑将极大地提升我们的生活质量和工作效率。

   Qwen2.5-VL现在可以分析时长超过1小时的视频内容,并且新增了精确定位相关视频段落以捕捉特定事件的能力。

   视觉定位:Qwen2.5-VL 可以通过生成 bounding boxes 或者 points 来准确定位图像中的物体,并能够为坐标和属性提供稳定的 JSON 输出。

   结构化输出:对于发票、表单和表格中的数据,Qwen2.5-VL能够实现结构化的输出,这为金融和商业领域带来了诸多便利。

   据官方介绍,在旗舰模型Qwen2.5-VL-72B-Instruct的测试中,它在多项跨领域和任务的基准测试中表现卓越,涵盖了大学水平的问题、数学、文档解析、视觉问答、视频理解和视觉Agent操作。Qwen2.5-VL在解读文档和图表方面尤为突出,并且能够作为视觉Agent执行任务,而无需针对具体任务进行额外微调。

   另外,在较小的模型方面,Qwen2.5-VL-7B-Instruct在多项任务中表现优于GPT-4o-mini,而Qwen2.5-VL-3B作为终端侧AI的潜力选手,也在性能上超过了之前的Qwen2-VL 7B版本。

   阿里通义千问官方宣布,相较于Qwen2-VL,Qwen2.5-VL在模型对时间及空间尺度的理解方面进行了增强,并且进一步简化了网络结构以提升模型效率。未来,团队将持续加强模型的问题解决和推理能力,同时融合更多的模态,使模型更加智能化,并朝着能够应对多种输入类型和任务的综合性全能模型方向发展。

本文固定链接: https://www.news9999.cn/arts_content-33875.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 中巴携手发射天眼卫星,助力智慧国土与灾害预警新篇章  2025-07-31 14:51:26 三星S26标准版或迎升杯升级,涨价信号初现?  2025-07-31 14:13:58 iQOO 15 预热引爆热议,中杯或将成性能黑马?  2025-07-31 14:04:00 Redmi K90系列曝光新彩蛋:神秘联名Logo现身镜头模组  2025-07-31 13:35:21 Arm自研芯片引巨头抢鲜试用,科技圈掀起新风暴  2025-07-31 13:08:18 微软发布 DragonV2.1:AI语音转录更自然,错误率降12.8%,支持百种语言合成  2025-07-31 13:04:42 三星Galaxy S26系列或将搭载多形态AI助手,开启智能体验新纪元  2025-07-31 13:04:06 存算一体新突破:AS3000G7引领‘以存代算’革命  2025-07-31 13:03:05 堪察加8.7级地震后 火山怒吼:欧亚最强岩浆喷发震撼全球  2025-07-31 13:01:17 AYANEO 掀桌新宠:KONKR Pocket FIT 安卓掌机搭载骁龙 G3,开启移动游戏新体验  2025-07-31 12:49:08 华为Pura80 Pro系列首推HEIF格式:画质不变,存储节省一半  2025-07-31 12:43:04 微软预警:40个职业或将被AI颠覆,你上榜了吗?  2025-07-31 12:36:54 一加 Ace5 至尊版斩获行业首张 40W UFCS 融合快充认证,开启超充新纪元  2025-07-31 12:35:52 苹果被曝误发三星广告,官方回应正与微博调查沟通  2025-07-31 12:33:39 红魔10S Pro《斗战胜佛》典藏版8月1日震撼揭晓  2025-07-31 12:30:31 联发科AI芯片蓄势待发,2026年或迎10亿美元营收新高  2025-07-31 12:24:52 小米带火至尊版:明年友商或将集体推出至尊系列  2025-07-31 12:24:20 《百年光影,徕卡见证中国》  2025-07-29 14:50:31 微软修复24H2系统鼠标光标异常,7月更新带来全新体验  2025-07-29 14:47:47 国内首个Agentic AI平台PPIO上线,为Agent装上智慧大脑与灵动双手  2025-07-29 14:46:42 子曰大模型全面突围,网易有道AI矩阵引爆2025 WAIC  2025-07-29 14:38:11 鸿蒙上线12306行程提醒,四大场景智能护航出行体验  2025-07-29 14:34:23 联想小新平板 Pro GT 首发 8860mAh 硅基电池 + 68W 超充,性能续航双突破  2025-07-29 14:31:42 英特尔酷睿 Ultra7 首发!Dynabook Portege Z40L-N 轻薄本震撼上市,售价13999元  2025-07-29 14:29:26 荣耀X70 5G十日登顶,成全网最热爆款手机  2025-07-29 14:27:22
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.009077秒