巨无霸模型震撼亮相:QwQ-32B引领AI智能革命
3月6日,阿里Qwen团队近日对外发布了其最新成果——QwQ-32B大型语言模型。该模型包含320亿参数,在性能上可与激活参数达6710亿的DeepSeek-R1相匹敌。
尽管QwQ-32B的参数量仅为DeepSeek-R1的大约1/21,但借助强化学习技术,该模型实现了显著的性能提升。此外,阿里还在这款推理模型中集成了与Agent相关的功能,使其不仅能使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。
QwQ-32B在多项基准测试中接受了全面评估,涉及数学推理、编程能力和通用能力等多个领域。在数学能力测试AIME24评测集中,以及用于评估代码能力的LiveCodeBench测试中,QwQ-32B的表现与DeepSeek-R1相当,并且大幅优于o1-mini和相同规模的R1蒸馏模型。
同时,在由多位知名研究者主导的多个权威评测榜单中,QwQ-32B同样表现出色。例如,在被誉为“最难LLMs评测榜”的LiveBench、用于评估指令遵循能力的IFEval评测集,以及针对函数或工具调用准确性测试的BFCL中,QwQ-32B的得分均超越了DeepSeek-R1。这不仅展示了QwQ-32B在复杂任务处理上的卓越能力,同时也证明其在指令理解和执行方面具有显著优势。这些评测结果进一步巩固了QwQ-32B作为顶级语言模型的地位,预示着它在未来应用中的巨大潜力。
目前,QwQ-32B已在其官方网站及ModelScope平台开放源代码,用户现在也可以通过QwenChat直接使用和体验这一前沿模型。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.008063秒