阿里巴巴·汤蒂·Qianwen 2.5
日期:2025-05-03 14:18 浏览:

众议院在5月1日报告说,阿里巴巴继续专注于AI领域。 QWEN团队在3月发布了QWEN2.5-OMNI-7B型号之后,它昨天(4月30日)发布了Qwen2.5-OMNI-3B。目前可以将其下载到拥抱面孔。主页注:此参数的3B模型是为消费者硬件设计的7B旗舰的轻量级版本,该版本涵盖了各种输入,例如文本,音频,图像和视频。该团队表示,尽管参数收缩量的大小,但3B版本仍在多模式性能中维持7B模型的90%以上,尤其是在实时生成文本和自然语音输出中。基准测试表明,在视频理解(视频访问:68.8)和语音生成(Seed-TTS-TTS-Eval Test-Hard:92.1)等活动中,它接近7B模型级别。在使用QWEN2.5-OMNI-3B内存中使用的目的提供尤其为已知。该团队报告说,当VRAM模型的使用减少了53%处理25,000个长上下文上下文令牌,从7b型号的60.2 GB到28.2 GB。这意味着该模型在不支持业务等级集群的情况下在24GB GPU上运行,并且可以在高端台式机和笔记本电脑上运行。它的创新体系结构,例如薄词器设计和自定义TMROPE嵌入方式,可确保对视频和音频输入的巧合理解。此外,该模型还支持闪存2和BF16精度,进一步提高速度并降低内存消耗。 QWEN2.5-OMNI-3B的使用受到严格限制。根据许可条款,该模型仅用于研究目的。当企业想要开发商业产品时,它必须首先从阿里巴巴团队Qwen获得单独的许可证,这意味着该模型不是直接生产的,并且已部署,并且其定位更倾向于测试和开发原型。参考