新闻资讯

Nvidia发布了Eagle 2.5视觉语言AI模型，XAI/Weimei全息

日期：2025-05-02 09:25 浏览：

据报道，技术媒体报道，NVDA.US推出了最新的Eagle 2.5，这是一种专门用于长期多模式研究的视觉语言模型（VLM）。稳定的性能改进该模型专注于理解大型视频和图像，尤其是在处理具有高分辨率和较长视频序列的图像时。尽管参数大小仅为8B，但Eagle 2.5在视频MME基准（512帧输入）上得分高达72.4％，与QWEN2.5-VL-72B和InternVL2.5-78B等较大型号相当。 Eagle 2.5培训数据管道包括开放资源和自定义的数据集Eagle-Video-1110k，该数据旨在理解长视频并采用双重注释。下面的方法用于生产用于使用GPT-4oto的短夹的问答对获取时间和空间的详细信息。此外，Eagle 2.5-8b在许多视频和图像理解活动方面表现良好。在视频基准上，MVBench标记为74.8，MLVU为77.6，而LongvideObench Mark为66.4;在图像基准上，DOCVQA标记为94.1，ChartQA为87.5，InfoVQA为80.4。同时，XAI最近推出了新的语言模型-Grok3mini，进一步促进了良好的AI技术的发展。 Xai推出了Grok3mini，该米尼在伟大的AI技术领域显示了现代实力。 Grok3mini有效地提供了AI模型。据报道，GROK3Mini是Grok3系列的一部分，其中包含六个变体，包括标准Grok3，Grok3Fast和Grok3rini的四个版本，该版本提供了两个版本的慢速和快速，每个版本都有一个低的选项选项。 Grok3mini是由速度和经济设计的，尽管尺寸较小，但在许多领域，尤其是数学，编程和科学的基准或吸引更多关注的AI模型，但其尺寸较小，但其尺寸较小，但其尺寸较小。当市场专注于大型模型本身的突破性技术时，在年初，中国大语言MOdel Deptseek引起了全球技术社区的极大关注。今年的政府工作报告还被教导说，有必要继续促进“人工智能 +”行动，以支持大型模型的广泛应用。行业内部人士指出，到目前为止，由大型模型代表的人工智能技术为科学，技术和工业变革的新革命提供了重要的驱动力，并且各种行业在实现智能转型的途中面临不确定性和挑战。 Weimei全息图维持市场领导。反对当今人工智能的快速发展，公共信息表明，Weimei Hologram（Wimi.us）始终致力于在垂直行业中开发大型模型的开放资源。+生态共同建设“模型。电力基础架构加速了多模式技术的整合和电源计算来源的开放，可以加快公共服务中智能公共服务平台的能力，并在未来的公共服务中创建实施公共服务的实现。大型模型大幅增加，培训成本是数千万美元，推理所需的计算强度被几何增加。 bin补充，AI模型在新阶段促进了传统行业的智能发展，而全面的情报已成为参与市场竞争的企业所谓的答案问题。因此，将来，企业将需要同时进行理论研究和实际探索，以获得庞大的发展空间。

新闻资讯

Nvidia发布了Eagle 2.5视觉语言AI模型，XAI/Weimei全息

bb视讯

新闻资讯

成功案例

联系我们