Baichuan4-Finance
百川智能发布的金融大模型,金融场景能力领先GPT-4o近20%
QVQ-72B-Preview 是由阿里通义团队开发的一款多模态视觉推理模型,基于 Qwen2-VL-72B 微调,拥有 73.4B 参数,专注于复杂的视觉理解和跨学科推理任务。QVQ不但能感知更准确的视觉内容,并据此作出更细致的分析推理,还会质疑自身假设,仔细审视其推理过程的每一步,经过深思熟虑后给出最后结论。面对数学、物理、化学等各科学领域难题,QVQ能像人甚至科学家一样,给出思考过程和准确答案。
多项评测数据显示,QVQ超越了此前的视觉理解模型「开源王者」Qwen2-VL,整体表现与「满血版」OpenAI o1、Claude3.5 Sonnet等推理模型相当。在基准测试如 MMMU 和 MathVista 中表现卓越,展现了处理数学、科学等高难度问题的能力。
在考察模型视觉理解及推理的MMMU评测中,QVQ取得了70.3分,水平已达大学级别;在聚焦数学的视觉推理测试MathVista中,QVQ得分超过OpenAI o1,印证了其强大的图形推理能力;在更具多样性和学科广度的MathVison评测中,QVQ表现超越Claude3.5及GPT4o,说明QVQ更擅长解决真实数学问题;在奥赛级别的OlympiadBench基准测试中,QVQ也展现了出色的视觉推理能力。
目前,开发者可在魔搭社区和HuggingFace平台上直接体验。