QvQ-72B-Preview

An experimental research model focusing on advanced visual reasoning and step-by-step cognitive capabilities. Achieves strong performance on multi-modal science and mathematics tasks, though exhibits some limitations such as potential language mixing and recursive reasoning loops.

MathVista

71.4%

i
MMMU

70.3%

i
MathVision

35.9%

i
OlympiadBench

20.4%

i