V*

reasoning

A visual reasoning benchmark evaluating multimodal inference under challenging spatial and grounded tasks.

Leaderboard

Showing 7 of 7 results

Kimi K2.6

96.9%

i
Qwen3.6 Plus

96.9%

i
Qwen3.6-27B

94.7%

i
Qwen3.5-27B

93.7%

i
Qwen3.5-122B-A10B

93.2%

i
Qwen3.5-35B-A3B

92.7%

i
GLM-5V-Turbo

89.0%

i