MMMU (val)

reasoning

Validation set of the Massive Multi-discipline Multimodal Understanding and Reasoning benchmark. Features college-level multimodal questions across 6 core disciplines (Art & Design, Business, Science, Health & Medicine, Humanities & Social Science, Tech & Engineering) spanning 30 subjects and 183 subfields with diverse image types including charts, diagrams, maps, and tables.

Leaderboard

Showing 11 of 11 results

Qwen3 VL 32B Thinking

78.1%

i
Qwen3 VL 30B A3B Thinking

76.0%

i
Qwen3 VL 32B Instruct

76.0%

i
Qwen3 VL 30B A3B Instruct

74.2%

i
Qwen3 VL 8B Thinking

74.1%

i
Qwen3 VL 4B Thinking

70.8%

i
Qwen3 VL 8B Instruct

69.6%

i
Qwen3 VL 4B Instruct

67.4%

i
Gemma 3 27B

64.9%

i
Gemma 3 12B

59.6%

i
Gemma 3 4B

48.8%

i