MMMU

reasoning

MMMU (Massive Multi-discipline Multimodal Understanding) is a benchmark designed to evaluate multimodal models on college-level subject knowledge and deliberate reasoning. Contains 11.5K meticulously collected multimodal questions from college exams, quizzes, and textbooks, covering six core disciplines: Art & Design, Business, Science, Health & Medicine, Humanities & Social Science, and Tech & Engineering across 30 subjects and 183 subfields.

Leaderboard

Showing 20 of 66 results

Qwen3.6 Plus

86.0%

i
GPT-5.1

85.4%

i
GPT-5.1 Instant

85.4%

i
GPT-5.1 Thinking

85.4%

i
GPT-5

84.2%

i
Qwen3.5-122B-A10B

83.9%

i
o3

82.9%

i
Qwen3.6-27B

82.9%

i
Qwen3.5-27B

82.3%

i
Gemini 2.5 Pro Preview 06-05

82.0%

i
Qwen3.6-35B-A3B

81.7%

i
o4-mini

81.6%

i
Qwen3.5-35B-A3B

81.4%

i
Gemini 2.5 Flash

79.7%

i
Gemini 2.5 Pro

79.6%

i
Step3-VL-10B

78.1%

i
Grok-3

78.0%

i
o1

77.6%

i
Claude Opus 4.7

76.1%

i
Gemini 2.0 Flash Thinking

75.4%

i