MMMLU

math

Multilingual Massive Multitask Language Understanding dataset released by OpenAI, featuring professionally translated MMLU test questions across 14 languages including Arabic, Bengali, German, Spanish, French, Hindi, Indonesian, Italian, Japanese, Korean, Portuguese, Swahili, Yoruba, and Chinese. Contains approximately 15,908 multiple-choice questions per language covering 57 subjects.

Leaderboard

Showing 20 of 49 results

Claude Mythos Preview

92.7%

i
Gemini 3.1 Pro

92.6%

i
Gemini 3 Flash

91.8%

i
Gemini 3 Pro

91.8%

i
Claude Opus 4.7

91.5%

i
Claude Opus 4.6

91.1%

i
Claude Opus 4.5

90.8%

i
Qwen3.7 Max

90.3%

i
GPT-5.2

89.6%

i
Claude Opus 4.1

89.5%

i
Qwen3.6 Plus

89.5%

i
Claude Sonnet 4.6

89.3%

i
Claude Sonnet 4.5

89.1%

i
Gemini 3.1 Flash-Lite

88.9%

i
Claude Opus 4

88.8%

i
Qwen3.5-397B-A17B

88.5%

i
Gemma 4 31B

88.4%

i
o1

87.7%

i
GPT-4.1

87.3%

i
Qwen3 235B A22B

86.7%

i