OmniDocBench 1.5

reasoning

OmniDocBench 1.5 is a comprehensive benchmark for evaluating multimodal large language models on document understanding tasks, including OCR, document parsing, information extraction, and visual question answering across diverse document types. Lower Overall Edit Distance scores are better.

Leaderboard

Showing 15 of 15 results

MiniMax M3

91.6%

i
Qwen3.6 Plus

91.2%

i
Qwen3.6-35B-A3B

89.9%

i
Qwen3.5-122B-A10B

89.8%

i
Qwen3.5-35B-A3B

89.3%

i
GPT-5.4

89.1%

i
Qwen3.5-27B

88.9%

i
Kimi K2.5

88.8%

i
GPT-5.5 Instant

87.5%

i
GPT-5.4 mini

87.4%

i
GPT-5.4 nano

75.8%

i
DiffusionGemma 26B-A4B

31.9%

i
Gemma 4 12B

16.4%

i
Gemini 3 Flash

12.1%

i
Gemini 3 Pro

11.5%

i