OCRBench

vision

OCRBench: Comprehensive evaluation benchmark for assessing Optical Character Recognition (OCR) capabilities in Large Multimodal Models across text recognition, scene text VQA, and document understanding tasks

Leaderboard

Showing 20 of 22 results

Kimi K2.5

92.3%

i
Qwen3.5-122B-A10B

92.1%

i
Qwen3 VL 235B A22B Instruct

92.0%

i
Qwen3.5-35B-A3B

91.0%

i
Qwen3 VL 30B A3B Instruct

90.3%

i
Qwen3 VL 8B Instruct

89.6%

i
Qwen3 VL 32B Instruct

89.5%

i
Qwen3.5-27B

89.4%

i
Qwen3.6-27B

89.4%

i
Qwen2.5 VL 72B Instruct

88.5%

i
Qwen3 VL 4B Instruct

88.1%

i
Qwen2-VL-72B-Instruct

87.7%

i
Qwen3 VL 235B A22B Thinking

87.5%

i
Qwen2.5 VL 7B Instruct

86.4%

i
Qwen3 VL 32B Thinking

85.5%

i
Phi-4-multimodal-instruct

84.4%

i
Qwen3 VL 30B A3B Thinking

83.9%

i
DeepSeek VL2 Small

83.4%

i
Qwen3 VL 8B Thinking

81.9%

i
DeepSeek VL2

81.1%

i