Qwen3 VL 235B A22B Instruct

Qwen3-VL is a large multimodal model that unifies vision, language, and reasoning to achieve human-level perception and cognition across text, images, and video. Built on a 235B-parameter architecture, it integrates early joint training of visual and textual modalities for strong language grounding.

DocVQAtest

97.1%

i
ScreenSpot

95.4%

i
MMLU-Redux

92.2%

i
OCRBench

92.0%

i
MMBench-V1.1

89.9%

i
AI2D

89.7%

i
InfoVQAtest

89.2%

i
MMLU

88.8%

i
IFEval

87.8%

i
MultiPL-E

86.1%

i
WritingBench

85.5%

i
MathVista-Mini

84.9%

i
MLVU

84.3%

i
CSimpleQA

83.4%

i
CC-OCR

82.2%

i
MMLU-Pro

81.8%

i
Include

80.0%

i
RealWorldQA

79.3%

i
VideoMME w/o sub.

79.2%

i
MMMUval

78.7%

i
MMStar

78.4%

i
MMLU-ProX

77.8%

i
Arena-Hard v2

77.4%

i
Multi-IF

76.3%

i
LiveBench 20241125

74.8%

i
AIME 2025

74.7%

i
VideoMMMU

74.7%

i
MuirBench

72.8%

i
BLINK

70.7%

i
MMMU-Pro

68.1%

i
BFCL-v3

67.7%

i
LVBench

67.7%

i
OCRBench-V2 (en)

67.1%

i
OSWorld

66.7%

i
MathVision

66.5%

i
CharadesSTA

64.8%

i
AndroidWorld_SR

63.7%

i
Hallusion Bench

63.2%

i
CharXiv-R

62.1%

i
ScreenSpot Pro

62.0%

i
OCRBench-V2 (zh)

61.8%

i
LiveCodeBench v5

61.4%

i
SuperGPQA

60.4%

i
HMMT25

57.4%

i
LiveCodeBench v6

54.3%

i
SimpleQA

51.9%

i
ERQA

51.3%

i
ODinW

48.6%

i
MM-MT-Bench

8.5

i
Creative Writing v3

0.865

i

Pricing, uptime, and speed via OpenRouter — updated Jul 17, 2026, 04:19 AM.

Provider	Status	Input	Output	Limits	Uptime	Speed	Notes
DeepInfra	available	$0.20/Mtok cache $0.11/Mtok	$0.88/Mtok	262K tokens context 16K tokens max output	99.9% 5m 99.6%	962 ms p50 TTFT 26 tok/s p50	fp8
Parasail	available	$0.21/Mtok cache $0.10/Mtok	$1.90/Mtok	131K tokens context 33K tokens max output	99.9% 5m 100.0%	762 ms p50 TTFT 43 tok/s p50	fp8
Venice	available	$0.21/Mtok cache $0.10/Mtok	$1.90/Mtok	128K tokens context 16K tokens max output	99% 5m 98%	2,061 ms p50 TTFT 31 tok/s p50	fp8
Alibaba	available	$0.26/Mtok	$1.04/Mtok	131K tokens context 33K tokens max output	100.0% 5m 100.0%	650 ms p50 TTFT 27 tok/s p50
Novita	available	$0.30/Mtok	$1.50/Mtok	131K tokens context 33K tokens max output	95% 5m 96%	1,575 ms p50 TTFT 11 tok/s p50	bf16