MiniMax M3

MiniMax M3 is the first open-weight model to combine three frontier capabilities: top-tier coding and agentic performance, a 1M-token context window, and native multimodality. It is powered by MiniMax Sparse Attention (MSA), a new sparse attention architecture that partitions the KV cache into blocks to cut per-token compute at long context — roughly 1/20 the cost of the previous generation at 1M tokens, with more than 9x faster prefill and more than 15x faster decode while matching full attention on most capabilities.

OmniDocBench 1.5

91.6%

i
SpreadSheetBench-v1

89.3%

i
Video-MME

85.4%

i
VideoMMMU

84.6%

i
BrowseComp

83.5%

i
SWE-Bench Verified

80.5%

i
MMMU-Pro

78.1%

i
BankerToolBench

76.1%

i
GDPval-Rubrics

74.8%

i
Claw-Eval

74.5%

i
MCP Atlas

74.2%

i
DRACO

73.2%

i
OSWorld-Verified

70.1%

i
Terminal-Bench 2.1

66.0%

i
SVG-Bench

63.7%

i
SWE-Bench Pro

59.0%

i
PaperBench

52.6%

i
VIBE-V2

50.1%

i
LOCA-Bench (256k)

49.3%

i
OfficeQA Pro

45.1%

i
NL2Repo

42.1%

i
LiveSQLBench

40.2%

i
SWE Atlas - Codebase QnA

37.9%

i
PostTrainBench

37.1%

i
SWE-fficiency

34.8%

i
SWE Atlas - Test Writing

30.8%

i
KernelBench Hard

28.8%

i
APEX-Agents

27.7%

i
CL-bench

20.5%

i
YC-Bench

2,100,000

i
USAMO 2026

36

i
IMO 2025

35

i

Pricing, uptime, and speed via OpenRouter — updated Jul 17, 2026, 04:19 AM.

Provider	Status	Input	Output	Limits	Uptime	Speed	Notes
AtlasCloud	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	524K tokens context 524K tokens max output	99.9% 5m 100.0%	846 ms p50 TTFT 40 tok/s p50	fp8
DeepInfra	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	524K tokens context 512K tokens max output	99.9% 5m 100.0%	597 ms p50 TTFT 21 tok/s p50	bf16
GMICloud	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	1.0M tokens context 512K tokens max output	98% 5m 97%	2,499 ms p50 TTFT 7.0 tok/s p50	fp8
Minimax	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	524K tokens context 512K tokens max output	99.8% 5m 99.8%	1,435 ms p50 TTFT 58 tok/s p50	fp8
Novita	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	1.0M tokens context 131K tokens max output	99.9% 5m 100.0%	2,078 ms p50 TTFT 42 tok/s p50	fp8
Parasail	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	1.0M tokens context 1.0M tokens max output	98% 5m 98%	591 ms p50 TTFT 55 tok/s p50	fp8
Together	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	524K tokens context 512K tokens max output	99.9% 5m 100.0%	587 ms p50 TTFT 47 tok/s p50
Venice	available	$0.30/Mtok cache $0.06/Mtok	$1.20/Mtok	524K tokens context 66K tokens max output	97% 5m 99%	1,066 ms p50 TTFT 14 tok/s p50	fp8
Morph	available	$0.60/Mtok	$2.40/Mtok	256K tokens context 256K tokens max output	98% 5m 100.0%	1,173 ms p50 TTFT 43 tok/s p50