Kimi K2 Instruct

Kimi K2 is a state-of-the-art mixture-of-experts (MoE) language model with 32 billion activated parameters and 1 trillion total parameters. Trained with the MuonClip optimizer, it achieves exceptional performance across frontier knowledge, reasoning, and coding tasks while being meticulously optimized for agentic capabilities.

MATH-500

97.4%

i
GSM8k

97.3%

i
CBNSL

95.6%

i
HumanEval

93.3%

i
MMLU-Redux

92.7%

i
IFEval

89.8%

i
AutoLogi

89.5%

i
MMLU

89.5%

i
ZebraLogic

89.0%

i
MultiPL-E

85.7%

i
HumanEval-ER

81.1%

i
MMLU-Pro

81.1%

i
CSimpleQA

78.4%

i
ACEBench

76.5%

i
LiveBench

76.4%

i
MuSR

76.4%

i
GPQA

75.1%

i
CNMO 2024

74.3%

i
SWE-bench Verified (Multiple Attempts)

71.6%

i
Tau2 Retail

70.6%

i
AIME 2024

69.6%

i
SWE-bench Verified (Agentic Coding)

65.8%

i
Tau2 Telecom

65.8%

i
PolyMath-en

65.1%

i
Aider-Polyglot

60.0%

i
SuperGPQA

57.2%

i
Tau2 Airline

56.5%

i
Multi-Challenge

54.1%

i
LiveCodeBench v6

53.7%

i
SWE-bench Verified (Agentless)

51.8%

i
AIME 2025

49.5%

i
SWE-bench Multilingual

47.3%

i
HMMT 2025

38.8%

i
SimpleQA

31.0%

i
Terminal-Bench

30.0%

i
OJBench

27.1%

i
Terminus

25.0%

i
Humanity's Last Exam

4.7%

i