Phi 4 Reasoning

Phi-4-reasoning is a state-of-the-art open-weight reasoning model finetuned from Phi-4 using supervised fine-tuning on a dataset of chain-of-thought traces and reinforcement learning. It focuses on math, science, and coding skills.

FlenQA

97.7%

i
HumanEval+

92.9%

i
IFEval

83.4%

i
OmniMath

76.6%

i
AIME 2024

75.3%

i
MMLU-Pro

74.3%

i
Arena Hard

73.3%

i
PhiBench

70.6%

i
GPQA

65.8%

i
AIME 2025

62.9%

i
LiveCodeBench

53.8%

i