AdvancedIF

reasoning

AdvancedIF is a rubric-based benchmark measuring complex, multi-turn, and system-prompted instruction following ability, scored with a calibrated LLM judge against per-instruction rubrics.

Leaderboard

Showing 2 of 2 results

MAI-Thinking-1

85.0%

i
MAI-Code-1-Flash

71.4%

i