SkillsBench

coding

SkillsBench evaluates coding agents on self-contained programming tasks, measuring practical engineering skills across diverse software development scenarios.

Leaderboard

Showing 4 of 4 results

Qwen3.7 Max

59.2%

i
Qwen3.6-27B

48.2%

i
Qwen3.6 Plus

45.7%

i
Qwen3.6-35B-A3B

28.7%

i