FigQA

vision

FigQA is a multiple-choice benchmark on interpreting scientific figures from biology papers. It evaluates dual-use biological knowledge and multimodal reasoning relevant to bioweapons development.

Leaderboard

Showing 3 of 3 results

Claude Mythos Preview

89.0%

i
Claude Opus 4.6

78.3%

i
Grok-4.1 Thinking

34.0%

i