VLMsAreBlind

reasoning

A vision-language benchmark that probes blind spots and brittle reasoning in multimodal models.

Leaderboard

Showing 4 of 4 results