TydiQA

reasoning

A multilingual question answering benchmark covering 11 typologically diverse languages with 204K question-answer pairs. Questions are written by people seeking genuine information and data is collected directly in each language without translation to test model generalization across diverse linguistic structures.

Leaderboard

Showing 2 of 2 results

Llama 4 Maverick

31.7%

i
Llama 4 Scout

31.5%

i