InfiniteBench/En.QA

long context

InfiniteBench English Question Answering variant - first LLM benchmark featuring average data length surpassing 100K tokens for evaluating long-context capabilities with 12 tasks spanning diverse domains

Leaderboard

Showing 1 of 1 result

Llama 3.2 3B Instruct

19.8%

i