TLDR9+ (test)

language

A large-scale summarization dataset containing over 9 million training instances extracted from Reddit, designed for extreme summarization (generating one-sentence summaries with high compression and abstraction). More than twice larger than previously proposed datasets.

Leaderboard

Showing 1 of 1 result

Llama 3.2 3B Instruct

19.0%

i