Skip to content

Models Benchmarks Providers

Search models and benchmarks /

Seal-0

reasoning

Categories: reasoning, search
Modality: text
Language: en
Multilingual: No
Max score: 1
Scoring: %, higher is better
Verified by llm-stats: No

Seal-0 is a benchmark for evaluating agentic search capabilities, testing models' ability to navigate and retrieve information using tools.

Leaderboard

Showing 6 of 6 results

Kimi K2.5

57.4%

i
Kimi K2-Thinking-0905

56.3%

i
Qwen3.5-27B

47.2%

i
Qwen3.5-397B-A17B

46.9%

i
Qwen3.5-122B-A10B

44.1%

i
Qwen3.5-35B-A3B

41.4%

i

Wikibench About Theme Content licensed CC BY-SA 4.0.