Tau3 Banking

reasoning

τ³-Bench banking domain evaluates agentic models on multi-turn, tool-using customer-support scenarios in a simulated retail banking environment.

Leaderboard

Showing 1 of 1 result