Llama 3.1 405B Instruct

Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks.

ARC-C

96.9%

i
GSM8k

96.8%

i
API-Bank

92.0%

i
Multilingual MGSM (CoT)

91.6%

i
HumanEval

89.0%

i
IFEval

88.6%

i
MBPP EvalPlus

88.6%

i
MMLU (CoT)

88.6%

i
BFCL

88.5%

i
MMLU

87.3%

i
DROP

84.8%

i
Multipl-E HumanEval

75.2%

i
MATH

73.8%

i
MMLU-Pro

73.3%

i
Multipl-E MBPP

65.7%

i
Nexus

58.7%

i
GPQA

50.7%

i
Gorilla Benchmark API Bench

35.3%

i