Gemma 3n E2B

Gemma 3n is a multimodal model designed to run locally on hardware, supporting image, text, audio, and video inputs. It features a language decoder, audio encoder, and vision encoder, and is available in two sizes: E2B and E4B.

PIQA

78.9%

i
BoolQ

76.4%

i
ARC-E

75.8%

i
HellaSwag

72.2%

i
Winogrande

66.8%

i
TriviaQA

60.8%

i
DROP

53.9%

i
ARC-C

51.7%

i
Social IQa

48.8%

i
BIG-Bench Hard

44.3%

i
Natural Questions

15.5%

i