加载中...

Gemma 4 E2B

Name: Google Gemma 4 E2B
Availability: InStock
Author: Google Deep Mind

Google Gemma 4 E2B

Release date: 2026-04-0299

Live demoGitHub Hugging Face Compare

Parameters

51.0亿

Context length

128K

Chinese support

Supported

Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Gemma 4 E2B

Model basics

Reasoning traces

Supported

Thinking modes

Thinking modes not supported

Context length

128K tokens

Max output length

8192 tokens

Model type

推理大模型

Release date

2026-04-02

Model file size

5GB

MoE architecture

Yes

Total params / Active params

51.0B / 23B

Knowledge cutoff

No data

Gemma 4 E2B

Open source & experience

Code license

Apache 2.0

Weights license

Apache 2.0- 免费商用授权

GitHub repo

https://github.com/google/gemma

Hugging Face

https://huggingface.co/google/gemma-4-e2b

Live demo

No live demo

Gemma 4 E2B

Official resources

Paper

Welcome Gemma 4: Frontier multimodal intelligence on device

DataLearnerAI blog

No blog post yet

Gemma 4 E2B

API details

API speed

5/5

No public API pricing yet.

Gemma 4 E2B

Benchmark Results

No benchmark data to show.

Gemma 4 E2B

Publisher

Google Deep Mind

View publisher details

Google Gemma 4 E2B

Model Overview

Google Gemma 4 模型概览

2026年4月2日，Google DeepMind 正式推出了基于 Apache 2.0 协议开源的 Gemma 4 系列模型。作为全新一代的端侧多模态前沿模型，Gemma 4 全面支持文本、图像和音频的原生处理能力。其中，E2B 版本是专为移动设备、笔记本电脑及物联网（IoT）设备打造的极速版本，它可以在 5GB 内存下高效运行，是实现端侧实时代理（Agentic）任务和离线推理的理想选择。

架构设计与硬件规格

参数规模：总体参数量为 51 亿（包含嵌入），有效激活参数量为 23 亿。
上下文窗口：支持高达 128K 的长上下文窗口。
架构升级：采用了交替的局部滑动窗口（Sliding-window）与全局全上下文注意力层，并引入了逐层嵌入（PLE）和共享 KV 缓存技术，极大地降低了端侧设备的显存占用。

多模态处理与核心能力

Gemma 4 E2B 原生支持多语言（140+ 语种），内置了强大的多模态处理能力：

多模态输入：原生集成视觉编码器（保留图像原始纵横比）与音频编码器，可以直接处理图像识别（如 OCR 和图表理解）以及语音输入（ASR语音识别与翻译）。
代理与深度推理：模型内置“思考模式”（Thinking Mode）。通过向系统提示词输入特定的 <|think|> 标签，该模型能执行精准的多步推理、条件逻辑判断和离线代码生成。

设备部署与推荐场景

官方强烈推荐将 E2B 模型应用于严苛的本地和边缘环境：

适用场景：无需联网的端侧智能助手、移动端离线数据处理、低延迟语音交互。模型还可与 Android AICore 无缝集成，功耗降低显著。
已知局限：受限于参数规模，其在极端复杂的企业级长文本逻辑规划中可能不及同系列的大参数版本，适合前置的快速任务响应。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

加载中...

Gemma 4 E2B

Google Gemma 4 E2B

Release date: 2026-04-0299

Live demoGitHub Hugging Face Compare

Parameters

51.0亿

Context length

128K

Chinese support

Supported

Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Gemma 4 E2B

Model basics

Reasoning traces

Supported

Thinking modes

Thinking modes not supported

Context length

128K tokens

Max output length

8192 tokens

Model type

推理大模型

Release date

2026-04-02

Model file size

5GB

MoE architecture

Yes

Total params / Active params

51.0B / 23B

Knowledge cutoff

No data

Gemma 4 E2B

Open source & experience

Code license

Apache 2.0

Weights license

Apache 2.0- 免费商用授权

GitHub repo

https://github.com/google/gemma

Hugging Face

https://huggingface.co/google/gemma-4-e2b

Live demo

No live demo

Gemma 4 E2B

Official resources

Paper

Welcome Gemma 4: Frontier multimodal intelligence on device

DataLearnerAI blog

No blog post yet

Gemma 4 E2B

API details

API speed

5/5

No public API pricing yet.

Gemma 4 E2B

Benchmark Results

No benchmark data to show.

Gemma 4 E2B

Publisher

Google Deep Mind

View publisher details

Google Gemma 4 E2B

Model Overview

Google Gemma 4 模型概览

架构设计与硬件规格

参数规模：总体参数量为 51 亿（包含嵌入），有效激活参数量为 23 亿。
上下文窗口：支持高达 128K 的长上下文窗口。
架构升级：采用了交替的局部滑动窗口（Sliding-window）与全局全上下文注意力层，并引入了逐层嵌入（PLE）和共享 KV 缓存技术，极大地降低了端侧设备的显存占用。

多模态处理与核心能力

Gemma 4 E2B 原生支持多语言（140+ 语种），内置了强大的多模态处理能力：

多模态输入：原生集成视觉编码器（保留图像原始纵横比）与音频编码器，可以直接处理图像识别（如 OCR 和图表理解）以及语音输入（ASR语音识别与翻译）。
代理与深度推理：模型内置“思考模式”（Thinking Mode）。通过向系统提示词输入特定的 <|think|> 标签，该模型能执行精准的多步推理、条件逻辑判断和离线代码生成。

设备部署与推荐场景

官方强烈推荐将 E2B 模型应用于严苛的本地和边缘环境：

适用场景：无需联网的端侧智能助手、移动端离线数据处理、低延迟语音交互。模型还可与 Android AICore 无缝集成，功耗降低显著。
已知局限：受限于参数规模，其在极端复杂的企业级长文本逻辑规划中可能不及同系列的大参数版本，适合前置的快速任务响应。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送