Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 是 Google DeepMind 于 2026 年 6 月 9 日发布的实时语音翻译专属模型(API ID:gemini-3.5-live-translate-preview),采用端到端音频到音频架构,支持 70+ 语言自动检测与双向翻译,上下文窗口 128K tokens,输出最高 64K tokens。模型保留说话者语调与音色,内嵌 SynthID 水印,已上线 Google Translate、Gemini API 和 Google AI Studio,定价约 $3.50/$21.00 每百万 audio input/output tokens。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Gemini 3.5 Live Translate 是 Google DeepMind 于 2026 年 6 月 9 日正式发布的实时语音翻译专属模型,API 标识符为 gemini-3.5-live-translate-preview。模型采用端到端音频到音频(audio-to-audio)架构,在不经过“识别 → 翻译文本 → 语音合成”串联管道的情况下,直接将输入语音实时转换为目标语言语音,具备极低延迟与自然音色保留能力。
Gemini 3.5 Live Translate 已同步上线 Google Translate(iOS/Android)、Gemini Live API(公开预览)、Google AI Studio(公开预览),以及面向 Google Workspace 企业客户的 Google Meet(私有预览)。
Gemini 3.5 Live Translate 基于 Gemini 3 Pro 架构,专为实时翻译场景做了针对性优化:
不支持的功能:Batch API、上下文缓存(context caching)、函数调用(function calling)、代码执行、搜索增强(Search Grounding)、结构化输出、思考模式(thinking)等。
通过 Gemini Developer API 调用 gemini-3.5-live-translate-preview 的定价:
| 计费项 | 免费档 | 付费档(每百万 tokens) | 等效每分钟价格 |
| 音频输入 | 免费 | $3.50 | 约 $0.0053/分钟 |
| 音频输出 | 免费 | $21.00 | 约 $0.0315/分钟 |
计费基于输入与输出音频 token 总量,换算比率为 25 tokens/秒,综合输入+输出约 $0.0368/分钟。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

| 类型 | 适用条件 | 输入 | 输出 |
|---|---|---|---|
| 音频 | - | $3.50/ 1M | $21.00/ 1M |
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具