亚马逊发布Nova系列大模型：一个可以与GPT-4o系列和Claude 3.5系列竞争的全新大语言模型，但并不免费

大语言模型赛道中，OpenAI的GPT-4o系列和Anthropic的Claude 3.5系列大模型是全球能力最强的模型。传统科技企业如Google等，也在奋力追赶。此前，Amazon公司通过投资anthropic对外提供Claude模型，就在大家以为这家科技巨头准备放弃自研大模型的时候，2024年12月3日，Amazon推出了Nova系列大模型来和全球最强模型竞争。

Amazon Nova系列大模型简介

Amazon的Nova系列大模型是Amazon自研的、从零开始训练的基座大模型，它有多个不同参数规模的版本。

本次发布的Nova系列大模型包含了6个不同的版本，包含了大语言模型、多模态大模型以及图像和视频生成大模型，具体参考如下：

从上面的表格我们可以看到，Amazon Nova 系列包含多个高性能、多模态人工智能模型，旨在满足不同应用场景的需求，从文本处理到图像和视频生成，涵盖了低成本、高速响应、复杂推理等多种功能。

Amazon系列大模型特点介绍

在这里，我们针对Amazon此次发布的大模型做进一步的介绍。

Amazon Nova Micro

Amazon Nova Micro 是一款专为低延迟和高性能文本处理任务设计的模型。它能够在提供极低成本的同时，进行语言理解、翻译、推理、代码完成、头脑风暴及数学问题求解等多种任务。该模型具有超过 200 个字每秒的生成速度，非常适合对响应时间要求极高的应用，如实时聊天机器人、自动化客服和快速响应的文本分析系统。Nova Micro 支持多达 200 种语言，并允许基于文本输入进行微调，最大令牌数为 128k，能够处理大规模的文本数据。

Amazon Nova Lite

Amazon Nova Lite 是一款低成本的多模态模型，能够快速处理图像、视频和文本输入。其特点在于高效的处理能力和广泛的任务适应性，特别适合需要低成本和高响应速度的大规模应用，如实时视频分析、图像识别和多模态数据输入场景。Nova Lite 支持多语言（200 多种语言）和多种输入类型（文本、图像、视频），最大令牌数为 300k，且可以根据不同输入进行微调，确保在多样化任务中具有高准确度和灵活性。

Amazon Nova Pro

Amazon Nova Pro 是一款高精度、多模态的模型，结合了最佳的准确性、速度和成本效益，适用于广泛的任务。它在视频摘要、问答系统、数学推理、软件开发和多步骤工作流的执行中表现尤为出色。Nova Pro 在文本和视觉智能基准测试中均表现领先，尤其擅长指令跟随和智能代理工作流。该模型支持文本、图像和视频输入，最大令牌数为 300k，能够高效处理多模态任务，尤其适合复杂应用场景。Nova Pro 还通过 Comprehensive RAG Benchmark (CRAG)、Berkeley Function Calling Leaderboard 和 Mind2Web 等行业领先的评测，展示了其卓越的能力。

Amazon Nova Premier

Amazon Nova Premier 是亚马逊即将推出的最强大多模态模型，专为复杂推理任务和定制模型的蒸馏设计。该模型预计将在 2025 年第一季度发布，并为处理深度推理任务提供最先进的支持。Nova Premier 的核心优势在于其在复杂应用中的推理能力，以及在多模态输入下的最佳表现。

Amazon Nova Canvas

Amazon Nova Canvas 是一款顶尖的图像生成模型，能够从文本或图像生成高质量的专业级图像。其创新之处在于不仅支持从输入文本生成图像，还提供编辑功能，使用户能够通过文本指令调整图像的颜色、布局等元素，且具备内建的安全和负责任的使用控制。Nova Canvas 的最大输入字符数为 1024，支持英语语言，并将很快推出微调功能，以进一步满足特定需求。

Amazon Nova Reel

Amazon Nova Reel 是一款先进的视频生成模型，支持通过文本和图像生成高质量视频。用户可以使用自然语言指令控制视频的风格、节奏和镜头运动，进一步提高创作自由度。Nova Reel 还内置了安全使用控制，确保生成内容符合道德和法律规范。与 Nova Canvas 类似，Nova Reel 的最大输入字符数为 512，支持英语，并计划推出微调功能，进一步扩展其应用范围。

Amazon Nova 系列涵盖了从文本到多模态（图像和视频）处理的多种应用需求，适用于实时响应、大规模数据处理、复杂推理等多个领域。每个模型在成本、速度、精度方面都有各自的优化，用户可以根据不同的任务需求选择最合适的模型。无论是快速的文本分析、图像生成，还是复杂的多步骤工作流执行，Amazon Nova 系列都提供了强大的技术支持。

Amazon Nova Micro	一款仅支持文本的模型，提供最低延迟的响应且成本非常低，擅长语言理解、翻译、推理、代码完成、头脑风暴和数学问题解决。	低延迟、高性能、适合快速响应的应用，支持多种语言和任务，适合高效处理文本相关的任务。	128k	200+种语言	支持（文本输入）
Amazon Nova Lite	一款超低成本的多模态模型，适用于图像、视频和文本输入的高速处理，适合高互动和大规模应用。	超低成本、多模态、速度极快，适合大规模交互和高负荷应用，支持多种任务，尤其适合成本敏感型应用。	300k	200+种语言	支持（文本、图像、视频输入）
Amazon Nova Pro	一款功能强大的多模态模型，提供最佳的精度、速度和成本平衡，适用于视频摘要、Q&A、数学推理等任务。	高精度、多模态、速度与成本的平衡，支持复杂任务和多步骤工作流，具备行业领先的文本与视觉智能能力。	300k	200+种语言	支持（文本、图像、视频输入）
Amazon Nova Premier	即将推出	预计将支持复杂推理任务和定制模型的蒸馏工作，提供最强大的多模态功能。	--	--	即将支持
Amazon Nova Canvas	一款最先进的图像生成模型，支持从文本或图像生成专业级图像，并提供文本输入编辑图像的功能。	高质量图像生成、文本和图像输入支持、具备图像编辑功能，支持安全和负责任的AI使用。	1024字符	英语	即将支持
Amazon Nova Reel	一款最先进的视频生成模型，支持通过文本和图像生成高质量视频，支持自然语言控制视频风格和节奏。	高质量视频生成、支持文本控制视觉风格和镜头运动，具备安全和负责任的AI使用控制。	512字符	英语	即将支持