标签

「超长上下文」相关文章

汇总「超长上下文」相关的原创 AI 技术文章与大模型实践笔记，持续更新。

标签:#超长上下文

AA-LCR：大模型长上下文推理能力的权威评测基准（Artificial Analysis Long Context Reasoning）是什么？包含哪些任务？如何测试大模型超长上下文能力？

AA-LCR 是由独立 AI 评测机构 Artificial Analysis 开发的基准测试集，旨在真实模拟知识工作者（如分析师、研究员、律师）处理海量文档的场景。

2026/02/07 09:24:21221

#大模型评测 #大模型评测基准

MiniMaxAI开源全球推理长度最长的推理大模型MiniMax-M1：100万tokens输入，最高支持80K的推理长度

MiniMaxAI于2025年6月17日正式发布了其新一代大模型——MiniMax-M1。MiniMax-M1的核心亮点在于结合了混合专家（MoE）架构和创新的闪电注意力（Lightning Attention）机制。MiniMax-M1不仅原生支持高达100万Token的上下文长度，推理的tokens也支持最高80K，是当前支持的最多推理长度的大模型。此外，MiniMax-M1在计算效率上也很高，例如在生成10万Token时，其FLOPs消耗仅为DeepSeek R1的25%！

2025/06/17 23:49:56658

#MiniMax #MiniMax-M1

A21 Labs宣布开源520亿参数的全新混合专家大模型（Mixture of Experts，MoE）Jamba：单个GPU的上下文长度是Mixtral 8x7B的三倍

A21实验室是一家以色列的大模型研究机构，专门从事自然语言处理相关的研究。就在今天，A21实验室开源了一个全新的基于混合专家的的大语言模型Jamba，这个MoE模型可以在单个GPU上支持最高140K上下文的输入，非常具有吸引力。

2024/03/29 00:04:31585

#Jamba #MoE

全球首个200万上下文商业产品开始内测！月之暗面Kimi助手开启最长上下文模型内测邀请。

MoonshotAI（月之暗面）是一家中国的大模型初创企业，在2023年4月份成立。其最为著名的产品就是KimiChat，一个完全免费的大模型聊天机器人。就在刚刚，MoonshotAI官方宣布开启200万上下文的KimiChat内测！这应该是全球首个商业产品支持并内测200万上下文输入的模型了！此前其它产品宣布的200万上下文大多数都没有公开商发。

2024/03/18 17:37:091,442

#KimiChat #Long-Context