标签为 #HLE# 的博客

聚焦人工智能、大模型与深度学习的精选内容，涵盖技术解析、行业洞察和实践经验，帮助你快速掌握值得关注的AI资讯。

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

近年来，大语言模型（LLM）的能力飞速提升，但评测基准的发展却显得滞后。以广泛使用的MMLU（大规模多任务语言理解）为例，GPT-4、Claude等前沿模型已能在其90%以上的问题上取得高分。这种“评测饱和”现象导致研究者难以精准衡量模型在尖端知识领域的真实能力。为此，Safety for AI和Scale AI的研究人员推出了Humanity’s Last Exam大模型评测基准。这是一个全新的评测基准，旨在成为大模型“闭卷学术评测的终极考验”。

2025/02/03 19:12:29 阅读 2146

HLE/大模型评测/大模型评测基准/评测基准

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

2018/04/20 22:20:24 阅读 3069

三层Dirichlet过程

如何理解狄利克雷过程（Dirichlet Process）

如何理解狄利克雷过程（Dirichlet Process）

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

2018/01/04 20:10:37 阅读 9176

DirichletProcess/狄利克雷过程/非参贝叶斯

Dirichlet Distribution（狄利克雷分布）与Dirichlet Process（狄利克雷过程）

Dirichlet Distribution（狄利克雷分布）与Dirichlet Process（狄利克雷过程）

Dirichlet过程是一个随机过程，在非参数贝叶斯模型中有广泛运用，最常见的应用是Dirichlet过程混合模型

2017/11/14 15:06:41 阅读 103352

Dirichlet分布/Dirichlet过程/无限混合模型/混合模型/贝叶斯模型

Dirichlet Tree Distribution（狄利克雷树分布）

Dirichlet Tree Distribution（狄利克雷树分布）

狄利克雷分布作为多项式分布的先验大家应该比较熟悉了。这里介绍另外一种Dirichlet树结构的分布，也可以作为多项式分布的先验，但却更加灵活

2017/02/06 21:17:00 阅读 5675

Dirichlet/分布/统计基础

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）是一种非参数贝叶斯模型，它可以理解为一种聚类方法，但是不需要指定类别数量，它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:56 阅读 23380

dirichletprocessmixturemodel/dpmm/混合模型/非参数贝叶斯