原创博客

原创AI技术博客

探索人工智能与大模型最新资讯与技术博客，涵盖机器学习、深度学习、自然语言处理等领域的原创技术文章与实践案例。

排序方式

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

近年来，大语言模型（LLM）的能力飞速提升，但评测基准的发展却显得滞后。以广泛使用的MMLU（大规模多任务语言理解）为例，GPT-4、Claude等前沿模型已能在其90%以上的问题上取得高分。这种“评测饱和”现象导致研究者难以精准衡量模型在尖端知识领域的真实能力。为此，Safety for AI和Scale AI的研究人员推出了Humanity’s Last Exam大模型评测基准。这是一个全新的评测基准，旨在成为大模型“闭卷学术评测的终极考验”。

2025/02/03 19:12:293,202

#HLE #大模型评测

大数据环境下的处理系统与数据分析

随着互联网的高速发展,人类进入了一个信息爆炸的时代，每个人的生活都充满了结构化和非结构化的数据。另外，随着以博客、社交网络、基于位置的服务LBS为代表的新型信息发布方式的不断涌现，以及云计算、物联网技术的兴起，数据正以前所未有的速度在不断地增长和积累，数据已经渗透到当今每一个行业和业务职能领域成为重要的产生因素，以数据为驱动的大数据时代已经不可避免地到来。本文主要围绕大数据特征、处理系统、以及大数据分析来阐述大数据环境下的数据分析在思想、流程、方法等方面的转变，以及围绕此主题而出现的相关关键技术与方法。

2018/09/29 16:31:273,202

#大数据

重磅！Kimi K2.5发布，依然免费开源！原生多模态MoE架构，全球最大规模参数的开源模型之一，官方评测结果比肩诸多闭源模型！可以驱动100个子Agent执行！

2026年1月27日，月之暗面（Moonshot AI）发布新一代模型Kimi K2.5。根据官方说明，这是Kimi K2的后续版本，目前已通过Kimi.com网页端和App向用户推送。该模型同步上线Kimi API开放平台及编程助手Kimi Code，模型权重与相关代码也在Hugging Face开源。

2026/01/27 17:27:053,224

#K2 #K2.5

原创AI技术博客

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

大数据环境下的处理系统与数据分析

重磅！Kimi K2.5发布，依然免费开源！原生多模态MoE架构，全球最大规模参数的开源模型之一，官方评测结果比肩诸多闭源模型！可以驱动100个子Agent执行！

《Effective Java 第三版》笔记之一创建静态工厂方法而不是使用构造器

Java中自增操作i++与++i的区别

隐马尔科夫模型及其在NLP中的应用指南

Microsoft Visual C++ 14.0 is required 的解决方案

浮动

TensorFlow学习——基本概念（1）

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

如何让开源大模型支持ChatGPT的Code Interpreter能力：基于LangChain的开源项目Code Interpreter API

Topic model相关文章汇总

Keras框架下的保存模型和加载模型

计算机视觉领域的六大任务简介

TensorFlow与PyTorch近几年发展对比

指标函数（Metrics Function）和损失函数（Loss Function）的区别是什么？

如何把一个目录下的所有文件，合并成一个文件

国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布开源可商用大语言模型CPM-Bee

R语言操作数据库

网络爬虫模拟登陆获取数据并解析实战（二）

不同参数规模大语言模型在不同微调方法下所需要的显存总结

深度学习技巧之一

hive数据操作

Keras框架下输出模型中间层学习到的表示的两种常用方式

大模型评测的新标杆：超高难度的“Humanity’s Last Exam”（HLE）介绍

大数据环境下的处理系统与数据分析

重磅！Kimi K2.5发布，依然免费开源！原生多模态MoE架构，全球最大规模参数的开源模型之一，官方评测结果比肩诸多闭源模型！可以驱动100个子Agent执行！

《Effective Java 第三版》笔记之一 创建静态工厂方法而不是使用构造器

Java中自增操作i++与++i的区别

隐马尔科夫模型及其在NLP中的应用指南

Microsoft Visual C++ 14.0 is required 的解决方案

浮动

TensorFlow学习——基本概念（1）

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

如何让开源大模型支持ChatGPT的Code Interpreter能力：基于LangChain的开源项目Code Interpreter API

Topic model相关文章汇总

Keras框架下的保存模型和加载模型

计算机视觉领域的六大任务简介

TensorFlow与PyTorch近几年发展对比

指标函数（Metrics Function）和损失函数（Loss Function）的区别是什么？

如何把一个目录下的所有文件，合并成一个文件

国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布开源可商用大语言模型CPM-Bee

R语言操作数据库

网络爬虫模拟登陆获取数据并解析实战（二）

不同参数规模大语言模型在不同微调方法下所需要的显存总结

深度学习技巧之一

hive数据操作

Keras框架下输出模型中间层学习到的表示的两种常用方式

《Effective Java 第三版》笔记之一创建静态工厂方法而不是使用构造器