DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tools

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
大数据环境下的处理系统与数据分析

大数据环境下的处理系统与数据分析

随着互联网的高速发展,人类进入了一个信息爆炸的时代,每个人的生活都充满了结构化和非结构化的数据。另外,随着以博客、社交网络、基于位置的服务LBS为代表的新型信息发布方式的不断涌现,以及云计算、物联网技术的兴起,数据正以前所未有的速度在不断地增长和积累,数据已经渗透到当今每一个行业和业务职能领域成为重要的产生因素,以数据为驱动的大数据时代已经不可避免地到来。本文主要围绕大数据特征、处理系统、以及大数据分析来阐述大数据环境下的数据分析在思想、流程、方法等方面的转变,以及围绕此主题而出现的相关关键技术与方法。

2018/09/29 16:31:273,119
#大数据
网站开启支持https访问

网站开启支持https访问

2018/09/28 15:46:042,509
#web#编程
《Effective Java 第三版》笔记之七 消除过期的对象引用

《Effective Java 第三版》笔记之七 消除过期的对象引用

本文是Effective Java第三版笔记的第七个之消除过期的对象引用,Item 7: Eliminate obsolete object references

2018/09/28 15:44:232,946
#effectivejava#java
多元时间序列数据的预测和建模

多元时间序列数据的预测和建模

2018/09/28 15:44:1923,929
#机器学习#预测
codeFest2018比赛的冠军解决方案——自然语言处理/计算机视觉/机器学习

codeFest2018比赛的冠军解决方案——自然语言处理/计算机视觉/机器学习

2018/09/28 15:44:163,494
#机器学习#比赛
《Effective Java 第三版》笔记之六 避免创建不必要的对象

《Effective Java 第三版》笔记之六 避免创建不必要的对象

2018/09/27 21:21:413,612
#effectivejava#java
数据特征处理之特征哈希(Feature Hashing)

数据特征处理之特征哈希(Feature Hashing)

2018/09/26 16:56:2315,965
#机器学习#特征工程
Spark源码分析之RDD下的KMeans

Spark源码分析之RDD下的KMeans

这篇博客主要介绍Spark源码中的KMeans部分,说的是RDD下的KMeans源码

2018/09/26 15:22:244,775
#scala#spark
深度学习技巧之Early Stopping(早停法)

深度学习技巧之Early Stopping(早停法)

当我们训练深度学习神经网络的时候通常希望能获得最好的泛化性能(generalization performance,即可以很好地拟合数据)。但是所有的标准深度学习神经网络结构如全连接多层感知机都很容易过拟合:当网络在训练集上表现越来越好,错误率越来越低的时候,实际上在某一刻,它在测试集的表现已经开始变差。早停法就是一种防止深度学习网络模型过拟合的方法。

2018/09/26 09:29:5642,755
#深度学习#深度学习技巧
深度学习技巧之一

深度学习技巧之一

2018/09/25 10:22:473,281
#机器学习#深度学习
使用深度学习(逻辑回归)处理图像识别的问题

使用深度学习(逻辑回归)处理图像识别的问题

本笔记是来自Neural Networks and Deep Learning课程第二周作业

2018/09/23 14:24:044,503
#图像处理#深度学习
Java入门基础笔记-11

Java入门基础笔记-11

2018/09/22 20:06:492,318
#Java#入门
Java入门基础笔记-10

Java入门基础笔记-10

2018/09/22 20:04:332,281
#Java#入门
Java入门基础笔记-9

Java入门基础笔记-9

2018/09/22 20:03:012,315
#Java#入门
Java入门基础笔记-8

Java入门基础笔记-8

2018/09/22 19:59:532,617
#Java#入门
Java入门基础笔记-7

Java入门基础笔记-7

2018/09/22 19:56:552,411
#Java#入门
Java入门基础笔记-6

Java入门基础笔记-6

2018/09/22 19:54:472,339
#Java#入门
Java入门基础笔记-5

Java入门基础笔记-5

2018/09/22 19:52:242,263
#Java#入门
Java入门基础笔记-4

Java入门基础笔记-4

2018/09/22 19:48:432,230
#Java#入门
Java入门基础笔记-3

Java入门基础笔记-3

2018/09/22 19:45:112,273
#Java#入门
7种回归技术

7种回归技术

2018/09/22 17:33:074,017
#回归算法#机器学习
Java入门基础笔记-2

Java入门基础笔记-2

2018/09/22 10:00:392,461
#Java#入门
Java入门基础笔记-1

Java入门基础笔记-1

2018/09/22 09:55:462,568
#Java#入门
Spark之RDD、Dataset和DataFrame

Spark之RDD、Dataset和DataFrame

2018/09/21 17:10:477,664
#spark#编程
Previous
1...323334...40
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

Today's Picks

  • 智谱AI发布第二代CodeGeeX编程大模型:CodeGeeX2-6B,最低6GB显存可运行,基于ChatGLM2-6B微调
  • Topic model相关文章汇总
  • 6种大模型的使用方式总结,使用领域数据集持续做无监督预训练可能是一个好选择
  • XLNet基本思想简介以及为什么它优于BERT
  • OpenAI最新的文本生成图像大模型DALL·E3发布!生成的图像不忽略每一个细节的文本!
  • OpenAI 未来计划曝光!Sam Altman 一句话暗示开源 GPT?~Sam在1月31日举办的AMA中问答记录总结
  • Deep Neural Networks and Tabular Data: A Survey——XGBoost依然是最优秀的算法模型
  • Sam Altman宣布未来几周将发布GPT-4.5,几个月后发布GPT-5,未来免费用户也可以无限量使用GPT-5!