DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Home/
  2. Blog/
  3. Tag: 激活函数
Tag

Articles tagged "激活函数"

A curated list of original AI and LLM articles related to "激活函数", updated regularly.

Tags:#激活函数
Batch Normalization应该在激活函数之前使用还是激活函数之后使用?

Batch Normalization应该在激活函数之前使用还是激活函数之后使用?

Batch Normalization(BN)是深度学习领域最重要的技巧之一,最早由Google的研究人员提出。这个技术可以大大提高深度学习网络的收敛速度。简单来说,BN就是将每一层网络进行归一化,就可以提高整个网络的训练速度,并打乱训练数据,提升精度。但是,BN的使用可以在很多地方,很多人最大的困惑是放在激活函数之前还是激活函数之后使用,著名机器学习领域的博主Santiago总结了这部分需要注意的内容。

2022/11/05 14:42:332,668
#BatchNormalization#深度学习#激活函数
深度学习基础——激活函数以及什么时候该使用激活函数

深度学习基础——激活函数以及什么时候该使用激活函数

这篇博客是来自Analytics Vidhya的一篇文章。写的很不错。

2017/11/04 09:29:2720,941
#深度学习#激活函数

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Today's Picks

如何提高大模型在超长上下文的表现?Claude实验表明加一句prompt立即提升效果~Dirichlet Multinomial Mixture Model做短文本聚类(包括代码)Google发布第二代Gemini大语言模型,首个登场的Gemini 2 Flash Experimental,评测结果显示其能力已经超越上一代的Gemini 1.5 Pro!Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析贝叶斯统计中的一些基本的概念和方法介绍阿里开源2个全新多模态理解大模型Qwen3-VL-4B和8B:主流评测结果超Gemini 2.5 Flash Lite、GPT-5 Nano,面向多模态Agent和机器人应用打造最强SQL代码生成开源大模型发布:DefogAI开源超过gpt-3.5-turbo的SQL生成大模型SQLCoder,免费商用授权~Zhipu AI重磅发布GLM-4.5系列:技术深度解析与多维度性能评测OpenAI CEO详解今明两年GPT发展计划:10万美元部署私有ChatGPT、最高支持100万tokens、建立微调模型应用市场

Hot Blogs

1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)2回归模型中的交互项简介(Interactions in Regression)3贝塔分布(Beta Distribution)简介及其应用4矩母函数简介(Moment-generating function)5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程6使用R语言进行K-means聚类并分析结果7深度学习技巧之Early Stopping(早停法)8H5文件简介和使用9手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署10Wishart分布简介