标签为 #大模型教程# 的博客

聚焦人工智能、大模型与深度学习的精选内容，涵盖技术解析、行业洞察和实践经验，帮助你快速掌握值得关注的AI资讯。

如何在HuggingFace上快速下载DeepSeek-OCR模型？快速下载Hugging Face 大模型的几种实用方法简介

在AI时代，Hugging Face Hub已成为开源大语言模型（LLM）和预训练模型的宝库。从Qwen到DeepSeek系列，这些模型往往体积庞大（几GB甚至上百GB），下载过程容易受网络波动影响，导致中断、重试或失败。作为一名AI从业者，你可能不止一次遇到过“下载到99%就崩”的尴尬。本文将从客观角度，基于实际使用经验，介绍四种常见下载Hugging Face大模型的方法：从基础的Git克隆，到CLI工具、Transformers库，再到国内镜像加速。每种方法都有其适用场景和优缺点，我们将逐一剖析，帮

2025/10/26 20:45:04 阅读 161

HuggingFace/大模型教程

Transformer蓝图：Transformer 神经网络架构的综合指南——万字长文、20多个图片介绍大语言模型主流架构Transformer的发展历史、现状和未来结果

CMU的工程人工智能硕士学位的研究生Jean de Nyandwi近期发表了一篇博客，详细介绍了当前大语言模型主流架构Transformer的历史发展和当前现状。这篇博客非常长，超过了1万字，20多个图，涵盖了Transformer之前的架构和发展。此外，这篇长篇介绍里面的公式内容并不多，所以对于害怕数学的童鞋来说也是十分不错。本文是其翻译版本，欢迎大家仔细学习。

2023/09/17 11:12:51 阅读 2337

Transformers架构/大模型教程/大语言模型架构/深度学习架构

最新博客

如何在HuggingFace上快速下载DeepSeek-OCR模型？快速下载Hugging Face 大模型的几种实用方法简介

Transformer蓝图：Transformer 神经网络架构的综合指南——万字长文、20多个图片介绍大语言模型主流架构Transformer的发展历史、现状和未来结果