标签

「huggingface」相关文章

汇总「huggingface」相关的原创 AI 技术文章与大模型实践笔记，持续更新。

标签:#huggingface

如何在HuggingFace上快速下载DeepSeek-OCR模型？快速下载Hugging Face 大模型的几种实用方法简介

在AI时代，Hugging Face Hub已成为开源大语言模型（LLM）和预训练模型的宝库。从Qwen到DeepSeek系列，这些模型往往体积庞大（几GB甚至上百GB），下载过程容易受网络波动影响，导致中断、重试或失败。作为一名AI从业者，你可能不止一次遇到过“下载到99%就崩”的尴尬。本文将从客观角度，基于实际使用经验，介绍四种常见下载Hugging Face大模型的方法：从基础的Git克隆，到CLI工具、Transformers库，再到国内镜像加速。每种方法都有其适用场景和优缺点，我们将逐一剖析，帮

2025/10/26 20:45:04965

#HuggingFace #大模型教程

HuggingFace官方宣布将对GGUF格式的大模型文件增加更多的支持，未来可以直接在HF上查看GGUF文件的元数据信息！

当前的大模型的参数规模较大，数以千亿的参数导致了它们的预训练结果文件都在几十GB甚至是几百GB，这不仅导致其使用成本很高，在不同平台进行交换也非常困难。因此，大模型预训练结果文件的保存格式对于模型的使用和生态的发展来说极其重要。昨天HuggingFace官方宣布将推动GGUF格式的大模型文件在HuggingFace上的使用。

2024/03/16 21:34:142,234

#GGML #GGUF

2023年11月第四周的HuggingFace流行的十大开源大模型分析——多模态大模型和小规模模型爆发

在本周，HuggingFace最流行的十个大模型多模态模型占了4个，包括StabilityAI最新开源的文本生成视频大模型Stable Video Diffusion、Coqui最新的语音合成大模型XTTS第二代等都吸引了大量的关注多。而大语言模型中，谷歌开源了2022年就已经发布的Switch大模型，该模型号称参数可以达到上万亿，也是十分有意思。

2023/11/26 23:53:444,665

#HuggingFace #多模态大模型

HuggingFace开源语音识别模型Distil-Whisper，基于OpenAI的Whisper-V2模型蒸馏，速度快6倍，参数小49%！

语音识别在实际应用中有非常多的应用。早先，OpenAI发布的Whisper模型是目前语音识别模型中最受关注的一类，也很可能是目前ChatGPT客户端语音识别背后的模型。HuggingFace基于Whisper训练并开源了一个全新的Distil-Whisper，它比Whisper-v2速度快6倍，参数小49%，而实际效果几乎没有区别。

2023/11/02 12:44:253,160

#Distil-Whisper #HuggingFace

HuggingFace宣布在transformers库中引入首个RNN模型：RWKV，一个结合了RNN与Transformer双重优点的模型

RWKV是一个结合了RNN与Transformer双重优点的模型架构。由香港大学物理系毕业的彭博首次提出。简单来说，RWKV是一个RNN架构的模型，但是可以像transformer一样高效训练。今天，HuggingFace官方宣布在transformers库中首次引入RNN这样的模型，足见RWKV模型的价值。

2023/05/15 23:11:382,750

#HuggingFace #RWKV

重磅！Scikit-learn与Hugging Face强强联手了！

Hugging Face一直在努力支持深度学习，但是，这只是深度学习的一部分。传统统计机器学习领域里面最重要的工具Scikit-learn如今终于和深度学习的开源标杆工具Hugging Face联手。

2022/10/18 23:36:351,171

#HuggingFace #sklearn

Hugging Face发布最新的深度学习模型评估库Evaluate！

就在儿童节前一天，Hugging Face发布了一个最新的深度学习模型评估库Evaluate。对于机器学习模型而言，评估是最重要的一个方面。但是Hugging Face认为当前模型评估方面非常分散且没有很好的文档。导致评估十分困难。因此，Hugging Face发布了这样一个Python的库，用以简化大家评估的步骤与时间。

2022/06/01 11:14:402,603

#huggingface #模型评价