DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tools

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Home/
  2. Blog List/
  3. Blog Detail

人工智能初创企业Hugging Face是什么样的企业——HuggingFace简介

2021/11/10 21:14:59
13,053 views
人工智能企业简介

Hugging Face是一家非常活跃的人工智能创业公司。它拥有一个非常强大并且活跃的人工智能社区。有超过5000多家机构都在Hugging Face的社区发布内容,包括Google AI、Facebook AI、微软等。自从2016年成立以来,这家企业经历了5轮融资,总共募集了6000万美金。

那么,这是一家什么样的企业?为什么2016年才创立的企业,能有如此大的号召力?本文将简要介绍这家企业相关的信息。

  • Hugging Face的创立历史
  • HuggingFace的业务
  • 总结

Hugging Face的创立历史

Hugging Face创立于2016年。最早是一家开发聊天机器人的企业。他们的目标是使用聊天机器人为无聊的年轻人解闷。当然,这样的创意虽然看起来很好,但显然并没有做得很大。HuggingFace的转变主要来源于它在NLP领域的贡献。在Bert发布不久之后,他们贡献了一个基于Pytorch的Bert预训练模型,即pytorch-pretrained-bert。相信这个库很多人都使用过,这个库非常好用,于是也顺着NLP模型的发展不断扩张。如今,HuggingFace整合了他们的贡献的NLP领域的预训练模型,发布了Transformers库。Transformers 提供了数以千计的预训练模型(包括我们熟知的Bert、GPT、GPT-2、XLM等),支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨让最先进的 NLP 技术人人易用。

如今的Transformers在GitHub上已经有5.38万个stars,被fork了1.27万次。足以证明它的火爆。除此之外,他们还提供了datasets库用以方便访问公开的NLP数据集等很多优秀的工具。HuggingFace也凭借他们贡献的这些内容,吸引了大批的开发者。因此,他们也顺理成章地建立了自己的社区,也吸引了大批的机构入驻。

HuggingFace的业务

如今,HuggingFace的官方网站已经是一个大型的人工智能社区。他们运营着很多产品。HuggingFace的社区模式与我们现有的社区不一样。他们相当于一个机构的品牌专区。每一个机构可以在上面发布自己的模型、数据集和Spaces(这是才出来的一个托管AI应用或者展示AI应用的东西)。

从图中我们可以看到,Facebook AI发布了136个模型,微软发布了86个模型等等。当然,除了这种比较新的可以让大家管理宣传自己AI能力的社区,HuggingFace也有discord社区、community社区和博客等。此外,由于他们的NLP实力很强,他们也在官网中提供了自己的基于NLP的服务和报价,包括直接的专家支持、推断API和AutoNLP等业务。可以帮助我们解决企业的NLP相关的问题。总结一下,他们提供的服务如下:

  • 机构品牌发布模型、数据集、AI应用展示的社区

  • 开源的模型、数据集、工具库

  • NLP相关的解决方案

  • NLP相关的课程

总结

Hugging Face在人工智能领域的影响力很大,运营着很大的一个社区。它的成长转变也是因为贡献了基于pytorch的bert而发生了很大的变化。目前,它们的社区非常活跃,也在持续地贡献优秀的产品。像他们提供的transformers、tokenizers、datasets、accelerate库都对NLP相关的实践产生了很大的促进。此外,各大公司在它的社区的贡献和支持,也让这家企业的社区更加活跃和健康。国内其实应该也需要这样的企业和氛围。不仅需要一些愿意做“贡献”的优秀企业,也需要各个巨头可以放下身段参与社区的建设,支持一些初创的小企业。而不是一味地互相斗争,计算一些鸡毛蒜皮的利益,搞得大家都没了尊重,只剩下啧啧啧了~~respect

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

DataLearner 官方微信二维码
Back to Blog List

Related Blogs

  • 2022年全球最大的10家数据处理相关的创业公司
  • 斯坦福2022年度AI指数报告简介及下载链接
  • 内容生成方向的人工智能企业
  • 吴恩达的LandingAI究竟是一家什么样的创业公司
  • 构建人工智能应用的开发者指南
  • 工业蒸汽量预测-特征工程
  • 一张图看全深度学习中下层软硬件体系结构
  • 亚马逊最新发布Feature Store简介

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署