自然语言处理

Natural Language Process

自然语言处理(NLP)是指计算机科学的一个分支,更具体地说,是人工智能或AI的一个分支,其目的是让计算机有能力以与人类相同的方式理解文本和口头语言。

NLP将计算语言学--基于规则的人类语言建模--与统计学、机器学习和深度学习模型相结合。这些技术结合在一起,使计算机能够处理文本或语音数据形式的人类语言,并 "理解 "其完整的含义,包括说话者或作者的意图和情感。

NLP驱动计算机程序将文本从一种语言翻译成另一种语言,响应口头命令,并迅速总结大量的文本,甚至是实时的。你很有可能以语音操作的GPS系统、数字助理、语音到文本听写软件、客户服务聊天机器人和其他消费便利的形式与NLP进行过互动。但NLP在企业解决方案中也发挥着越来越大的作用,帮助简化业务运营,提高员工生产力,并简化关键任务的业务流程。

——来自IBM

自然语言处理

自然语言处理领域的任务

文档分类

文档分类

Document Classification

35个资源

图片说明

图片说明

Image Captioning

35个资源

问答系统

问答系统

Question Answering

35个资源

机器翻译

机器翻译

Machine Translation

35个资源

情感分析

情感分析

Sentiment Analysis

35个资源

主题建模

主题建模

Topic Modeling

35个资源

文本摘要

文本摘要

Text Summarization

35个资源

代码补全

代码补全

Code Completion

35个资源

文本生成

文本生成

Text Generation

35个资源

语句相似性

语句相似性

Sentence Similarity

35个资源

常识推理

常识推理

Commonsense Reasoning

35个资源

文本嵌入

文本嵌入

Embedding

35个资源

自然语言处理领域的预训练大模型

ERNIE 1.0

3.4

亿个参数

2019-03-16

发布时间

BERT

3.4

亿个参数

2018-10-11

发布时间

Chinchilla

700.0

亿个参数

2022-03-29

发布时间

CodeGen

160.0

亿个参数

2022-04-00

发布时间

Tsinghua-ERNIE

1.14

亿个参数

2019-05-17

发布时间

Flan-T5

110.0

亿个参数

2022-10-20

发布时间

Galactica

1200.0

亿个参数

2022-11-15

发布时间

GLaM

12000.0

亿个参数

2021-12-13

发布时间

Gopher

2800.0

亿个参数

2021-12-08

发布时间

GPT-1

1.17

亿个参数

2018-06-11

发布时间

GPT-2

15.0

亿个参数

2019-02-14

发布时间

GPT-3

1750.0

亿个参数

2020-05-28

发布时间

GPT-NeoX-20B

200.0

亿个参数

2022-04-14

发布时间

MT-NLG

5400.0

亿个参数

2022-01-28

发布时间

OPT

1750.0

亿个参数

2022-05-02

发布时间

PaLM

5400.0

亿个参数

2022-04-05

发布时间

PanGu-Alpha

2000.0

亿个参数

2021-04-26

发布时间

Turing-NLG

170.0

亿个参数

2020-02-13

发布时间

UL2

200.0

亿个参数

2022-05-10

发布时间

T5

110.0

亿个参数

2019-10-23

发布时间

GPT-3.5

1750.0

亿个参数

2022-11-30

发布时间

HunYuan-NLP 1T

10000.0

亿个参数

2022-11-26

发布时间

ChatGPT

1750.0

亿个参数

2022-11-30

发布时间

Instruct GPT

1750.0

亿个参数

2022-03-04

发布时间

LLaMA

650.0

亿个参数

2023-02-24

发布时间

Flan-UL2

200.0

亿个参数

2023-03-03

发布时间

GPT-Neo

27.0

亿个参数

2021-03-22

发布时间

Stanford Alpaca

70.0

亿个参数

2023-03-13

发布时间

ChatGLM-6B

62.0

亿个参数

2023-03-14

发布时间

GLM-130B

1300.0

亿个参数

2022-03-17

发布时间

GPT-4

1750.0

亿个参数

2023-03-14

发布时间

GPT-J 6B

60.0

亿个参数

2021-06-04

发布时间

BLOOM

1760.0

亿个参数

2022-07-11

发布时间

Cerebras GPT

130.0

亿个参数

2023-03-28

发布时间

ColossalChat

130.0

亿个参数

2023-03-29

发布时间

GPT4All

70.0

亿个参数

2023-03-29

发布时间

Vicuna 13B

130.0

亿个参数

2023-03-31

发布时间

Dolly

60.0

亿个参数

2023-03-24

发布时间

CodeGeeX

130.0

亿个参数

2022-09-30

发布时间

Vicuna 7B

70.0

亿个参数

2023-04-07

发布时间

dolly-v2

120.0

亿个参数

2023-04-12

发布时间

Pythia

120.0

亿个参数

2023-04-03

发布时间

StableLM

1750.0

亿个参数

2023-04-20

发布时间

h2oGPT

200.0

亿个参数

2023-04-19

发布时间

MOSS

160.0

亿个参数

2023-02-20

发布时间

RedPajama-7B

70.0

亿个参数

2023-04-17

发布时间

HuggingChat

300.0

亿个参数

2023-04-26

发布时间

Replit Code V1 3B

27.0

亿个参数

2023-04-26

发布时间

OpenAssistant LLaMA

300.0

亿个参数

2023-03-09

发布时间

OpenAssistant-Pythia

120.0

亿个参数

2023-04-03

发布时间

Replit-finetuned-v1-3b

27.0

亿个参数

2023-04-26

发布时间

FastChat-T5

30.0

亿个参数

2023-04-29

发布时间

RedPajama-2.8B

28.0

亿个参数

2023-05-01

发布时间

GPT-2B-001

20.0

亿个参数

2023-04-20

发布时间

OpenLLaMA 7B

70.0

亿个参数

2023-05-03

发布时间

StarCoder

155.0

亿个参数

2023-05-05

发布时间

StarCodeBase

155.0

亿个参数

2023-05-04

发布时间

MPT 7B

70.0

亿个参数

2023-05-05

发布时间

RedPajama INCITE 3B

28.0

亿个参数

2023-05-05

发布时间

GPT-JT

60.0

亿个参数

2022-11-29

发布时间

RedPajama INCITE 7B V0.1

70.0

亿个参数

2023-05-05

发布时间

PaLM 2

3400.0

亿个参数

2023-05-10

发布时间

AI2 OLMo

70.0

亿个参数

2024-01-01

发布时间

Raven 14B

140.0

亿个参数

2022-10-20

发布时间

CodeT5

0.0

亿个参数

2021-09-02

发布时间

CodeT5+

160.0

亿个参数

2023-05-13

发布时间

DoReMi

80.0

亿个参数

2023-05-17

发布时间

GPT4All J

60.0

亿个参数

2023-04-13

发布时间

GPT4All LoRA

70.0

亿个参数

2023-03-29

发布时间

GPT4All 13B

130.0

亿个参数

2023-04-24

发布时间

LIMA

650.0

亿个参数

2023-05-22

发布时间

LongForm OPT

67.0

亿个参数

2023-04-17

发布时间

LongForm LLaMA 7B

70.0

亿个参数

2023-04-26

发布时间

Guanaco

650.0

亿个参数

2023-05-23

发布时间

Falcon 40B

400.0

亿个参数

2023-05-24

发布时间

Falcon 7B

70.0

亿个参数

2023-04-24

发布时间

Falcon 40B Instruct

400.0

亿个参数

2023-05-25

发布时间

Raven RWKV 7B

70.0

亿个参数

2023-05-22

发布时间

CPM-Bee

100.0

亿个参数

2023-05-27

发布时间

LightGPT Instruct 6B

60.0

亿个参数

2023-05-24

发布时间

InternLM Chat 7B 8K

70.0

亿个参数

2023-06-03

发布时间

Goat

70.0

亿个参数

2023-05-23

发布时间

Aquila-7B

70.0

亿个参数

2023-06-10

发布时间

Baichuan 7B

70.0

亿个参数

2023-06-19

发布时间

OpenLLaMA 13B

130.0

亿个参数

2023-06-15

发布时间

Vicuna 33B

650.0

亿个参数

2023-06-21

发布时间

MPT-7B-Base

67.0

亿个参数

2023-05-05

发布时间

MPT-7B-Instruct

67.0

亿个参数

2023-05-05

发布时间

MPT-30B

300.0

亿个参数

2023-06-22

发布时间

MPT-30B-Instruct

300.0

亿个参数

2023-06-22

发布时间

MPT-30B-Chat

300.0

亿个参数

2023-06-22

发布时间

MPT-7B-Chat

67.0

亿个参数

2023-05-05

发布时间

MPT-7B-StoryWriter-65k+

67.0

亿个参数

2023-05-05

发布时间

ChatGLM2-6B

62.0

亿个参数

2023-06-25

发布时间

LongChat-7B-16K

70.0

亿个参数

2023-06-29

发布时间

LongChat-13B-16K

130.0

亿个参数

2023-06-29

发布时间

OpenChat

130.0

亿个参数

2023-07-02

发布时间

OpenChat-8192

130.0

亿个参数

2023-07-02

发布时间

UltraLM-13B

130.0

亿个参数

2023-06-27

发布时间

CodeGen2.5

70.0

亿个参数

2023-07-07

发布时间

XGen-7B

70.0

亿个参数

2023-06-29

发布时间

MPT-7B-8K

70.0

亿个参数

2023-07-18

发布时间

MPT-7B-8k-Instruct

70.0

亿个参数

2023-07-18

发布时间

MPT-7B-8k-Chat

70.0

亿个参数

2023-07-18

发布时间

FreeWilly1

650.0

亿个参数

2023-07-21

发布时间

FreeWilly2

700.0

亿个参数

2023-07-21

发布时间

AquilaCode-7B-multi

70.0

亿个参数

2023-07-24

发布时间

AquilaCode-7B-py

70.0

亿个参数

2023-07-24

发布时间

CodeGeeX2-6B

60.0

亿个参数

2023-07-25

发布时间

BTLM-3B-8K

30.0

亿个参数

2023-07-24

发布时间

PanGu-Coder2

150.0

亿个参数

2023-07-27

发布时间

LLaMA-2-7B-32K

70.0

亿个参数

2023-07-28

发布时间

ChatGLM2-6B-32K

60.0

亿个参数

2023-07-31

发布时间

Vicuna 13B 16K

130.0

亿个参数

2023-08-03

发布时间

Vicuna 7B 16K

70.0

亿个参数

2023-08-03

发布时间

Qwen-7B

70.0

亿个参数

2023-08-03

发布时间

Qwen-7B-Chat

70.0

亿个参数

2023-08-03

发布时间

BGE-Large-en

0.0

亿个参数

2023-08-02

发布时间

BGE-Base-en

0.0

亿个参数

2023-08-02

发布时间

BGE-Small-en

0.0

亿个参数

2023-08-02

发布时间

BGE-Large-zh

3.0

亿个参数

2023-08-02

发布时间

BGE-Large-zh-noinstruct

0.0

亿个参数

2023-08-02

发布时间

BGE-Base-zh

0.0

亿个参数

2023-08-02

发布时间

BGE-Small-zh

0.0

亿个参数

2023-08-02

发布时间

m3e-Large

3.4

亿个参数

2023-06-07

发布时间

m3e-Base

1.1

亿个参数

2023-06-07

发布时间

GTE-Large

3.3

亿个参数

2023-08-07

发布时间

GTE-Base

1.1

亿个参数

2023-08-07

发布时间

GTE-Small

0.3

亿个参数

2023-08-07

发布时间

Multilingual-E5-Large

3.0

亿个参数

2022-12-07

发布时间

E5-Large-v2

3.3

亿个参数

2023-05-19

发布时间

StableCode-Completion-Alpha-3B-4K

30.0

亿个参数

2023-08-08

发布时间

StableCode-Instruct-Alpha-3B

30.0

亿个参数

2023-08-08

发布时间

StableCode-Completion-Alpha-3B

30.0

亿个参数

2023-08-08

发布时间

WizardMath-70B-V1.0

700.0

亿个参数

2023-08-11

发布时间

WizardMath-13B-V1.0

700.0

亿个参数

2023-08-11

发布时间

WizardMath-7B-V1.0

700.0

亿个参数

2023-08-11

发布时间

WizardLM-70B-V1.0

700.0

亿个参数

2023-08-09

发布时间

WizardCoder-15B-V1.0

150.0

亿个参数

2023-06-14

发布时间

XVERSE-13B

130.0

亿个参数

2023-08-06

发布时间

Baichuan 13B - Base

130.0

亿个参数

2023-07-08

发布时间

Baichuan 13B - Chat

130.0

亿个参数

2023-07-08

发布时间

Ziya-LLaMA-13B-v1.1

130.0

亿个参数

2023-06-07

发布时间

LLaMA 7B

70.0

亿个参数

2023-02-24

发布时间

LLaMA 13B

130.0

亿个参数

2023-02-24

发布时间

LLaMA 33B

330.0

亿个参数

2023-02-24

发布时间

LLaMA 65B

650.0

亿个参数

2023-02-24

发布时间

LLaMA2 70B

700.0

亿个参数

2023-07-18

发布时间

LLaMA2 34B

340.0

亿个参数

2023-07-18

发布时间

LLaMA2 13B

130.0

亿个参数

2023-07-18

发布时间

LLaMA2 7B

70.0

亿个参数

2023-07-18

发布时间

Ziya-LLaMA-13B-v1

130.0

亿个参数

2023-05-16

发布时间

Ziya-LLaMA-13B-Pretrain-v1

130.0

亿个参数

2023-06-01

发布时间

ChatGLM2 12B

120.0

亿个参数

2023-06-25

发布时间

SQLCoder

150.0

亿个参数

2023-08-20

发布时间

XVERSE-13B-Chat

130.0

亿个参数

2023-08-22

发布时间

InternLM 7B

70.0

亿个参数

2023-06-03

发布时间

CodeLLaMA-7B

70.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-Python-7B

70.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-Instruct-7B

70.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-Instruct-13B

130.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-Instruct-34B

340.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-Python-34B

340.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-Python-13B

130.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-13B

130.0

亿个参数

2023-08-24

发布时间

CodeLLaMA-34B

340.0

亿个参数

2023-08-24

发布时间

WizardLM-30B-V1

300.0

亿个参数

2023-06-06

发布时间

WizardCoder-Python-34B

340.0

亿个参数

2023-08-26

发布时间

Codex

1750.0

亿个参数

2021-08-10

发布时间

PaLM-Coder

5400.0

亿个参数

2022-04-5

发布时间

PaLM2-S

0.0

亿个参数

2023-05-10

发布时间

WizardCoder-Python-13B-V1.0

130.0

亿个参数

2023-08-27

发布时间

WizardCoder-3B-V1.0

30.0

亿个参数

2023-08-27

发布时间

WizardCoder-1B-V1.0

10.0

亿个参数

2023-08-27

发布时间

Phind-CodeLlama-34B-Python-v1

340.0

亿个参数

2023-08-26

发布时间

Phind-CodeLlama-34B-v1

340.0

亿个参数

2023-08-26

发布时间

Baichuan2-7B-Base

70.0

亿个参数

2023-09-06

发布时间

Baichuan2-7B-Chat

70.0

亿个参数

2023-09-06

发布时间

Baichuan2-13B-Base

130.0

亿个参数

2023-09-06

发布时间

Baichuan2-13B-Chat

130.0

亿个参数

2023-09-06

发布时间

phi-1.5

13.0

亿个参数

2023-09-11

发布时间

DeciLM 6B

57.0

亿个参数

2023-09-13

发布时间

DeciLM 6B-Instruct

57.0

亿个参数

2023-09-13

发布时间

InternLM 20B

200.0

亿个参数

2023-09-20

发布时间

InternLM-Chat 20B

200.0

亿个参数

2023-09-20

发布时间

Qwen-14B

140.0

亿个参数

2023-09-24

发布时间

Qwen-14B-Chat

140.0

亿个参数

2023-09-24

发布时间

Mistral 7B

73.0

亿个参数

2023-09-27

发布时间

Mistral 7B Instruct

73.0

亿个参数

2023-09-27

发布时间

AgentLM-7B

70.0

亿个参数

2023-10-19

发布时间

AgentLM-13B

130.0

亿个参数

2023-10-19

发布时间

AgentLM-70B

700.0

亿个参数

2023-10-19

发布时间

ChatGLM3-6B-Base

60.0

亿个参数

2023-10-27

发布时间

ChatGLM3-6B

60.0

亿个参数

2023-10-27

发布时间

ChatGLM3-6B-32K

60.0

亿个参数

2023-10-27

发布时间

ChatGLM3-3B

30.0

亿个参数

2023-10-27

发布时间

ChatGLM3-1.5B

15.0

亿个参数

2023-10-27

发布时间

Baichuan2-192K

530.0

亿个参数

2023-10-30

发布时间

Grok-1

3140.0

亿个参数

2024-03-17

发布时间

Grok-0

330.0

亿个参数

2023-11-05

发布时间

XVERSE-65B

650.0

亿个参数

2023-11-05

发布时间

Aquila2-34B

340.0

亿个参数

2023-10-25

发布时间

Yi-6B

60.0

亿个参数

2023-11-06

发布时间

Yi-6B-200K

60.0

亿个参数

2023-11-06

发布时间

Yi-34B

340.0

亿个参数

2023-11-06

发布时间

Yi-34B-200K

340.0

亿个参数

2023-11-06

发布时间

BGE-Large-en-v1.5

3.26

亿个参数

2023-09-12

发布时间

jina-embeddings-v2-small-en

0.33

亿个参数

2023-10-27

发布时间

Skywork-13B

130.0

亿个参数

2023-10-30

发布时间

Orca-2-13b

130.0

亿个参数

2023-11-21

发布时间

Qwen-72B

720.0

亿个参数

2023-11-30

发布时间

Qwen-1.8B

18.0

亿个参数

2023-11-30

发布时间

Aquila2-70B-Expr

700.0

亿个参数

2023-11-30

发布时间

Mistral-7B-MoE

450.0

亿个参数

2023-12-08

发布时间

Phi-2

27.0

亿个参数

2023-12-12

发布时间

Phi-1

13.0

亿个参数

2023-06-20

发布时间

Phi-1.5

13.0

亿个参数

2023-09-11

发布时间

DeciLM-7B

70.4

亿个参数

2023-12-12

发布时间

DeciLM-7B-Instruct

70.4

亿个参数

2023-12-12

发布时间

YAYI2-30B

300.0

亿个参数

2023-12-22

发布时间

YAYI2-30B-Chat

300.0

亿个参数

2023-12-20

发布时间

TinyLlama

11.0

亿个参数

2023-09-04

发布时间

LLaMA Pro - 8B

83.0

亿个参数

2024-01-04

发布时间

DeepSeek LLM 7B Base

70.0

亿个参数

2023-11-29

发布时间

DeepSeek LLM 7B Chat

70.0

亿个参数

2023-11-29

发布时间

DeepSeek LLM 67B Chat

670.0

亿个参数

2023-11-29

发布时间

DeepSeek LLM 67B Base

670.0

亿个参数

2023-11-29

发布时间

DeepSeekMoE 16B Base

164.0

亿个参数

2024-01-11

发布时间

DeepSeekMoE 145B Base

1446.0

亿个参数

2024-01-11

发布时间

DeepSeekMoE 16B Chat

164.0

亿个参数

2024-01-11

发布时间

DeepSeekMoE 145B Chat

1446.0

亿个参数

2024-01-11

发布时间

GLM4

0.0

亿个参数

2024-01-16

发布时间

XVERSE-13B-256K

130.0

亿个参数

2024-01-16

发布时间

InternLM2-Base-7B

70.0

亿个参数

2024-01-17

发布时间

InternLM2-Base-20B

200.0

亿个参数

2024-01-17

发布时间

DeepSeek Coder-33B Instruct

330.0

亿个参数

2023-11-01

发布时间

DeepSeek Coder-6.7B Instruct

67.0

亿个参数

2023-11-01

发布时间

Stable LM 2 - 1.6B

16.0

亿个参数

2024-01-19

发布时间

StableLM 2 Zephyr-1.6B

16.0

亿个参数

2024-01-19

发布时间

Orion-14B-Base

140.0

亿个参数

2024-01-22

发布时间

Orion-14B-Chat

140.0

亿个参数

2024-01-22

发布时间

CodeLlama-70B-Base

700.0

亿个参数

2024-01-30

发布时间

CodeLlama-70B-Python

700.0

亿个参数

2024-01-30

发布时间

CodeLlama-70B-Instruct

700.0

亿个参数

2024-01-30

发布时间

baichuan3

0.0

亿个参数

2024-01-29

发布时间

SQLCoder-70B-Alpha

700.0

亿个参数

2024-01-30

发布时间

BGE-M3-Embedding

1.13

亿个参数

2024-01-30

发布时间

BGE-M3-Embedding-Unsupervised

1.13

亿个参数

2024-01-30

发布时间

MiniCPM-2B-SFT

24.0

亿个参数

2024-02-01

发布时间

MiniCPM-2B-DPO

24.0

亿个参数

2024-01-30

发布时间

Qwen1.5-7B-Chat

70.0

亿个参数

2024-02-06

发布时间

Qwen1.5-14B-Chat

140.0

亿个参数

2024-02-06

发布时间

Qwen1.5-72B-Chat

720.0

亿个参数

2024-02-06

发布时间

Qwen1.5-4B-Chat

40.0

亿个参数

2024-02-06

发布时间

Qwen1.5-1.8B-Chat

18.0

亿个参数

2024-02-06

发布时间

Qwen1.5-0.5B-Chat

5.0

亿个参数

2024-02-06

发布时间

Gemini 1.5 Pro

0.0

亿个参数

2024-02-15

发布时间

Mistral Next

0.0

亿个参数

2024-02-16

发布时间

Gemma 7B

70.0

亿个参数

2024-02-21

发布时间

Gemma 2B - It

20.0

亿个参数

2024-02-21

发布时间

Gemma 7B - It

20.0

亿个参数

2024-02-21

发布时间

Mistral Large

0.0

亿个参数

2024-02-26

发布时间

StarCoder2-15B

150.0

亿个参数

2024-02-28

发布时间

Claude3-Opus

0.0

亿个参数

2024-03-04

发布时间

Yi-9B

90.0

亿个参数

2024-03-06

发布时间

C4AI Command-R

350.0

亿个参数

2024-03-11

发布时间

Apollo-7B

70.0

亿个参数

2024-03-07

发布时间

自然语言处理领域的公开数据集