自然语言处理

Natural Language Process

自然语言处理(NLP)是指计算机科学的一个分支,更具体地说,是人工智能或AI的一个分支,其目的是让计算机有能力以与人类相同的方式理解文本和口头语言。

NLP将计算语言学--基于规则的人类语言建模--与统计学、机器学习和深度学习模型相结合。这些技术结合在一起,使计算机能够处理文本或语音数据形式的人类语言,并 "理解 "其完整的含义,包括说话者或作者的意图和情感。

NLP驱动计算机程序将文本从一种语言翻译成另一种语言,响应口头命令,并迅速总结大量的文本,甚至是实时的。你很有可能以语音操作的GPS系统、数字助理、语音到文本听写软件、客户服务聊天机器人和其他消费便利的形式与NLP进行过互动。但NLP在企业解决方案中也发挥着越来越大的作用,帮助简化业务运营,提高员工生产力,并简化关键任务的业务流程。

——来自IBM

自然语言处理

自然语言处理领域的任务

文档分类

文档分类

Document Classification

35个资源

图片说明

图片说明

Image Captioning

35个资源

问答系统

问答系统

Question Answering

35个资源

机器翻译

机器翻译

Machine Translation

35个资源

情感分析

情感分析

Sentiment Analysis

35个资源

主题建模

主题建模

Topic Modeling

35个资源

文本摘要

文本摘要

Text Summarization

35个资源

代码补全

代码补全

Code Completion

35个资源

文本生成

文本生成

Text Generation

35个资源

语句相似性

语句相似性

Sentence Similarity

35个资源

常识推理

常识推理

Commonsense Reasoning

35个资源

文本嵌入

文本嵌入

Embedding

35个资源

自然语言处理领域的预训练大模型

ERNIE 1.0

3.4

亿个参数

2019-03-16

发布时间

BERT

3.4

亿个参数

2018-10-11

发布时间

Chinchilla

700

亿个参数

2022-03-29

发布时间

CodeGen

160

亿个参数

2022-04-00

发布时间

Tsinghua-ERNIE

1.14

亿个参数

2019-05-17

发布时间

Flan-T5

110

亿个参数

2022-10-20

发布时间

Galactica

1200

亿个参数

2022-11-15

发布时间

GLaM

12000

亿个参数

2021-12-13

发布时间

Gopher

2800

亿个参数

2021-12-08

发布时间

GPT-1

1.17

亿个参数

2018-06-11

发布时间

GPT-2

15

亿个参数

2019-02-14

发布时间

GPT-3

1750

亿个参数

2020-05-28

发布时间

GPT-NeoX-20B

200

亿个参数

2022-04-14

发布时间

MT-NLG

5400

亿个参数

2022-01-28

发布时间

OPT

1750

亿个参数

2022-05-02

发布时间

PaLM

5400

亿个参数

2022-04-05

发布时间

PanGu-Alpha

2000

亿个参数

2021-04-26

发布时间

Turing-NLG

170

亿个参数

2020-02-13

发布时间

UL2

200

亿个参数

2022-05-10

发布时间

T5

110

亿个参数

2019-10-23

发布时间

GPT-3.5

1750

亿个参数

2022-11-30

发布时间

HunYuan-NLP 1T

10000

亿个参数

2022-11-26

发布时间

ChatGPT

1750

亿个参数

2022-11-30

发布时间

Instruct GPT

1750

亿个参数

2022-03-04

发布时间

LLaMA

650

亿个参数

2023-02-24

发布时间

Flan-UL2

200

亿个参数

2023-03-03

发布时间

GPT-Neo

27

亿个参数

2021-03-22

发布时间

ChatGLM-6B

62

亿个参数

2023-03-14

发布时间

GLM-130B

1300

亿个参数

2022-03-17

发布时间

GPT-4

1750

亿个参数

2023-03-14

发布时间

GPT-J 6B

60

亿个参数

2021-06-04

发布时间

BLOOM

1760

亿个参数

2022-07-11

发布时间

Cerebras GPT

130

亿个参数

2023-03-28

发布时间

ColossalChat

130

亿个参数

2023-03-29

发布时间

GPT4All

70

亿个参数

2023-03-29

发布时间

Vicuna 13B

130

亿个参数

2023-03-31

发布时间

Dolly

60

亿个参数

2023-03-24

发布时间

CodeGeeX

130

亿个参数

2022-09-30

发布时间

Vicuna 7B

70

亿个参数

2023-04-07

发布时间

dolly-v2

120

亿个参数

2023-04-12

发布时间

Pythia

120

亿个参数

2023-04-03

发布时间

StableLM

1750

亿个参数

2023-04-20

发布时间

h2oGPT

200

亿个参数

2023-04-19

发布时间

MOSS

160

亿个参数

2023-02-20

发布时间

RedPajama-7B

70

亿个参数

2023-04-17

发布时间

HuggingChat

300

亿个参数

2023-04-26

发布时间

Replit Code V1 3B

27

亿个参数

2023-04-26

发布时间

OpenAssistant LLaMA

300

亿个参数

2023-03-09

发布时间

OpenAssistant-Pythia

120

亿个参数

2023-04-03

发布时间

Replit-finetuned-v1-3b

27

亿个参数

2023-04-26

发布时间

FastChat-T5

30

亿个参数

2023-04-29

发布时间

RedPajama-2.8B

28

亿个参数

2023-05-01

发布时间

GPT-2B-001

20

亿个参数

2023-04-20

发布时间

OpenLLaMA 7B

70

亿个参数

2023-05-03

发布时间

StarCoder

155

亿个参数

2023-05-05

发布时间

StarCodeBase

155

亿个参数

2023-05-04

发布时间

MPT 7B

70

亿个参数

2023-05-05

发布时间

RedPajama INCITE 3B

28

亿个参数

2023-05-05

发布时间

GPT-JT

60

亿个参数

2022-11-29

发布时间

RedPajama INCITE 7B V0.1

70

亿个参数

2023-05-05

发布时间

PaLM 2

3400

亿个参数

2023-05-10

发布时间

AI2 OLMo

70

亿个参数

2024-01-01

发布时间

Raven 14B

140

亿个参数

2022-10-20

发布时间

CodeT5

0

亿个参数

2021-09-02

发布时间

CodeT5+

160

亿个参数

2023-05-13

发布时间

DoReMi

80

亿个参数

2023-05-17

发布时间

GPT4All J

60

亿个参数

2023-04-13

发布时间

GPT4All LoRA

70

亿个参数

2023-03-29

发布时间

GPT4All 13B

130

亿个参数

2023-04-24

发布时间

LIMA

650

亿个参数

2023-05-22

发布时间

LongForm OPT

67

亿个参数

2023-04-17

发布时间

LongForm LLaMA 7B

70

亿个参数

2023-04-26

发布时间

Guanaco

650

亿个参数

2023-05-23

发布时间

Falcon 40B

400

亿个参数

2023-05-24

发布时间

Falcon 7B

70

亿个参数

2023-04-24

发布时间

Falcon 40B Instruct

400

亿个参数

2023-05-25

发布时间

Raven RWKV 7B

70

亿个参数

2023-05-22

发布时间

CPM-Bee

100

亿个参数

2023-05-27

发布时间

LightGPT Instruct 6B

60

亿个参数

2023-05-24

发布时间

InternLM Chat 7B 8K

70

亿个参数

2023-06-03

发布时间

Goat

70

亿个参数

2023-05-23

发布时间

Aquila-7B

70

亿个参数

2023-06-10

发布时间

Baichuan 7B

70

亿个参数

2023-06-19

发布时间

OpenLLaMA 13B

130

亿个参数

2023-06-15

发布时间

Vicuna 33B

650

亿个参数

2023-06-21

发布时间

MPT-7B-Base

67

亿个参数

2023-05-05

发布时间

MPT-7B-Instruct

67

亿个参数

2023-05-05

发布时间

MPT-30B

300

亿个参数

2023-06-22

发布时间

MPT-30B-Instruct

300

亿个参数

2023-06-22

发布时间

MPT-30B-Chat

300

亿个参数

2023-06-22

发布时间

MPT-7B-Chat

67

亿个参数

2023-05-05

发布时间

MPT-7B-StoryWriter-65k+

67

亿个参数

2023-05-05

发布时间

ChatGLM2-6B

62

亿个参数

2023-06-25

发布时间

LongChat-7B-16K

70

亿个参数

2023-06-29

发布时间

LongChat-13B-16K

130

亿个参数

2023-06-29

发布时间

OpenChat

130

亿个参数

2023-07-02

发布时间

OpenChat-8192

130

亿个参数

2023-07-02

发布时间

UltraLM-13B

130

亿个参数

2023-06-27

发布时间

CodeGen2.5

70

亿个参数

2023-07-07

发布时间

XGen-7B

70

亿个参数

2023-06-29

发布时间

MPT-7B-8K

70

亿个参数

2023-07-18

发布时间

MPT-7B-8k-Instruct

70

亿个参数

2023-07-18

发布时间

MPT-7B-8k-Chat

70

亿个参数

2023-07-18

发布时间

FreeWilly1

650

亿个参数

2023-07-21

发布时间

FreeWilly2

700

亿个参数

2023-07-21

发布时间

AquilaCode-7B-multi

70

亿个参数

2023-07-24

发布时间

AquilaCode-7B-py

70

亿个参数

2023-07-24

发布时间

CodeGeeX2-6B

60

亿个参数

2023-07-25

发布时间

BTLM-3B-8K

30

亿个参数

2023-07-24

发布时间

PanGu-Coder2

150

亿个参数

2023-07-27

发布时间

LLaMA-2-7B-32K

70

亿个参数

2023-07-28

发布时间

ChatGLM2-6B-32K

60

亿个参数

2023-07-31

发布时间

Vicuna 13B 16K

130

亿个参数

2023-08-03

发布时间

Vicuna 7B 16K

70

亿个参数

2023-08-03

发布时间

Qwen-7B

70

亿个参数

2023-08-03

发布时间

Qwen-7B-Chat

70

亿个参数

2023-08-03

发布时间

BGE-Large-en

0

亿个参数

2023-08-02

发布时间

BGE-Base-en

0

亿个参数

2023-08-02

发布时间

BGE-Small-en

0

亿个参数

2023-08-02

发布时间

BGE-Large-zh

0

亿个参数

2023-08-02

发布时间

BGE-Large-zh-noinstruct

0

亿个参数

2023-08-02

发布时间

BGE-Base-zh

0

亿个参数

2023-08-02

发布时间

BGE-Small-zh

0

亿个参数

2023-08-02

发布时间

m3e-Large

3.4

亿个参数

2023-06-07

发布时间

m3e-Base

1.1

亿个参数

2023-06-07

发布时间

GTE-Large

3.3

亿个参数

2023-08-07

发布时间

GTE-Base

1.1

亿个参数

2023-08-07

发布时间

GTE-Small

0.3

亿个参数

2023-08-07

发布时间

Multilingual-E5-Large

3

亿个参数

2022-12-07

发布时间

E5-Large-v2

3.3

亿个参数

2023-05-19

发布时间

StableCode-Completion-Alpha-3B-4K

30

亿个参数

2023-08-08

发布时间

StableCode-Instruct-Alpha-3B

30

亿个参数

2023-08-08

发布时间

StableCode-Completion-Alpha-3B

30

亿个参数

2023-08-08

发布时间

WizardMath-70B-V1.0

700

亿个参数

2023-08-11

发布时间

WizardMath-13B-V1.0

700

亿个参数

2023-08-11

发布时间

WizardMath-7B-V1.0

700

亿个参数

2023-08-11

发布时间

WizardLM-70B-V1.0

700

亿个参数

2023-08-09

发布时间

WizardCoder-15B-V1.0

150

亿个参数

2023-06-14

发布时间

XVERSE-13B

130

亿个参数

2023-08-06

发布时间

Baichuan 13B - Base

130

亿个参数

2023-07-08

发布时间

Baichuan 13B - Chat

130

亿个参数

2023-07-08

发布时间

Ziya-LLaMA-13B-v1.1

130

亿个参数

2023-06-07

发布时间

LLaMA 7B

70

亿个参数

2023-02-24

发布时间

LLaMA 13B

130

亿个参数

2023-02-24

发布时间

LLaMA 33B

330

亿个参数

2023-02-24

发布时间

LLaMA 65B

650

亿个参数

2023-02-24

发布时间

LLaMA2 70B

700

亿个参数

2023-07-18

发布时间

LLaMA2 34B

340

亿个参数

2023-07-18

发布时间

LLaMA2 13B

130

亿个参数

2023-07-18

发布时间

LLaMA2 7B

70

亿个参数

2023-07-18

发布时间

Ziya-LLaMA-13B-v1

130

亿个参数

2023-05-16

发布时间

Ziya-LLaMA-13B-Pretrain-v1

130

亿个参数

2023-06-01

发布时间

ChatGLM2 12B

120

亿个参数

2023-06-25

发布时间

SQLCoder

150

亿个参数

2023-08-20

发布时间

XVERSE-13B-Chat

130

亿个参数

2023-08-22

发布时间

InternLM 7B

70

亿个参数

2023-06-03

发布时间

CodeLLaMA-7B

70

亿个参数

2023-08-24

发布时间

CodeLLaMA-Python-7B

70

亿个参数

2023-08-24

发布时间

CodeLLaMA-Instruct-7B

70

亿个参数

2023-08-24

发布时间

CodeLLaMA-Instruct-13B

130

亿个参数

2023-08-24

发布时间

CodeLLaMA-Instruct-34B

340

亿个参数

2023-08-24

发布时间

CodeLLaMA-Python-34B

340

亿个参数

2023-08-24

发布时间

CodeLLaMA-Python-13B

130

亿个参数

2023-08-24

发布时间

CodeLLaMA-13B

130

亿个参数

2023-08-24

发布时间

CodeLLaMA-34B

340

亿个参数

2023-08-24

发布时间

WizardLM-30B-V1

300

亿个参数

2023-06-06

发布时间

WizardCoder-Python-34B

340

亿个参数

2023-08-26

发布时间

Codex

1750

亿个参数

2021-08-10

发布时间

PaLM-Coder

5400

亿个参数

2022-04-5

发布时间

PaLM2-S

0

亿个参数

2023-05-10

发布时间

WizardCoder-Python-13B-V1.0

130

亿个参数

2023-08-27

发布时间

WizardCoder-3B-V1.0

30

亿个参数

2023-08-27

发布时间

WizardCoder-1B-V1.0

10

亿个参数

2023-08-27

发布时间

Phind-CodeLlama-34B-Python-v1

340

亿个参数

2023-08-26

发布时间

Phind-CodeLlama-34B-v1

340

亿个参数

2023-08-26

发布时间

Baichuan2-7B-Base

70

亿个参数

2023-09-06

发布时间

Baichuan2-7B-Chat

70

亿个参数

2023-09-06

发布时间

Baichuan2-13B-Base

130

亿个参数

2023-09-06

发布时间

Baichuan2-13B-Chat

130

亿个参数

2023-09-06

发布时间

phi-1.5

13

亿个参数

2023-09-11

发布时间

DeciLM 6B

57

亿个参数

2023-09-13

发布时间

DeciLM 6B-Instruct

57

亿个参数

2023-09-13

发布时间

自然语言处理领域的公开数据集