DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogGPT-2
GP

GPT-2

Generative Pre-trained Transformer 2

Release date: 2019-02-14更新于: 2023-07-08 07:24:42.231671
Live demoGitHubHugging Face
Parameters
15.0亿
Context length
2K
Chinese support
Not supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Model basics

Reasoning traces
Not supported
Context length
2K tokens
Max output length
No data
Model type
基础大模型
Release date
2019-02-14
Model file size
No data
MoE architecture
No
Total params / Active params
15.0B / N/A
Knowledge cutoff
No data
Inference modes
No mode data

Open source & experience

Code license
Modified MIT License
Weights license
Modified MIT License- 免费商用授权
GitHub repo
https://github.com/openai/gpt-2
Hugging Face
Hugging Face link unavailable
Live demo
No live demo

Official resources

Paper
Language Models are Unsupervised Multitask Learners
DataLearnerAI blog
No blog post yet

API details

API speed
No data
No public API pricing yet.

Benchmark Scores

No benchmark data to show.

Publisher

OpenAI
OpenAI
View publisher details

Model Overview

GPT-2 (Generative Pre-trained Transformer 2)是一种基于深度神经网络的自然语言处理模型,由OpenAI公司于2019年开发。它是GPT系列第二个版本,具有15亿个参数,是一个无监督的预训练语言模型。GPT-2可以执行多种自然语言处理任务,包括文本分类、文本生成、机器翻译和对话生成等。 


GPT-2的训练基于Transformer架构,该架构是Google在2017年提出的一种新型神经网络,它在处理长文本序列时表现出色。GPT-2的预训练过程利用了互联网上大量的文本数据,包括维基百科、新闻文章、社交媒体帖子等。这使得GPT-2可以在各种语言和主题领域中生成高质量的文本。 


与其他NLP模型不同,GPT-2的最大特点是其能够生成高质量、连贯和逼真的文本。在训练过程中,模型学会了模拟大量不同文体的文本,并可以根据给定的开头自动生成相关的段落、故事、对话等内容。这种能力对于自动化写作、自动答题和对话系统等领域都非常有用。 


尽管GPT-2在NLP领域取得了巨大成功,但也存在一些争议。由于其能够生成逼真的虚假信息和误导性的内容,一些人担心它可能被滥用来产生虚假信息、恶意广告等。因此,OpenAI公司只公开了一部分的GPT-2代码和模型参数。

Foundation model

GPT
GPT
View details

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码