Phi-1 - Phi-1

模型详细情况和参数

Phi-1

模型全称
Phi-1
模型简称
Phi-1
模型类型
基础大模型
发布日期
2023-06-20
预训练文件大小
2.84GB
是否支持中文(中文优化)
最高支持的上下文长度
2K
模型参数数量(亿)
13.0
模型代码开源协议
Microsoft Research License
预训练结果开源商用情况
Microsoft Research License - 不可以商用
模型GitHub链接
暂无
模型HuggingFace链接
https://huggingface.co/microsoft/phi-1
在线演示地址
暂无
DataLearnerAI的模型介绍
官方博客论文
Textbooks Are All You Need
基础模型
无基础模型
发布机构

Phi-1 简介

这是微软发布的一个小规模参数的大语言模型,目的是证明使用高质量数据集和合适的模型架构,可以让小规模参数的模型也有涌现的能力。


Phi-1是一个参数仅有13亿的大语言模型,目标是代码生成。从网络上用了60亿tokens的教科书般质量的数据集以及GPT-3.5合成的10亿tokens数据集进行训练。最终,这个模型在代码生成能力上表现非凡,它的python代码生成评测结果与CodeLLaMA-34B差不多,十分让人惊叹。


不过,Phi-1是一个不能商用模型。它的编程评测结果参考我们DataLearnerAI的大模型编程排行: https://www.datalearner.com/ai-models/llm-coding-evaluation 

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

Phi-1所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

Phi-1相关的任务
问答系统

问答系统

Question Answering

35个资源