PH

Phi-3-mini 3.8B

基础大模型Phi-3

Phi-3-mini 3.8B

发布时间: 2024-04-23更新于: 2024-04-24 10:58:42914
在线体验GitHubHugging FaceCompare
模型参数
38亿
上下文长度
4K
中文支持
不支持
推理能力

Phi-3-mini 3.8B 是由 Microsoft Azure 发布的 AI 模型,发布时间为 2024-04-23,定位为 基础大模型,参数规模约为 38亿,上下文长度为 4K,模型文件大小约 7.6GB,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Phi-3-mini 3.8B

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
4K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2024-04-23
模型文件大小
7.6GB
MoE架构
总参数 / 激活参数
38亿 / 不涉及
知识截止
暂无数据
Phi-3-mini 3.8B

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
GitHub 源码
暂无GitHub开源地址
在线体验
暂无在线体验地址
Phi-3-mini 3.8B

官方介绍与博客

Phi-3-mini 3.8B

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Phi-3-mini 3.8B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Phi-3-mini 3.8B

发布机构

Phi-3-mini 3.8B

模型解读

微软发布的第三代Phi模型。Phi系列是微软开发的小规模参数语言模型,在30亿及以下的参数规模中,表现亮眼。

这里的Phi-3-mini-3.8B是第三代Phi模型中最小的版本,参数规模38亿。但是在MMLU等评测上结果非常亮眼。

Phi-3-mini-3.8B模型采用了transformer的decoder架构,默认上下文长度是4K,采用了和Llama-2类似的block结构,使用同样的tokenizer,词汇表大小为32064。因此,任何为Llama2开发的工具套件几乎可以直接应用在phi-3-mini上,这个模型训练数据量达到了3.3万亿tokens。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码