预训练大语言模型的三种微调技术总结：fine-tuning、parameter-efficient fine-tuning和prompt-tuning

预训练大模型，尤其是大语言模型已经是当前最火热的AI技术。2018年Google发布BERT模型（BERT在DataLearner官方模型卡信息：https://www.datalearner.com/ai-models/pretrained-models/BERT ）的时候，大家还没有意识到本轮AI浪潮会发展到如此火热的地步。但是，BERT出现之后，fine-tuning技术也随之流行，即将预训练模型的权重冻结，然后根据具体任务进行微调变得十分有效且被应用在很多场景。而随着ChatGPT的火热，parameter-efficient fine-tuning和prompt-tuning技术似乎也有替代传统fine-tuning的趋势，本篇论文将简单描述预训练模型领域这三种微调技术及其差别。

当然，这三种技术并不是有完全隔离的界线，目前很多研究也并没有明显区分，本文的内容结合部分研究提供一种视角。欢迎理性讨论~

一、fine-tuning技术

Fine-tuning是一种在自然语言处理（NLP）中使用的技术，用于将预训练的语言模型适应于特定任务或领域。Fine-tuning的基本思想是采用已经在大量文本上进行训练的预训练语言模型，然后在小规模的任务特定文本上继续训练它。

预训练大语言模型的三种微调技术总结：fine-tuning、parameter-efficient fine-tuning和prompt-tuning

一、fine-tuning技术

DataLearner 官方微信

二、parameter-efficient fine-tuning技术

三、prompt-tuning技术

四、总结

热门博客