最新AI大模型咨询与技术解读——来自DataLearnerAI

未经证实的GPT-4技术细节，关于GPT-4的参数数量、架构、基础设施、训练数据集、成本等信息泄露，仅供参考

几个小时前SemiAnalysis的DYLAN PATEL和DYLAN PATEL发布了一个关于GPT-4的技术信息，包括GPT-4的架构、参数数量、训练成本、训练数据集等。本篇涉及的GPT-4数据是由他们收集，并未公开数据源。但是内容还是有一定参考性，大家自行判断。

2023/07/11 09:36:14 阅读 1675

GPT-4

OpenAI CEO详解今明两年GPT发展计划：10万美元部署私有ChatGPT、最高支持100万tokens、建立微调模型应用市场

前段时间，OpenAI的CEO Sam Altman与二十多位开发者一起聊了很多关于OpenAI的API和产品的规划问题。Sam Altman透露了一些非常重要的OpenAI的发展方向，包括GPT产品功能的未来规划等。目前这份原始博客内容已经应OpenAI的要求被删除，这里我们简单总结一下这些内容。

2023/06/04 16:19:04 阅读 2395

GPT-4/OpenAI

预训练模型编程框架Transformers迎来重磅更新：Transformers Agents发布，一个完全的多模态AI Agent！

今天，HuggingFace官方宣布了Transformers最大胆的功能：Transformers Agents。这是继AutoGPT开创性发布之后，AI Agent被业界接受的另一个重要的里程碑。

2023/05/13 00:44:20 阅读 1646

AIAgent/AutoGPT/Transformers

MBA与数据分析师危矣？最新内测版本的ChatGPT已经可以针对excel自动做数据分析和异常分析了！

2023年3月23日OpenAI官方宣布ChatGPT即将支持Plugin模式。这是一种用插件的方式来解锁ChatGPT的能力，包括让ChatGPT可以浏览网页、从本地商店订购食材等。今天，沃顿商学院教授Ethan Mollick在推特上公布了自己收到了ChatGPT内测邀请，并使用它的代码解释器（Python Interpreter)插件让ChatGPT针对一份excel数据完成了非常专业的数据分析的工作。

2023/04/29 23:53:59 阅读 1325

ChatGPT/ChatGPT插件

能否用85000美元从头开始训练一个打败ChatGPT的模型，并在浏览器中运行？

尽管当前ChatGPT和GPT-4非常火热，但是高昂的训练成本和部署成本其实导致大部分个人、学术工作者以及中小企业难以去开发自己的模型。使得使用OpenAI的官方服务几乎成为了一种无可替代的选择。本文介绍的是一种低成本开发高效ChatGPT的思路，我认为它适合一些科研机构去做，也适合中小企业创新的方式。这里提到的思路涉及了一些最近发表的成果和业界的一些实践产出，大家可以参考！

2023/04/24 22:47:18 阅读 1396

Alpaca/ChatGPT/LLaMA/大模型/大语言模型/生成模型

AI盛世如你所愿！昨天2个最新的开源“GPT”模型发布！

在最近的24个小时内，有2个开源的自然语言处理领域的开源预训练大模型发布。这两个模型都是类似GPT的Transformer模型，可以完成和ChatGPT类似的能力。最重要的是这2个模型完全开源！

2023/04/24 22:47:01 阅读 867

Cerebras-GPT/GPT/Lit-LLaMA/大模型

“GPT”的模型太多无法选择？让大模型帮你选择大模型！浙江大学发布HuggingGPT！

随着ChatGPT的火爆以及MetaAI开源了LLaMA，各家公司好像一夜之间都有了各种ChatGPT模型的研发实力。而针对不同任务和应用构建的LLM更是层出不穷。那么，如何选择合适的模型完成特定的任务，甚至是使用多个模型完成一个复杂的任务似乎仍然很困难。为此，浙江大学与微软亚洲研究院联合发布了一个大模型写作系统HuggingGPT，可以根据输入的任务帮我们选择合适的大模型解决！

2023/04/24 22:46:06 阅读 2928

HuggingGPT/LLM

彭博社发布金融领域的ChatGPT模型——BloombergGPT

彭博社今天发布了一份研究论文，详细介绍了BloombergGPT的开发，这是一个新的大规模生成式人工智能（AI）模型。这个大型语言模型（LLM）经过专门的金融数据训练，支持金融业内的多种自然语言处理（NLP）任务。

2023/04/24 22:45:14 阅读 916

BloombergGPT

微软发布大语言模型与传统编程语言的集成编程框架——Python版本的Semantic Kernel今日发布

目前的LLM有很多限制，有很多问题并不能很好的解决，例如文本输入长度有限、无法记住很早之前的信息等。而这些问题目前也都缺少合适的解决方案。它们所依赖的技术：如任务规划、提示模板、向量化内存等需要的是编程的智慧。Semantic Kernel就是微软在这个背景下推出的一个结合LLM与传统编程技术的编程框架。

2023/04/24 22:36:51 阅读 1519

ChatGPT/SemanticKernel

OpenAI官方教程：如何使用基于embeddings检索来解决GPT无法处理长文本和最新数据的问题

这是OpenAI官方的cookebook最新更新的一篇技术博客，里面说明了为什么我们需要使用embeddings-based的搜索技术来完成问答任务。

2023/04/24 22:36:29 阅读 8185

ChatGPT/LLM/OpenAI

500+个优质的ChatGPT的Prompts（模板）

随着ChatGPT的火爆，Prompts概念开始被大家所熟知。早期类似如BERT模型的微调都是通过有监督学习的方式进行。但是随着模型越来越大，冻结大部分参数，根据下游任务做微调对模型的影响越来越小。大家开始发现，让下游任务适应预训练模型的训练结果有更好的性能。而ChatGPT的火爆让大家知道，虽然ChatGPT的能力很强，但是需要很好的提问方式才能让它为你所服务。

2023/03/10 23:09:09 阅读 4103

ChatGPT/Prompts/提问模板

GPT-4来了！微软德国CTO透露GPT-4将是多模态模型，并于下周发布！

万众瞩目的GPT-4即将来临！3月9日晚上在德国举办的一个AI会议。微软德国的员工参与了讨论，在介绍微软云的AI能力的时候，微软德国CTO Andreas Braun透露了GPT-4将在下周发布。

2023/03/10 09:10:08 阅读 580

ChatGPT/GPT/GPT-4/OpenAI

重磅优惠！打1折！OpenAI开放最新的GPT-3.5和ChatGPT模型API商业服务！

自从2019年OpenAI开始商业化以来，OpenAI的成果越来越封闭，而商业化的进程越来越快。GPT系列的发展正好印证了这个路径。GPT最初的版本包含了论文、代码和预训练结果。GPT-2刚开始也认为可能会造成不好的伤害而在论文官宣了大半年之后才公布了完整模型。到GPT-3的时候也就给了官方介绍博客和论文，模型则是彻底闭源且开始商业化。而今天OpenAI直接官方博客宣布GPT-3.5商业化，连论文都没有了!

2023/03/02 17:08:35 阅读 1440

ChatGPT/OpenAI

为什么最新的大语言模型（如ChatGPT）都使用强化学习来做微调（finetuning）？

最近，随着ChatGPT的火爆，大语言模型（Large language model）再次被大家所关注。当年BERT横空出世的时候，基于BERT做微调风靡全球。但是，最新的大语言模型如ChatGPT都使用强化学习来做微调，而不是用之前大家所知道的有监督的学习。这是为什么呢？著名AI研究员Sebastian Raschka解释了这样一个很重要的转变。大约有5个原因促使了这一转变。

2023/03/01 20:56:27 阅读 1489

ChatGPT/RLHF/大语言模型/强化学习

即将发布的装备了ChatGPT模型的新版bing都有哪些功能？

今天微软宣布，新版本的Bing将全线接入ChatGPT，试图领先谷歌一步。这篇博客将总结一下带了ChatGPT的新版本Bing将有哪些新功能！

2023/02/09 00:14:53 阅读 816

Bing/ChatGPT/OpenAI/微软

最强AI对话系统ChatGPT不完全使用指南——已发掘功能展览！

12月1日OpenAI官宣了其目前最强的AI对话系统之后，大家发现这个强大的系统能做的事情远超过大家的想象。我们也在第一时间发布了相关的博客：https://datalearner.com/blog/1051669904657253 。由于这个系统实在是太过强大，大家发现的能力越来越强。连Musk也在几个小时之前感叹这个系统是so much better at bullshit than they are！在这篇博客中，我们将收集关于这个系统目前的使用案例，给大家一个更加全面的展示结果。

2022/12/04 09:10:44 阅读 10018

ChatGPT/GPT/OpenAI

OpenAI发布最新最强大的AI对话系统——GPT3.5微调的产物ChatGPT

今天，OpenAI公布了最新的一个基于AI的对话系统ChatGPT，是基于GPT3.5微调的结果，试用显示效果惊人！

2022/12/01 22:24:17 阅读 8269

GPT/OpenAI

最新博客