最新AI大模型咨询与技术解读——来自DataLearnerAI

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

全球首个200万上下文商业产品开始内测！月之暗面Kimi助手开启最长上下文模型内测邀请。

MoonshotAI（月之暗面）是一家中国的大模型初创企业，在2023年4月份成立。其最为著名的产品就是KimiChat，一个完全免费的大模型聊天机器人。就在刚刚，MoonshotAI官方宣布开启200万上下文的KimiChat内测！这应该是全球首个商业产品支持并内测200万上下文输入的模型了！此前其它产品宣布的200万上下文大多数都没有公开商发。

2024/03/18 17:37:09

1069

KimiChat/Long-Context/MoonshotAI/月之暗面/超长上下文

HuggingFace官方宣布将对GGUF格式的大模型文件增加更多的支持，未来可以直接在HF上查看GGUF文件的元数据信息！

当前的大模型的参数规模较大，数以千亿的参数导致了它们的预训练结果文件都在几十GB甚至是几百GB，这不仅导致其使用成本很高，在不同平台进行交换也非常困难。因此，大模型预训练结果文件的保存格式对于模型的使用和生态的发展来说极其重要。昨天HuggingFace官方宣布将推动GGUF格式的大模型文件在HuggingFace上的使用。

2024/03/16 21:34:14

1582

GGML/GGUF/HuggingFace/大模型加速/大模型文件格式/大模型量化

OpenAI官网测试GPT-4.5介绍页面，最新Bing搜索泄露GPT-4.5的特性，上下文长度拓展到256K！

尽管GPT-4.5的传闻一直存在，但是没有任何地方透露过相关的消息。而最新的OpenAI官网似乎已经悄悄上架了GPT-4.5-Turbo的信息。尽管目前网页被删除，但是Bing检索保留了相关缓存并可以在Bing Chat中回答。

2024/03/13 01:03:58

599

BingChat/GPT-4.5/OpenAI

评测结果超过GPT-4，Anthropic发布第三代大语言模型Claude3，具有多模态能力，实际评测表现优秀！

Anthropic被认为是最像OpenAI的一家公司。他们推出的Claude2模型是全球首个支持200K超长上下文的商业模型。在PDF理解方面被认为表现优秀。就在2023年3月4日，Anthropic推出了他们的第三代大语言模型Claude3，包含3个不同的版本，支持多模态和最高100万上下文输入！

2024/03/05 23:21:28

502

Anthropic/Claude3/Claude3-Opus/Claude大模型

StarCoder2发布，开源编程大模型又一个强大选择！

在近年来，随着人工智能技术的飞速发展，大型语言模型（LLM）在代码生成和编辑领域的应用越来越广泛，成为软件开发中不可或缺的助手。今天，我想向大家介绍一个由BigCode项目与Software Heritage合作开发的下一代代码大型语言模型——StarCoder 2。

2024/03/01 18:54:33

553

StarCoder2/编程大模型

OpenAI正在开发一个全新的基于大模型的Agent产品

今天The Information独家披露了一个令人兴奋的消息，那就是OpenAI正在开发一种Agent产品，可以通过控制用户的设备来帮助用户完成复杂的任务。

2024/02/08 20:28:56

379

AIAgent/ChatGPT新功能/OpenAI新产品

MetaAI官宣开源编程大模型CodeLLaMA！基于LLaMA2微调！超越OpenAI的Codex，最高支持10万tokens输入！

MetaAI发布的LLaMA系列开源大语言模型已经是开源大模型领域最重要的力量了。相当多的所谓开源大模型都是基于这个模型微调得到。在上个月，LLaMA2发布，吸引了全球非常多的关注，也有相当多的后续模型基于LLaMA2进行优化。而今天MetaAI再次开源全新的编程大模型——CodeLLaMA系列，这是MetaAI第一次发布编程大模型，本次发布的CodeLLaMA共有9个版本，分别是CodeLLaMA系列、针对Python优化的CodeLLaMA-Python系列和针对指令优化的CodeLLaMA-Inst

2024/01/30 10:31:51

4114

CodeLLaMA/LLaMA2/编程大模型

OpenAI即将推出DALL·E Controls功能，可以更加精细化控制DALL·E图片生成的效果

DALL·E3是OpenAI推出的文本生成图片服务，背后也是一个文生图大模型。此前，该模型只能通过对话的方式让模型生成图片结果。无法通过配置信息控制模型输出的效果，包括风格、比例等。而最新的截图显示，OpenAI可能即将推出DALL·E Controls功能，可以从不同的方面来控制图片生成的效果。

2024/01/27 08:49:55

253

ChatGPT/DALL·EControls/GPT自定义/版本ChatGPT

OpenAI隐藏的一个ChatGPT新功能：在对话框中@任意GPTs，获得回答！一个巨大的由各种GPT组成的聊天世界即将到来

在最新的ChatGPT的前端代码中，有网友发现了一个OpenAI隐藏的或者正在测试的功能，即在ChatGPT的对话中可以@ 任意GPTs商店中公开的GPTs，然后由这个GPTs为用户当前的对话进行回复，这个功能不需要用户离开当前对话页面。这意味着在一次对话中，我们可以与几百万个不同的GPTs同时协作聊天，就像一个巨大的聊天群，里面有无数个各种各样的GPT一起为你解决问题。

2024/01/26 20:29:02

674

ChatGPT/ChatGPT新功能/GPT自定义/新版本ChatGPT

智谱AI发布国产最强大模型GLM4，理解评测与数学能力仅次于Gemini Ultra和GPT-4，编程能力超过Gemini-pro，还有对标GPTs商店的GLMs

GLM4是智谱AI发布的第四代基座大语言模型，全称General Language Model，最早由清华大学KEG小组再2021年发布。这个基座模型也是著名的开源国产大模型ChatGLM系列的基座模型。本次发布的第四代GLM4的能力相比此前的基座模型提升了60%，已经与世界最强模型Gemini Ultra和GPT-4接近！

2024/01/17 22:27:21

5457

ChatGLM/GLM4/Long-Context/智谱AI

国产全球最长上下文大语言模型开源：XVERSE-13B-256K，一次支持25万字输入，免费商用授权~

深圳的元象科技开源了一个最高上下文256K的大语言模型XVERSE-13B-256K，可以一次性处理25万字左右，是目前上下文长度最高的大模型，而且这个模型是以Apache2.0协议开源，完全免费商用授权。

2024/01/17 22:27:07

661

Long-Context/XVERSE-13B-256K/超长上下文

OpenAI正式开放ChatGPT Team订阅计划，价格每个月贵25%，更多的GPT-4，附ChatGPT付费计划对比

OpenAI今天开放了ChatGPT的Team版本的订阅计划，相比较普通的Plus会员版本，Team版本的计划价格更贵，但是可以使用更多的GPT-4额度。不过，与此前传闻比较少了很多功能，唯一比较吸引人的就是更多的GPT-4使用额度了。最少两个人合买。

2024/01/11 15:12:22

1773

ChatGPTPlus/ChatGPTTeam/ChatGPT订阅

OpenAI可能即将增加按年付费的选项，一年的ChatGPT Plus仅需200美元

在1月8日的ChatGPT网站的接口中，有人发现OpenAI增加了按年订阅的选项。接口返回的信息表示，ChatGPT的按年付费200美元即可，折算之后每个月大约16.66美元，一年立省40美元~

2024/01/09 16:21:58

1680

ChatGPT/ChatGPTPlus/ChatGPT付费

70亿参数规模大模型新选择：Deci开源DeciLM-7B大模型，评测效果远超Llama2-7B，每秒可生成328个tokens。

DeciAI是一家成立于2019年的以色列企业，他们最主要的产品是深度学习平台Deci，可以让大家部署运行更快、更准确的模型。包括Adobe、HPE等都是他们的客户。在昨天，他们开源了截止目前可能是Open LLM Leader综合评分最高的大语言模型DeciLM-7B以及指令优化版本的DeciLM-7B-Instruct。最重要的是，这个模型以Apache2.0的协议开源，可以免费商用。

2023/12/13 22:50:58

349

DeciLM/DeciLM-7B

GPT-4在11月份以来变懒的原因可能已经找到：大模型可能会在节假日期间变得不愿意干活，工作日期间却更加高效

最近一段时间，很多人普遍反映GPT-4变得懒散和愚笨，很多此前可以回答的问题在最近一段时间都无法回答，或者回答比较简单。为此，OpenAI官方也在前几天发布信息说的确收到了这样的信息，但是模型并没有在最近一个多月更新过，所以他们也在好奇是什么原因。而今天的一些测试表明，GPT-4模型会像人一样在不同的时间段有不同的效率。

2023/12/12 13:38:46

2269

ChatGPT/GPT-4/OpenAI/大模型懒惰