统计、机器学习与编程知识的原创博客

谷歌提出最新的基于规则和机器学习混合的代码补全方法

我们将介绍如何将ML和SE结合起来，开发一种新的基于Transformer的混合语义ML代码补全，现在可供内部谷歌开发人员使用。我们讨论了如何通过（1）使用ML对SE单标记建议重新排序，（2）使用ML应用单行和多行补全并使用SE检查正确性，或（3）使用单标记语义建议的ML的单行和多行延拓来组合ML和SE。

2022/07/31 11:29:10 阅读 823

代码补全

即将发布的装备了ChatGPT模型的新版bing都有哪些功能？

今天微软宣布，新版本的Bing将全线接入ChatGPT，试图领先谷歌一步。这篇博客将总结一下带了ChatGPT的新版本Bing将有哪些新功能！

2023/02/09 00:14:53 阅读 820

Bing/ChatGPT/OpenAI/微软

生成式AI领域拓展！MetaAI开源AudioCraft：一个支持AudioGen、MusicGen等模型的音频生成开发框架

在过去的几年里，我们看到了AI在图像、视频和文本生成方面的巨大进步。然而，音频生成领域的进展却相对滞后。MetaAI这次再为开源贡献重磅产品：AudioCraft，一个支持多个音频生成模型的音频生成开发框架。

2023/08/03 11:45:06 阅读 800

AudioCraft/音频生成模型

向量大模型新选择，阿里开源向量大模型Qwen-Embedding和重排序大模型Qwen-Reranker，开源向量检索能力第一名！完全免费开源。

阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型，这是一套基于Qwen3基础模型构建的专用文本向量与重排（Reranking）模型。该系列模型凭借Qwen3强大的多语言理解能力，在多项文本向量与重排任务的Benchmark上达到了SOTA水平，其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。

2025/06/08 22:01:38 阅读 793

Qwen/Qwen-Embedding/向量大模型/重排序大模型

OpenAI隐藏的一个ChatGPT新功能：在对话框中@任意GPTs，获得回答！一个巨大的由各种GPT组成的聊天世界即将到来

在最新的ChatGPT的前端代码中，有网友发现了一个OpenAI隐藏的或者正在测试的功能，即在ChatGPT的对话中可以@ 任意GPTs商店中公开的GPTs，然后由这个GPTs为用户当前的对话进行回复，这个功能不需要用户离开当前对话页面。这意味着在一次对话中，我们可以与几百万个不同的GPTs同时协作聊天，就像一个巨大的聊天群，里面有无数个各种各样的GPT一起为你解决问题。

2024/01/26 20:29:02 阅读 792

ChatGPT/ChatGPT新功能/GPT自定义/新版本ChatGPT

Kimi开源K2大模型：全球首个开源可商用的1万亿参数规模大模型，MoE架构，评测结果与DeepSeekV3相当，但模型文件有1TB！

Kimi K2是由Moonshot AI最新推出的旗舰级大模型，首次将开放Agentic Intelligence（自主代理智能）与强大工具调用能力有机整合。它不仅在知识推理、数学、代码等传统“非思维模型”任务上展现出全球领先的能力，还特别针对一系列实际Agentic（自动决策与操作型）任务进行了深度优化。在业内，这代表AI模型正从“只会答题”向“能自主完成复杂任务”转变。K2模型完全开源，可免费商用授权。

2025/07/12 09:36:27 阅读 785

AIAgent/K2/Kimi/MoE架构

神秘的图片生成和编辑大模型Nano Banana是什么？背后是Google吗？什么时候发布？能否颠覆Adobe

最近，一个代号 “Nano Banana” 的神秘图像生成与编辑大模型突然在社交网络上掀起风暴。与之前所有模型截然不同，它似乎拥有「记忆面孔」的魔法：无论角度、光影如何变化，人物的面容始终一致；它还能读懂照片里的故事，精准捕捉场景氛围，并服从多步骤、高复杂度的指令。然而，它像幽灵一样没有身世——没有官方文档，没有作者署名，甚至没有一行技术白皮书。极致的神秘感与惊人的效果形成巨大反差，像磁铁般吸住了整个社区的目光：它究竟出自谁手？能力边界到底在哪儿？本文会介绍一下这个模型当前已知的信息，以及如何使用。

2025/08/24 16:43:54 阅读 779

NanoBanana/图片生成大模型/图片编辑大模型

让大语言模型为文本处理提提速：Scikit-learn与LLM的合体Scikit-LLM开源项目发布

虽然LLM在很多任务上很好用，但是实际应用中我们常见的文本分类、文本标注等工作目前却依然缺少一个可以利用LLM能力的好方法。LLM的强大并没有在工程落地上比肩传统的机器学习处理框架。上周，一个叫Scikit-LLM新的开源项目发布，将传统优秀的Scikit-learn框架与LLM结合，带来了LLM落地的新方法。

2023/05/24 23:19:40 阅读 776

LLM/Scikit-Learn/Scikit-LLM

OpenAI秘密武器Q到底是什么？一个神秘帖子的解密：Q是一个不同于当前大模型推理方式的新对话生成系统

在去年末的OpenAI宫斗风波中，伴随着Sam下台和重新掌权过程中有一个非常重要但不被大家了解的算法Q*。国外的路透社曾经提到OpenAI内部一个称为Q*（Q Star）项目取得了非常重大的突破，使得部分人认为AGI很接近，进而引发了一系列事件。但是，Q*到底是什么？是否存在一直被很多人猜测。而最近，一个神秘的帖子继续爆料了Q*的信息。

2024/03/20 17:17:42 阅读 775

OpenAI/Q*/Q-Star

重磅Llama3即将发布！目前已知有80亿和700亿参数两个版本，其中Llama3-8B-Instruct已经上架微软云服务市场！

Llama系列是MetaAI开源的大语言模型，是全球开源大模型中最重要的力量之一。第一代的Llama系列模型不允许商用，第二代模型则放松了范围，允许商用。而Llama系列模型因为优秀的品质，也是许多开源模型的基座。而今天Llama3即将发布。

2024/04/18 23:21:39 阅读 771

Llama3/Llama3-70B/Llama3-8B-Instruct

Meta即将推出开源的CodeLLaMA：一种新的编程AI模型

据传，Meta公司即将推出一款名为Code LLaMA的开源AI模型，用于生成编程代码。这一新模型被视为与OpenAI的Codex模型竞争的产品，并建立在Meta最近发布的LLaMA 2上。以下是关于这一新技术的详细分析。

2023/08/24 20:39:36 阅读 762

CodeLLaMA/LLaMA/编程大模型

生成式AI平台的玩家都有哪些？

近几年人工智能的发展已经让大家感受到AI算法不再是实验室的小玩具，它对社会和生活的影响已经在逐步显现。仅几年的AI模型如ChatGPT、DALL·E2、StableDiffusion等都是生成式模型，即基于无标注数据训练的可以根据输入观测数据的模型。而生成式AI平台可能是未来最重要的一种平台能力。本文是由Matt Bornstein, Guido Appenzeller, and Martin Casado等人发布的介绍当前生成式AI平台的相关企业。

2023/03/01 22:55:07 阅读 758

AI

Arena Hard：LM-SYS推出的更难更有区分度的大模型评测基准

评估日益发展的大型语言模型（LLM）是一个复杂的任务。传统的基准测试往往难以跟上技术的快速进步，容易过时且无法捕捉到现实应用中的细微差异。为此，LM-SYS研究人员提出了一个全新的大模型评测基准——Arena Hard。这个平常基准是基于Chatbot Arena发展而来，相比较常规的评测基准，它更难也更全面。

2025/01/30 20:38:31 阅读 755

ArenaHard/ChatbotArena/大模型评测/评测基准

MetaAI开源高质量高精度标注的图像数据集FACET：3.2万张图片、5万个主题，平均图像解析度达到1500×2000

MetaAI在2023年8月31日开源了一个全新的图像数据集，FACET（FAirness in Computer Vision EvaluaTion），FACET数据集包含32,000张图片和50,000人，这些图片由专家进行了详细的标注，包括人口统计属性（如感知性别表达和感知年龄组）和其他物理属性（如感知肤色和发型）。这样的设计使得研究人员可以更全面、更深入地评估模型在不同人群中的表现，从而更准确地识别和解决模型的不公平性问题。

2023/09/01 08:13:08 阅读 754

FACET/图像数据集/数据集

MistralAI发布了Mixtral 8×7B MoE模型的论文，更详细的参数和对比结果~

在人工智能快速发展的今天，创新型模型如Mixtral 8x7B的出现，不仅推动了技术的进步，还为未来的AI应用开辟了新的可能性。这款基于Sparse Mixture of Experts（SMoE）架构的模型，不仅在技术层面上实现了创新，还在实际应用中展示了卓越的性能。尽管一个月前这个模型就发布，但是MistralAI今天才上传了这个模型的论文，我们可以看到更详细的信息。

2024/01/09 12:39:17 阅读 748

MistralAI/Mixtral/专家混合模型

2023年度巨献，一图总结2023年最重要的AI相关的产品和技术~共48个产品或技术上榜

2022年11月底，ChatGPT横空出世，全球都被这样一个“好像”有智能的产品吸引力。随后，工业界、科研机构开始疯狂投入大模型。在2023年，这个被称为大模型元年的年份，有很多令人瞩目的AI产品与模型发布。2023年，DataLearner收集了大量的大模型，并发布了很多大模型相关的技术博客，在即将结束的2023年，我们以这个『2023年最令人瞩目的AI产品』结束本年的技术分享。

2023/12/29 13:02:56 阅读 747

2023大模型/大模型总结

xAI发布Grok Imagine功能，一条文本命令即可生成图片和最长达15秒的视频，也可以基于现有照片生成视频，免费用户也可以使用~

Grok Imagine 是一个由 xAI 开发的创新功能，集成到 Grok AI 聊天机器人中，旨在让用户能够从文本和视觉命令快速生成图像和视频。Grok Imagine最大的特点是能够生成长达 15 秒的视频，带有同步音频，使其成为 OpenAI 的 Sora 和 Google 的 Veo 3 等工具的直接竞争者。此外，它还包括一个“Spicy”模式，允许生成成人或显式内容，这一点引发了伦理和潜在误用的争议。

2025/08/08 22:07:14 阅读 742

GrokImagine/图像生成/图像编辑/图片生成视频/文本生成图片

ChatGPT 3.5只有200亿规模的参数？最新微软的论文暴漏OpenAI的ChatGPT的参数规模远低于1750亿！

2022年11月底发布的ChatGPT是基于OpenAI的GPT-3优化得到的可以进行对话的一个产品。直到今年更新到3.5和4之后，官方分为两个产品服务，其中ChatGPT 3.5是基于gpt-3.5-turbo打造，免费试用。因此，几乎所有人都自然认为这是一个与GPT-3具有同等规模参数的大模型，也就是说有1750亿参数规模。但是，在10月26日微软公布的CodeFusion论文的对比中，大家发现，微软的表格里面写的ChatGPT 3.5只有200亿参数规模。

2023/10/30 21:29:54 阅读 741

ChatGPT/GPT-3/GPT-3.5

Google Gemini Pro多模态接口开放！DataLearnerAI第一时间测试Gemini Pro多模态能力，比想象惊喜！

Google Gemini是Google最新发布的大模型系列。这是一系列的多模态的大模型，谷歌官方宣布在各项评分中Gemini超过了GPT-4V。但是，谷歌的宣传视频过于夸张被很多人质疑造假嫌疑，导致被全网嘲讽。而今天，Google官方的Gemini多模态接口开放，DataLearnerAI第一时间申请测试，结果让人惊喜。

2023/12/14 01:07:54 阅读 730

Gemini/Gemini多模态/Google/多模态大模型/谷歌

EleutherAI、MetaAI、StabilityAI、伦敦大学等合作的最新关于大语言模型的11个应用方向和16个挑战总结：来自688篇参考文献与业界实践

前天，EleutherAI、MetaAI、StabilityAI、伦敦大学等研究人员合作提交了一个关于大语言模型（Large Language Model，LLM）的挑战和应用的论文综述，引用了688篇参考文献总结了当前LLM的主要挑战和应用方向。

2023/07/22 23:13:13 阅读 718

LLM/论文

截止目前中文领域最大参数量的大模型开源：上海人工智能实验室开源200亿参数的书生·浦语大模型（InternLM 20B系列），性能提升非常明显！

上海人工智能实验室是国内顶尖的人工智能实验室，此前在大模型领域，他们与商汤科技发布的书生·浦语系列在国内引起了很大的关注。此次，他们又开源了一个全新的200亿参数规模的大语言模型InternLM 20B，应该是截止目前中文领域开源的参数规模最大的一个大模型了。

2023/09/22 11:55:50 阅读 714

InternLM/InternLM20B/书生·浦语

国产MoE架构模型大爆发！深圳元象科技XVERSE开源256亿参数MoE大模型XVERSE-MoE-A4.2B，评测结果接近Llama1-65B

混合专家架构大模型是当前最火热的一个大模型技术发展方向。三月底，业界开源了多个混合专家大模型，包括DBRX、Qwen1.5-MoE-A2.7B等。而在四月初，又一家国产大模型企业开源了一个全新的MoE架构的模型，即深圳元象科技XVERSE开源的XVERSE-MoE-A4.2B。该模型参数256亿，推理时仅激活42亿参数，效果与当前主流的130亿参数的规模差不多。

2024/04/07 22:44:28 阅读 713

MoE/XVERSE/XVERSE-MoE-A4.2B/开源大模型/混合专家模型

开源大语言模型再次大幅进步：微软团队开源的第二代WizardLM2系列在MT-Bench得分上超过一众闭源模型，得分仅次于GPT-4最新版

开源大模型是促进大模型技术发展最重要的技术力量之一。此次，微软以Apache 2.0开源协议开源了一个在ChatArena匿名投票评测上打败GPT-4早期版本的模型，即WizardLM-2。这是一系列模型，其中最大的版本是基于Mixtral-8×22B开源模型进行后训练得到的模型。MT-Bench得分8.96，超过了GPT-4-0314。

2024/04/17 21:44:51 阅读 711

WizardLM-2/WizardLM-270B/WizardLM-27B/WizardLM-28x22B

如何让你的Agent更快，支持更多上下文？Anthropic发布Skills：专为AI Agent系统打造的专业领域工具规范，MCP强大的补充，更低的门槛和资源消耗

Anthropic 正式推出全新功能 Claude Skills，旨在让通用 AI 代理（Agent）具备专业领域能力。该功能允许用户通过创建包含 SKILL.md 文件的技能文件夹，为 Claude 注入可执行脚本、模板与资源，实现 Excel 处理、PPT 生成等特定任务的自动化操作。与传统提示词不同，Skills 采用结构化加载与本地沙箱执行机制，兼顾安全性与效率。

2025/10/17 13:12:33 阅读 707

AIAgent/Claude/ClaudeSkills

最新博客