Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by

Sort by Date Sort by Views

Kimi K2为什么开源？基于Kimi团队成员内容解释Kimi K2模型背后的决策思路与技术细节：继承于DeepSeek V3架构，只为追求模型智能的上限

上周，MoonshotAI 发布了 Kimi K2，并宣布完全开源、允许商用。发布 24 小时内，社区即完成了 MLX 移植、4-bit 量化等后续工作。外网很多人评价说，Kimi K2是另一个DeepSeek R1时刻。本文尝试以第三方视角，把Kimi开发者公开的技术讨论、社区疑问与公开配置里的数字串成一条完整的技术决策链，解释Kimi K2背后的技术决策以及他们眼中大模型创业企业的方向。

2025/07/14 22:42:551,195

#AIAgent #K2

如何评价大模型和AI Agent在命令行环境中执行工具解决任务的能力？Terminal Bench评测简介

Terminal-Bench是一个新兴的开源基准测试，专为评估人工智能Agent（AI Agent）在命令行终端环境中的实际操作能力而设计。它通过一系列模拟真实世界场景的复杂任务，旨在客观、可量化地衡量AI Agent在执行代码编译、服务器管理和数据处理等任务时的熟练程度与自主性。

2025/07/23 16:56:161,195

#AIAgent评测 #TerminalBench

OpenAI发布企业使用的ChatGPT：没有限制且更快的GPT-4、数据隔离、基于GPT-4的高级数据分析功能，但是暂不支持私有化部署

OpenAI发布了ChatGPT的企业版，这是一个专为企业设计的聊天机器人。这个版本不仅提供了企业级的安全和隐私保护，还具有更高的处理速度和更多的自定义选项。相比较个人版的ChatGPT，企业版主要是提升了性能、强调了安全等。

2023/08/29 09:16:091,203

#ChatGPT #OpenAI

MistralAI发布了Mixtral 8×7B MoE模型的论文，更详细的参数和对比结果~

在人工智能快速发展的今天，创新型模型如Mixtral 8x7B的出现，不仅推动了技术的进步，还为未来的AI应用开辟了新的可能性。这款基于Sparse Mixture of Experts（SMoE）架构的模型，不仅在技术层面上实现了创新，还在实际应用中展示了卓越的性能。尽管一个月前这个模型就发布，但是MistralAI今天才上传了这个模型的论文，我们可以看到更详细的信息。

2024/01/09 12:39:171,207

#MistralAI #Mixtral

常用的SQL语句总结

平时很多时候需要用到SQL，一些常见常用的SQL语句总结，后面可以拷贝使用

2022/04/15 23:15:491,208

#SQL #编程

彭博社发布金融领域的ChatGPT模型——BloombergGPT

彭博社今天发布了一份研究论文，详细介绍了BloombergGPT的开发，这是一个新的大规模生成式人工智能（AI）模型。这个大型语言模型（LLM）经过专门的金融数据训练，支持金融业内的多种自然语言处理（NLP）任务。

2023/04/24 22:45:141,220

#BloombergGPT

OpenAI隐藏的一个ChatGPT新功能：在对话框中@任意GPTs，获得回答！一个巨大的由各种GPT组成的聊天世界即将到来

在最新的ChatGPT的前端代码中，有网友发现了一个OpenAI隐藏的或者正在测试的功能，即在ChatGPT的对话中可以@ 任意GPTs商店中公开的GPTs，然后由这个GPTs为用户当前的对话进行回复，这个功能不需要用户离开当前对话页面。这意味着在一次对话中，我们可以与几百万个不同的GPTs同时协作聊天，就像一个巨大的聊天群，里面有无数个各种各样的GPT一起为你解决问题。

2024/01/26 20:29:021,223

#ChatGPT #ChatGPT新功能

Anthropic发布Claude4，全球最强编程大模型，大幅提升AI Agent系统所需的各项能力，最长可以7小时连续工作，持续工作、工具使用、记忆使用方面大幅提升

2025年5月23日，Anthropic发布了新一代大语言模型Claude 4系列，包括Claude Opus 4和Claude Sonnet 4两个版本。Anthropic的官方博客强调Claude Opus 4是当前全球最强的编程大模型，与传统聚焦于文本生成和知识问答的模型不同，Claude 4明确定位为任务执行引擎和AI Agent系统的核心组件。这次发布不仅仅是性能参数的提升，更代表了Anthropic认为AI模型从"对话助手"向"自主工作伙伴"的根本性转变。

2025/05/25 14:37:311,229

#Anthropic #Claude4

大模型追踪利器！斯坦福大学发布基础大模型追踪图谱Ecosystem Graphs

斯坦福大学发布的基础大模型追踪图谱Ecosystem Graphs，用图谱的方式给大家呈现了模型之间的联系，让人非常清楚明白追踪不同模型之间的关系。

2023/04/24 22:46:281,234

#大模型

Claude Code 的独特体验：Claude Code 为什么这么好用？从设计细节看下一代 LLM Agent 的范式

近年来，AI 编码助手与 Agent 框架层出不穷，从 Github Copilot 到 Cursor，再到各种基于 LangChain 的多代理方案。然而，真正让开发者普遍感受到“顺手”与“愉快”的，却是 Claude Code（简称 CC）。它的特别之处，并不在于引入了复杂的新架构，而恰恰在于其极简而精心打磨的设计选择。 Claude模型本身的强大毋庸置疑，但是即使是相同的模型，Claude Code体验也比其它的Agent似乎体验更好。本文基于2025年8月21日vivek公开发布的一篇英文博客，

2025/08/24 23:39:171,235

#Claude #ClaudeCode

通用基座大模型是否可以超越领域专有大模型？微软最新论文证明这是可以的！微软最新动态Prompt技术——MedPrompt详解

在GPT-4这种超大基座模型发布之后，一个非常活跃的方向是专有模型的发展。即一个普遍的观点认为，基座大模型虽然有很好的通用基础知识，但是对于专有的领域如医学、金融领域等，缺少专门的语料训练，因此可能表现并不那么好。如果我们使用专有数据训练一个领域大模型可能是一种非常好的思路，也是一种非常理想的商业策略。但是，微软最新的一个研究表明，通用基座大模型如果使用恰当的prompt，也许并不比专有模型差！同时，他们还提出了一个非常新颖的动态prompt生成策略，结合了领域数据，非常值得大家参考。

2023/12/06 17:10:171,237

#MedPrompt #动态Prompt

Gemini CLI: Google发布的开源AI智能体，将Gemini 2.5 Pro直接带入你的终端，每天可以免费使用1000次Gemini 2.5 Pro！

今天，Google为全球开发者社区带来了一款激动人心的新工具——**Gemini CLI**。这是一款免费、开源的AI智能体，它将Google当前最强大的模型Gemini 2.5 Pro的能力，直接集成到了开发者最熟悉的命令行界面（CLI）中。对于那些视终端为“家”的开发者来说，这无疑是一个重大的升级。它不仅擅长编码，更是一个可以处理内容生成、问题解决、深度研究和任务管理的多功能本地实用工具。它的发布，旨在为个人开发者提供前所未有的便捷AI体验，非常强大！

2025/06/26 08:46:371,237

#ClaudeCode #GeminiCLI

开源可商用大模型再添重磅玩家——StabilityAI发布开源大语言模型StableLM

今天，Stability宣布开源StableLM计划，这是一个正在开发过程的大语言模型，但是它是开源可商用的模型。本文将对该模型做简单的介绍！

2023/04/24 22:35:451,237

#StabilityAI #StableLM

深度学习9个小时内教会机器人拿起和剥开香蕉

仅仅使用来自人类数据集的机器学习，在短短9个小时内，日本研究人员让一个机器人学会了如何拿起和剥开香蕉。

2022/03/28 09:10:391,237

#论文快讯

Qwen3家族新成员：阿里发布自动语音识别大模型Qwen3-ASR-Flash，中英文语音识别错误率低于GPT-4o和Gemini 2.5 Pro！

阿里发布了全新的语音识别大模型Qwen3-ASR-Flash，该模型是Qwen3系列模型中首个语音识别大模型，中英文语音识别错误率低于GPT-4o-transcribe和Gemini 2.5 Pro。不过，该模型目前仅通过API提供，不开源！

2025/09/09 03:31:421,252

#ASR #Qwen3-ASR

ChatGPT内置隐藏debug功能：支持下载原始对话、可视化对话分支等

AIPRM的工作人员最近发现ChatGPT的客户端隐藏内置了一个新的debug特性，可以提高ChatGPT对话的问题调试功能。这个特性包含非常多的功能。同时，最新的截图显示ChatGPT Team版本计划可能延迟但没有取消。

2023/12/06 07:43:391,254

#ChatGPT #ChatGPTTeam计划

阿里正式开源最强视觉理解大模型Qwen3-VL：关键评测基准超Gemini 2.5 Pro，支持针对视觉输入进行推理，甚至可以理解3D场景

今日，QwenTeam 正式发布了全新一代多模态视觉语言模型 —— Qwen3-VL 系列。这是 Qwen 家族迄今为止最强大的视觉语言模型，在视觉感知、跨模态推理、长上下文理解、空间推理和智能代理交互等多个维度全面提升。旗舰开源模型 Qwen3-VL-235B-A22B 已经上线，并提供 Instruct 和 Thinking 两个版本，前者在视觉感知上全面对标并超过 Gemini 2.5 Pro，后者则在多模态推理基准上创下新纪录，成为开源阵营的最强视觉理解大模型。

2025/09/24 08:14:191,254

#Qwen3-VL

什么时候该使用推理大模型？OpenAI官方推出推理大模型和大语言模型的最佳使用指南

随着DeepSeek R1和OpenAI的o1、o3等推理大模型的发布，我们当前可使用的大模型种类也变多了。但是，推理大模型和普通大模型之间并不是二选一的关系，在不同的问题上二者各有优势。为了让大家更清晰理解推理大模型和普通大模型的应用场景。OpenAI官方推出了一个推理大模型最佳实践指南。描述了二者的对比。本文将总结这份推理大模型最佳实践指南。

2025/03/05 12:53:441,264

#DeepSeekR1 #OpenAIo1

流浪地球2的数字生命计划可能快实现了！HeyGen即将发布下一代AI真人视频生成技术，效果逼真到无法几乎分辨！

电影《流浪地球2》里面一个非常重要的情节就是数字生命计划。将人类的意识上传到计算机之后，可以通过AI技术让人类以数字化的形式在计算机中存活。而今天HeyGen官方宣布的即将推出的真人视频生成技术，可以根据真人的照片生成非常逼真的数字人视频，其动作、表情、声音等全部由AI技术生成，而几乎无法分辨是真人拍摄的视频还是AI生成的视频。

2023/08/10 22:26:311,270

#AI生成视频 #数字人

可以在手机端运行的大模型标杆：微软发布第三代Phi-3系列模型，评测结果超过同等参数规模水平，包含三个版本，最小38亿，最高140亿参数

Phi系列大语言模型是微软开源一个小规模参数的语言模型。第一代和第二代的Phi模型参数规模都不超过30亿，但是在多个评测结果上都取得了非常亮眼的成绩。今天，微软发布了第三代Phi系列大模型，最高参数规模也到了140亿，其中最小的模型参数38亿，评测结果接近GPT-3.5的水平。

2024/04/23 13:56:441,276

#Phi3 #小规模参数大模型

2022年被引次数最多的AI论文列表

本表是Zeta Alpha收集的2022年AI领域被引次数最多的论文列表。

2023/03/04 23:17:371,276

#AI #论文

OpenAI世界最强的语音识别预训练模型WhisperV2即将来临

Whisper是由Open AI训练并开源的语音识别模型，它在英语语音识别方面接近人类水平的鲁棒性和准确性。该模型于2022年9月21日发布之后引起了广大的关注。由于模型的准确性太过惊人，大家已经认为可以直接用于视频的配音制作了。而今天有人发现Whisper的GitHub上有了一个新的提交记录，显示Whisper V2版本即将来临。

2022/12/07 21:51:411,276

#OpenAI #语音识别

OpenAI首次发布语音合成大模型：VoiceEngine，一个可以用15秒原始录音就可以克隆声音的语音合成大模型

OpenAI发布的模型中最主要的是大语言模型GPT系列。而且GPT系列模型也在朝着多模态的方向发展。尽管OpenAI有自己的TTS和ASR大模型，但是此前从未正式宣布过。就在今天，OpenAI正式宣布了他们首个语音合成大模型VoiceEngine，该模型也将提供API访问。OpenAI官方的声明中说，现有的基于声音的认证系统应该被淘汰掉！因为已经不安全了！

2024/03/30 08:38:451,281

#OpenAI #TTS