Tag

Articles tagged "大模型应用"

A curated list of original AI and LLM articles related to "大模型应用", updated regularly.

Tags:#大模型应用

大模型工具使用的三次进化：从 Function Calling 到程序化编排

本文系统梳理了大模型工具使用（Tool Use）的三个演进阶段：循环式工具选择（Function Calling）、计划驱动执行（Plan-then-Execute）和程序化工具编排（Programmatic Tool Calling）。从 OpenAI Function Calling 的单次调用模式，到支持并行调度的计划-执行范式，再到最新的代码驱动编排方式，工具使用正在从"逐步决策"走向"计划驱动、代码驱动"。

2026/01/08 22:08:571,148

#AIAgent #FunctionCalling

为什么大模型企业都在强调可以连续工作XX小时的Agent和模型？长时运行Agent解析（Long-Running Agents）

AI Agent 的一个关键趋势正在浮现：从“快速回答问题”转向“长时间稳定执行复杂任务”。本文系统梳理了为什么 Anthropic、OpenAI 等企业开始强调“长时运行 Agent”，并解释其真实含义并非模型一直思考，而是通过作业化、异步执行、可恢复运行和动态上下文管理，实现跨会话完成复杂目标。文章深入对比了长时 Agent 与传统脚本化 LLM Loop 的本质差异，分析其在自治能力、上下文工程、耐久执行与治理上的核心价值，并总结构建长时运行 AI Agent 所需的关键技术等。

2026/01/04 23:01:191,158

#AIAgent #Long-RunningAgents

在大模型时代，AI 产品为什么更难复用？AI Agent产品应该如何开发？来自 Manus 的3个工程实践经验

本文基于 Manus 一线工程成员的真实实践，总结并分析了大模型时代 AI 产品在工程与复用层面发生的关键变化。文章并不关注模型参数或算法细节，而是聚焦于真实生产环境中的工程问题：功能交付的责任边界如何变化、为何原型验证比完整规划更重要，以及在 Agent 系统中个人角色与系统边界如何被重新定义。这些经验揭示了一个趋势——在大模型具备“执行能力”之后，AI 产品的可用性越来越依赖工程体系本身，而非模型能力本身。本文适合关注 AI 工程实践、Agent 架构以及大模型落地问题的技术读者参考。

2025/12/28 20:44:13638

#AIAgent经验 #AI产品

大模型到底能否真正提升写代码效率？Anthropic 内部 20 万条数据首次公开大模型在真实代码工作流中的表现

大模型究竟能否真正提升工程师的编码效率？Anthropic 最近发布的一份重量级内部研究给出了少见的、基于真实工程环境的数据答案。研究覆盖 132 名工程师、53 场深度访谈，以及 20 万条 Claude Code 使用记录，展示了 AI 在软件工程中的实际作用：从生产力显著提升（人均合并 PR 数同比增长 67%）、任务空间扩张（27% 的 Claude 工作原本不会被执行），到工程师技能版图、协作方式与职业路径的深刻变化。与此同时，研究也揭示了技能萎缩、监督负担、工作流变化等新挑战。这是一份罕见的“

2025/12/04 22:37:321,041

#大模型应用 #大模型技术

Ilya Sutskever访谈深度解读：关于大模型的瓶颈、人类智能的优势、模型泛化不足以及5-20年后超级智能会出现的真正问题

这篇文章基于 Dwarkesh Patel 对 SSI 创始人、前 OpenAI 首席科学家 Ilya Sutskever 的长访谈，系统梳理了他对模型泛化、人类智能结构、持续学习、RL 与预训练局限、超级智能路径、对齐策略，以及 AI 未来经济与治理的整体判断。文章不仅整理了核心观点，也结合具体原文展开解读，呈现 Ilya 如何从“人类为何能泛化”这一根问题出发，重新思考下一代智能系统应当如何构建。

2025/12/03 08:19:14926

#大模型应用 #大模型技术

大模型能不能写 PPT？AI 办公如何真正落地？以办公小浣熊为例，看一种更自然的大模型办公方式正在出现

AI 能不能替我做报告”几乎成了办公室里出现频率最高的疑问之一。模型能力的提升有目共睹，API 的边界也在持续扩张，但回到日常，那些真正让人感到疲惫的依旧是最具体的任务：一份复盘写到深夜，一个 PPT 改了十几版，一张 Excel 来回分析到眼花。它们看似普通，却占据了知识工作中惊人比例的时间。本文主要看一下办公小浣熊这个颇具代表性的大模型应用落地思路。

2025/11/28 10:55:12522

#大模型办公 #大模型应用

AipexBase：让 AI 生成的应用真正能跑起来的国产开源AI后端底座

最近 Vibe Coding 的概念越来越热，尤其是 Gemini 3 Pro 发布后，很多人都在说：“现在做网站和 App，好像一句话就能生成。” 界面生成、交互补全、流程搭建这些事情确实越来越轻松，模型能在很短时间内产出一个“看起来完整”的应用原型。一个国产开源项目就在尝试解决这个问题，它就是 AipexBase。

2025/11/27 21:04:40623

#大模型应用

Anthropic 最新 Agent 工程方案：使用双 Agent 架构让 AI 实现真正的长时自主工作

就在昨天，Anthropic 发布了一套非常重要的工程方案，专门针对这些挑战而设计：基于“Initializer Agent + Coding Agent”的双 Agent 架构。

2025/11/27 20:34:301,502

#AIAgent #大模型应用

AI Agent工具调用token消耗太多不准确怎么办？Anthropic官方的大模型工具使用（MPC）优化：tokens消耗降低98.7%

让AI Agent通过编写代码来调用工具，而不是直接工具调用。这种方法利用了MCP（Model Context Protocol，模型上下文协议）标准，能显著降低token消耗，同时保持系统的可扩展性。下面，我结合原文的逻辑，分享我的理解和改写版本，目的是记录这个洞察，并为后续实验提供参考。Anthropic作为领先的AI研究机构，于2024年11月推出了MCP，这是一个开放标准，旨在简化AI Agent与外部工具和数据的连接，避免传统自定义集成的碎片化问题。

2025/11/06 08:09:551,060

#tokens优化 #大模型应用

生成式AI重塑新闻分发格局：搜索衰退与流量转移下的出版商和传统网站压力山大！SimilarWeb最新报告解释大模型产品对搜索引擎和内容网站的影响！

今天，SimilarWeb发布了一个全新的报告，描述了自从ChatGPT这种大模型产品发布之后，新闻出版网站的流量下滑严重，并提供了相关的分析。尽管这是针对新闻网站的报告，但是实际上所有的内容网站或者是内容生产者可能都是有影响的。我们基于这份报告进行解读，为大家提供一个参考。

2025/07/03 23:30:07685

#AI技术影响 #大模型应用

大模型可以运营自动售货机吗？Anthropic的Project Vend实验：Claude能成功经营一家小店吗？答案是亏损严重还会免费赠送商品！

昨天，Anthropic公布了一项引人注目的实验——Project Vend。他们让旗下的大模型Claude Sonnet 3.7在一个真实的办公环境中，自主经营一家小型自动化商店，为期约一个月。这个实验的目标是探索，在不久的将来，AI模型在真实经济体中自主运行任务的可行性、潜在的成功模式以及那些出人意料的失败方式。实验结果非常强大，也充满了令人深思的细节！

2025/06/28 08:58:33836

#Anthropic #Claude

比Office Copilot更快一步~基于AI大语言模型生成PPT、Word和网页的应用的新产品测试~Gamma.APP，PPT打工人必备

大语言模型（Large Language Model，LLM）已经在很多领域都产生了巨大的影响。但是其中最为大家所期待的功能之一就是基于idea生成PPT、Word文档等。此前微软Office Copilot已经吸引了很多人的关注，但目前依然没有开放。而今天DataLearnerAI发现了一个类似的产品，来自洛杉矶初创企业Gamma的产品目前已经支持基于文本生成PPT、Word和网页应用了，本文带大家简单体验一下这个产品。

2023/08/26 14:37:594,165

#AI生成PPT #大模型应用