Tag

Articles tagged "应用"

A curated list of original AI and LLM articles related to "应用", updated regularly.

Tags:#应用

模型调优做完之后，还有一个坑没填：生命周期

Azure OpenAI 的模型下架周期正在变短：gpt-5.1 之前所有版本从上架到弃用都是365天，但从 gpt-5.2 开始骤降到约180天。本文用官方生命周期数据，分析企业做 Agent 应用调优时该如何应对模型版本更替加快的问题。

2026-07-25 09:36:5354

#Agent工程 #企业级AI应用

大模型工具使用的三次进化：从 Function Calling 到程序化编排

本文系统梳理了大模型工具使用（Tool Use）的三个演进阶段：循环式工具选择（Function Calling）、计划驱动执行（Plan-then-Execute）和程序化工具编排（Programmatic Tool Calling）。从 OpenAI Function Calling 的单次调用模式，到支持并行调度的计划-执行范式，再到最新的代码驱动编排方式，工具使用正在从"逐步决策"走向"计划驱动、代码驱动"。

2026/01/08 22:08:571,149

#AIAgent #FunctionCalling

为什么大模型企业都在强调可以连续工作XX小时的Agent和模型？长时运行Agent解析（Long-Running Agents）

AI Agent 的一个关键趋势正在浮现：从“快速回答问题”转向“长时间稳定执行复杂任务”。本文系统梳理了为什么 Anthropic、OpenAI 等企业开始强调“长时运行 Agent”，并解释其真实含义并非模型一直思考，而是通过作业化、异步执行、可恢复运行和动态上下文管理，实现跨会话完成复杂目标。文章深入对比了长时 Agent 与传统脚本化 LLM Loop 的本质差异，分析其在自治能力、上下文工程、耐久执行与治理上的核心价值，并总结构建长时运行 AI Agent 所需的关键技术等。

2026/01/04 23:01:191,159

#AIAgent #Long-RunningAgents

在大模型时代，AI 产品为什么更难复用？AI Agent产品应该如何开发？来自 Manus 的3个工程实践经验

本文基于 Manus 一线工程成员的真实实践，总结并分析了大模型时代 AI 产品在工程与复用层面发生的关键变化。文章并不关注模型参数或算法细节，而是聚焦于真实生产环境中的工程问题：功能交付的责任边界如何变化、为何原型验证比完整规划更重要，以及在 Agent 系统中个人角色与系统边界如何被重新定义。这些经验揭示了一个趋势——在大模型具备“执行能力”之后，AI 产品的可用性越来越依赖工程体系本身，而非模型能力本身。本文适合关注 AI 工程实践、Agent 架构以及大模型落地问题的技术读者参考。

2025/12/28 20:44:13638

#AIAgent经验 #AI产品

大模型到底能否真正提升写代码效率？Anthropic 内部 20 万条数据首次公开大模型在真实代码工作流中的表现

大模型究竟能否真正提升工程师的编码效率？Anthropic 最近发布的一份重量级内部研究给出了少见的、基于真实工程环境的数据答案。研究覆盖 132 名工程师、53 场深度访谈，以及 20 万条 Claude Code 使用记录，展示了 AI 在软件工程中的实际作用：从生产力显著提升（人均合并 PR 数同比增长 67%）、任务空间扩张（27% 的 Claude 工作原本不会被执行），到工程师技能版图、协作方式与职业路径的深刻变化。与此同时，研究也揭示了技能萎缩、监督负担、工作流变化等新挑战。这是一份罕见的“

2025/12/04 22:37:321,045

#大模型应用 #大模型技术

Ilya Sutskever访谈深度解读：关于大模型的瓶颈、人类智能的优势、模型泛化不足以及5-20年后超级智能会出现的真正问题

这篇文章基于 Dwarkesh Patel 对 SSI 创始人、前 OpenAI 首席科学家 Ilya Sutskever 的长访谈，系统梳理了他对模型泛化、人类智能结构、持续学习、RL 与预训练局限、超级智能路径、对齐策略，以及 AI 未来经济与治理的整体判断。文章不仅整理了核心观点，也结合具体原文展开解读，呈现 Ilya 如何从“人类为何能泛化”这一根问题出发，重新思考下一代智能系统应当如何构建。

2025/12/03 08:19:14928

#大模型应用 #大模型技术

大模型能不能写 PPT？AI 办公如何真正落地？以办公小浣熊为例，看一种更自然的大模型办公方式正在出现

AI 能不能替我做报告”几乎成了办公室里出现频率最高的疑问之一。模型能力的提升有目共睹，API 的边界也在持续扩张，但回到日常，那些真正让人感到疲惫的依旧是最具体的任务：一份复盘写到深夜，一个 PPT 改了十几版，一张 Excel 来回分析到眼花。它们看似普通，却占据了知识工作中惊人比例的时间。本文主要看一下办公小浣熊这个颇具代表性的大模型应用落地思路。

2025/11/28 10:55:12524

#大模型办公 #大模型应用

AipexBase：让 AI 生成的应用真正能跑起来的国产开源AI后端底座

最近 Vibe Coding 的概念越来越热，尤其是 Gemini 3 Pro 发布后，很多人都在说：“现在做网站和 App，好像一句话就能生成。” 界面生成、交互补全、流程搭建这些事情确实越来越轻松，模型能在很短时间内产出一个“看起来完整”的应用原型。一个国产开源项目就在尝试解决这个问题，它就是 AipexBase。

2025/11/27 21:04:40629

#大模型应用

Anthropic 最新 Agent 工程方案：使用双 Agent 架构让 AI 实现真正的长时自主工作

就在昨天，Anthropic 发布了一套非常重要的工程方案，专门针对这些挑战而设计：基于“Initializer Agent + Coding Agent”的双 Agent 架构。

2025/11/27 20:34:301,507

#AIAgent #大模型应用

AI Agent工具调用token消耗太多不准确怎么办？Anthropic官方的大模型工具使用（MPC）优化：tokens消耗降低98.7%

让AI Agent通过编写代码来调用工具，而不是直接工具调用。这种方法利用了MCP（Model Context Protocol，模型上下文协议）标准，能显著降低token消耗，同时保持系统的可扩展性。下面，我结合原文的逻辑，分享我的理解和改写版本，目的是记录这个洞察，并为后续实验提供参考。Anthropic作为领先的AI研究机构，于2024年11月推出了MCP，这是一个开放标准，旨在简化AI Agent与外部工具和数据的连接，避免传统自定义集成的碎片化问题。

2025/11/06 08:09:551,064

#tokens优化 #大模型应用

生成式AI重塑新闻分发格局：搜索衰退与流量转移下的出版商和传统网站压力山大！SimilarWeb最新报告解释大模型产品对搜索引擎和内容网站的影响！

今天，SimilarWeb发布了一个全新的报告，描述了自从ChatGPT这种大模型产品发布之后，新闻出版网站的流量下滑严重，并提供了相关的分析。尽管这是针对新闻网站的报告，但是实际上所有的内容网站或者是内容生产者可能都是有影响的。我们基于这份报告进行解读，为大家提供一个参考。

2025/07/03 23:30:07686

#AI技术影响 #大模型应用

大模型可以运营自动售货机吗？Anthropic的Project Vend实验：Claude能成功经营一家小店吗？答案是亏损严重还会免费赠送商品！

昨天，Anthropic公布了一项引人注目的实验——Project Vend。他们让旗下的大模型Claude Sonnet 3.7在一个真实的办公环境中，自主经营一家小型自动化商店，为期约一个月。这个实验的目标是探索，在不久的将来，AI模型在真实经济体中自主运行任务的可行性、潜在的成功模式以及那些出人意料的失败方式。实验结果非常强大，也充满了令人深思的细节！

2025/06/28 08:58:33837

#Anthropic #Claude

最近很火的基于人工智能（AI）的vibe coding是什么？它和传统软件编码之间有什么区别？

“Vibe Coding”（氛围编程）是一种新兴的编程范式，强调通过自然语言与人工智能（AI）协作开发软件。该概念由前 OpenAI 研究员 Andrej Karpathy 于 2025 年提出，旨在让开发者沉浸于创作氛围中，利用 AI 的能力，将自然语言描述转化为实际源代码，从而简化编程过程。

2025/06/08 20:56:211,418

#AI应用 #AI编程

比Office Copilot更快一步~基于AI大语言模型生成PPT、Word和网页的应用的新产品测试~Gamma.APP，PPT打工人必备

大语言模型（Large Language Model，LLM）已经在很多领域都产生了巨大的影响。但是其中最为大家所期待的功能之一就是基于idea生成PPT、Word文档等。此前微软Office Copilot已经吸引了很多人的关注，但目前依然没有开放。而今天DataLearnerAI发现了一个类似的产品，来自洛杉矶初创企业Gamma的产品目前已经支持基于文本生成PPT、Word和网页应用了，本文带大家简单体验一下这个产品。

2023/08/26 14:37:594,165

#AI生成PPT #大模型应用

使用LangChain做大模型开发的一些问题：来自Hacker News的激烈讨论~

LangChain是当前大模型应用开发领域里面最火热的框架。由于其提供了丰富的数据访问接口、各种大模型的交互接口以及很多构造大模型应用所需要的方法与实践工具，受到了很多人的关注。然而，今天Hacker News上的一位开发者直接提出LangChain是一个无用的框架，引起了很多人的共鸣。很多人都表示，在实际开发中，LangChain有很多问题，可能并不适合用来做大模型应用开发。

2023/07/09 23:15:292,315

#LangChain #LLM应用开发

人工智能颠覆影响者营销的八种方式

影响者营销将是极好的机会，可以使你的形象更加完善，并接触到新的受众，是一个人性化的宏伟机会？的确如此。它是否充满了影响者和品牌宁愿不管理的问题？同样地，是的。

2021/11/11 09:13:441,420

#AI应用