OpenAI发布ChatGPT Agent系统：一个新模型驱动的系统，可以写代码运行代码，使用浏览器订票，写PPT、做excel的全能Agent | DataLearnerAI

OpenAI发布ChatGPT Agent系统：一个新模型驱动的系统，可以写代码运行代码，使用浏览器订票，写PPT、做excel的全能Agent | DataLearnerAI

评测集	ChatGPT Agent得分	对比组	提升幅度
Humanity’s Last Exam	41.6% → 44.4%*	Deep Research (26.6%)	+67%
FrontierMath（顶尖数学）	27.4%	o4-mini (19.3%)	+42%
DSBench（数据分析）	89.9%	人类基线 (64.1%)	超人类25.8%
SpreadsheetBench	45.5% (支持.xlsx编辑)	Copilot in Excel (20%)	+127%
投行建模任务	71.3%	Deep Research (55.9%)	+28%

案例名称	类别	简要描述	使用结果
在线超市购物计划	个人用途	用户让 Agent 规划并下单购买烤肉晚餐所需食材（通过 Tesco）。	Agent 自动登录、选购、加入购物车并成功结账，包含甜点。
每周膳食规划与下单	个人用途	Agent 根据用户日程安排规划每周餐食并自动下单。	成功生成完整膳食计划并完成线上超市下单流程。
奢侈品/礼物购物任务	个人用途	用户要求 Agent 寻找复古灯具、订购鲜花等礼物。	部分成功，有登录或支付失败情况，暴露目前的限制。
营销内容自动生成	职业/工作场景	从 Instagram 链接中提取文案，并生成 Canva 海报模板。