Berkeley Function Calling 大模型工具使用排行榜
Berkeley Function Calling Leaderboard是衡量大模型工具使用或函数调用能力的权威排行榜。
榜首模型
GPT-4-0125-Preview
最高得分
-
模型数量
32
数据版本
20240421
数据来源: Berkeley官方网站
排名总表
| 排名 | 模型名称 | 综合准确率 | 请求成本($) | 时延(秒) | AST Summary | Exec Summary | 相关性得分 | 发布者 | 开源情况 |
|---|---|---|---|---|---|---|---|---|---|
| 1 | GPT-4-0125-Preview | 84.41 | 5.21 | 1.99 | 88.75 | 71.54 | 70.42 | OpenAI | Proprietary |
数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。