Berkeley Function Calling 大模型工具使用排行榜
Berkeley Function Calling Leaderboard是衡量大模型工具使用或函数调用能力的权威排行榜。
榜首模型
Deepseek-v1.5
最高得分
-
模型数量
32
数据版本
20240421
数据来源: Berkeley官方网站
排名总表
| 排名 | 模型名称 | 综合准确率 | 请求成本($) | 时延(秒) | AST Summary | Exec Summary | 相关性得分 | 发布者 | 开源情况 |
|---|---|---|---|---|---|---|---|---|---|
| 30 | Deepseek-v1.5Deepseek | 39.41 | 0.45 | 1.20 | 36.98 | 29.26 | 56.67 | Deepseek | Deepseek License |
数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。
