来了,来了,大家翘首以待的 Function call 功能,它来啦!
Yi API 正式宣布新增 Function Call 功能。最新的模型 Yi-Large-FC 经过针对性训练,具备良好的深度理解能力、强大的指令遵循能力,既能根据用户的输入判断何时应调用函数,又能使用更贴近工具函数定义的 JSON 进行响应;同时完美兼容 OpenAI 的接口设计,能够丝滑“平替GPT”。
具备 Function Call 能力,意味着模型能够根据输入判断是否需要、何时调用外部工具,并输出请求调用函数的消息,包括函数信息、参数信息等。这种设计使得大模型能够与外部工具 API 有效地连接起来。
在构建 AI Agent 系统的过程中,Function Call 的能力必不可少。在这几个场景下,Function Call 的重要性尤其明显。
实时性:大模型的诸多使用场景均需要实时适应快速变化的世界。大模型虽然拥有丰富的知识储备,但其知识截止于训练数据的最后更新日期。通过调用工具,大模型能够获取最新的信息,如新闻、天气和股市动态,从而保持信息的时效性。
专用任务处理:有些任务需要专门的工具来处理,例如数据分析、图像生成、代码执行、信息检索等。调用专用工具可以弥补大模型能力的空缺,使模型能够提供更加丰富和专业的服务。
自动化工作流程:通过调用不同的工具,可以帮助用户自动化处理多种任务,如生成报告、处理数据、进行复杂计算等。这种自动化不仅减少了重复性劳动,也提高了工作的整体效率。
增强模型能力:一些工具可以补充和扩展大模型的能力,使其能够处理更广泛的问题。例如,浏览器工具可以访问互联网,Python 工具可以执行复杂的计算和数据处理任务。这种能力的提升,使得 AI Agent 能够更好地适应各种环境和需求。
那么既然涉及到外部函数的调用,Function Call 能力本身也存在高下之分,如调用结果是否准确无误、调用过程中的延迟高低和资源消耗量多少等等。
Yi-Large-FC 在权威评测榜单 Berkeley Function-Calling Leaderboard (BFCL)总榜排名世界第六,优于GPT 4-Turbo、Gemini 1.5 Pro等一众海外知名头部模型,同时,该榜单上也有多款中国模型的身影出现,截至目前,Yi-Large-FC 是榜单前十中唯一一款中国模型。(2024年8月5日数据)
Berkeley Function-Calling Leaderboard总榜 2024.8.5
Berkeley Function-Calling Leaderboard 是由加州大学伯克利分校针对模型 Function Call 能力所设计、运营的国际权威榜单。除总榜排名外,该榜单包含成本(Cost)、平均延迟(Average Latency)、AST 摘要(AST Summary)、Exec 摘要(Exec Summary )四项。
其中,Exec 摘要是指,针对简单函数调用(Simple Function)、多重函数调用(Multiple Functions)、并行函数调用(Parallel Functions)、并行多重函数调用(Parallel Multiple)四种调用任务,评测者会分别执行 API 进行评估,最终四个测试类别的无加权平均值组成 Exec 摘要得分。
在更偏向实际调用API场景、注重可执行性的 Exec 摘要得分排行中,Yi-Large-FC 得分仅次于 Claude 3.5 Sonnet,处于世界第二。(2024年8月5日数据)
Berkeley Function-Calling Leaderboard Exec 摘要排名 2024.8.5
下面是 Yi-Large-FC 的一份演示视频。视频中可以看到, Yi-Large-FC 精准、高效地完成了“检索美国近3年GDP数据并绘制条形图”、“检索中国近5年GDP数据,与美国GDP数据对比,并绘制条形图”等复杂调用任务。
凭借着出色的模型性能、丰富的工具链和极具竞争力的价格,Yi 系列大模型已成为大量企业在中文环境下探索新业务、验证 AI-first 产品 TC-PMF 的最佳选择之一。在全球范围内,Yi 系列大模型已积累起了一批头部付费企业客户,涉及 AI 写作、AI 编程、医疗、物流、消费3C、生化环材等多个领域。
知料科技创始合伙人、济南大学人工智能研究院副院长张世光教授表示,“在对比了市面上几乎所有大模型后,Yi 系列大模型无论是从内容生成的质量、生成速度、复杂指令的理解、性价比各个方面来说,都是最适合我们的。”
凭借开源多智能体框架爆火的 MetaGPT 也选择接入 Yi-Large 模型,在比较了模型性能与 API 团队的服务质量后,MetaGPT 确定将 Yi-Large 整合入自然语言编程产品配置中。
随着推理成本的下降,大模型正在穿透各行各业,被应用到更丰富的场景中。然而,在 API 的战场,我们不仅要比拼性能与性价比领先的大模型,还要比拼谁能更快解决企业客户和开发者们的需求痛点。
零一万物根据市场反馈,持续快速地推出如 RAG、Function Call 等工具,为企业客户和开发者们提供更易用、更有深度、更安全稳定的解决方案。
目前,Yi-Large-FC 已于零一万物大模型开放平台上线。
暂无评论内容