随着大模型能力的增强，工具调用（Tool Calling）已经成为构建智能 Agent 的核心机制。过去我们更多讨论的是“服务端工具（Server-side Tools）”，例如数据库查询、搜索 API、代码执行环境等。

但最近，一个新的模式开始越来越重要 —— Client Tool（客户端工具）。

这篇文章我们系统讲清楚：

Client Tool 是什么？
它和传统 Server Tool 有什么区别？
为什么它在 Web / 移动端 Agent 场景中至关重要？
实际架构如何设计？
典型应用场景有哪些？

一、什么是 Client Tool？

Client Tool 是运行在客户端（浏览器 / App / 本地环境）中的工具能力，并由模型通过 tool calling 机制触发执行。

简单理解：

Server Tool 在服务器执行
Client Tool 在用户设备执行

模型并不直接操作客户端，而是：

模型输出 tool call 指令
前端解析该 tool call
在本地执行对应逻辑
将结果回传给模型

二、Server Tool vs Client Tool 对比

维度	Server Tool	Client Tool
运行位置	后端服务器	浏览器 / App / 本地
数据访问	数据库、内部服务	DOM、LocalStorage、摄像头、文件系统
网络依赖	必须依赖	可以离线执行
安全性	服务器控制	需沙箱 & 权限控制
典型场景	查数据库、调用API	操作UI、读本地文件、调用设备能力

三、为什么 Client Tool 很重要？

1️⃣ AI 正在进入“应用层”，而不是“问答层”

传统 Chat 只是文本对话。

但真正的 AI 应用需要：

操作界面
控制组件
调用本地能力
与用户设备交互

这些能力必须发生在客户端。

2️⃣ Web Agent 必须操控前端状态

例如：

填写表单
切换页面
打开弹窗
修改 React 状态
读取当前页面 DOM

这些操作服务器根本无法完成。

3️⃣ 数据隐私 & 本地数据

Client Tool 可以访问：

本地文件
浏览器缓存
IndexedDB
本地录音
摄像头数据

这些数据你不一定希望上传到服务器。

四、典型架构设计

一个标准的 Client Tool 架构通常如下：

User
  ↓
Frontend App
  ↓
LLM (with tool calling)
  ↓
Tool Call JSON
  ↓
Frontend Tool Dispatcher
  ↓
Local Tool Execution
  ↓
Result → 回传 LLM

关键模块

1️⃣ Tool Registry（前端）

const tools = {
  openModal: ({ name }) => { ... },
  readLocalFile: async () => { ... },
  getPageState: () => { ... }
}

2️⃣ Tool Dispatcher

if (message.tool_call) {
   const tool = tools[message.tool_call.name]
   const result = await tool(message.tool_call.arguments)
}

3️⃣ 权限控制（必须）

白名单机制
用户确认
沙箱执行
参数校验

否则等于把用户浏览器完全交给模型。

五、Client Tool 的典型场景

🟢 1. 操作 UI

自动填写表单
自动生成表单配置
自动布局页面
打开指定组件

典型场景：低代码平台 + AI

🟢 2. 本地文件处理

读取用户上传的 PDF
本地解析 CSV
本地生成文档

适合做：
知识管理系统 / 本地 Agent

🟢 3. 设备能力调用

打开摄像头
开始录音
调用蓝牙
调用 NFC

移动端 AI 应用非常关键。

🟢 4. 浏览器环境感知

当前 URL
页面结构
选中的文本
用户滚动位置

这类能力对“网页助手型 Agent”非常重要。

六、Client Tool 的安全问题

这是很多人忽略的部分。

Client Tool 实际上是：

给模型执行本地代码的能力

如果设计不好，会出现：

任意 DOM 操作
读取敏感信息
自动提交表单
发起请求

必须做的三件事：

参数校验（Schema validation）
明确工具白名单
敏感工具必须二次确认

七、Client Tool + Server Tool 混合架构

真正成熟的系统一定是混合模式：

Server Tool 处理重计算 & 数据库
Client Tool 处理交互 & 本地能力

例如：

用户说：

帮我分析这个本地 PDF，并生成一个总结页面

流程：

Client Tool 读取本地 PDF
上传文本到服务器
Server Tool 做 embedding + 分析
Client Tool 渲染页面

这才是完整闭环。

八、Client Tool 是 Agent 架构进化的关键一步

过去我们关注的是：

Prompt Engineering

现在我们正在进入：

Tool Orchestration Engineering

而 Client Tool 让 Agent 不再只是“对话系统”，而是“应用控制系统”。

九、未来趋势

浏览器内嵌 Agent Runtime
React / Vue 组件级 Tool 暴露
AI 驱动 UI 编排
本地推理 + 本地 Tool 执行
移动端 Agent OS 级能力整合

总结

Client Tool 的本质：

把模型能力延伸到用户设备执行层

它解决的是：

AI 与应用之间的最后一公里
AI 与真实世界交互的问题

如果你在做：

AI Agent
低代码平台
浏览器插件
AI 助手型 App
SaaS 智能增强

那么 Client Tool 基本是必选项。

sheng00.com

Hello world.

标签归档：Agent Architecture

Client Tool 是什么？为什么它正在成为 AI 应用架构的关键能力