一、初始AI模型交互与提示词演进

1.1 用户提示词(User Prompt)

  • 定义:用户发送给AI模型的消息,通常是问题或意图表达。
  • 局限性:
  • AI模型缺乏预设“人设”“背景”;
  • 回答通用、中规中矩,无个性化和趣味性;
  • 无法根据上下文/角色给出差异化反馈。

1.2 系统提示词(System Prompt)

  • 产生背景:解决AI模型缺乏人设的问题,避免将人设与用户请求打包导致内容不自然。
  • 定义:把人设、性格、背景、语气等非用户直接说出的内容独立出来的提示信息。
  • 机制:网页/聊天机器人中,系统会自动将其与用户提示词一同发送给AI模型。
  • 应用场景:
  • 部分端侧系统预设的系统提示词用户无法直接修改;
  • 部分平台(如ChatGPT)自定义偏好会自动整合为系统提示词的一部分。

二、AI智能体(AI Agent)及其工具(Agent Tool)

2.1 AI Agent的引入

  • 需求背景:AI模型仅能提供答案/操作建议,无法自主执行任务。
  • 概念:
  • AI Agent:协调AI模型、工具与最终用户的通信程序;
  • Agent Tool:供AI模型调用的本地小程序/服务。
  • 早期实践(AutoGPT示例):
  • 工具注册:需预先编写文件管理函数(如 list_files 、 read_files )并提供功能描述;
  • 系统提示词生成:AutoGPT根据工具信息生成提示词,告知AI模型工具的使用方式;
  • 任务流程:

image.png

2.2 早期Agent架构的挑战

  • 格式不确定性:AI模型作为概率模型,可能返回不符合规定的格式。
  • 解决方案:客户端重试(Agent检测格式错误后自动重试)。

三、函数调用(Function Calling)

3.1 Function Calling的提出

  • 背景:解决早期Agent架构中AI返回格式不确定的问题,由ChatGPT、Claude、Gemini等大模型厂商推出。
  • 核心思想:统一工具描述和AI调用工具的返回格式规范。

3.2 Function Calling的机制

  • 工具描述标准化:用JSON对象定义工具,包含工具名、功能说明、所需参数等字段,且JSON对象单独存放,消除系统提示词格式定义冗余。

如果不这样做,你可能需要在 system prompt 里反复写类似内容:

“你可以调用一个名为 getWeather 的函数,该函数接收 city 参数,返回天气信息……”

  • 返回格式规定:明确AI模型使用工具的返回格式。
  • 优化效果:
  • 工具描述集中、格式统一,AI模型调用回复格式更统一;
  • 便于厂商针对性训练模型,降低客户端开发复杂度和Token开销。

3.3 Function Calling的局限性

  • 缺乏统一标准,各厂商API定义不同;
  • 兼容性问题,部分开源模型未支持;

四、MCP协议(Agent与Tool服务的通信)

4.1 MCP定义与组件

  • 定义:Model Context Protocol,规范Agent与Tool服务交互的通信协议。
  • 核心组件:
  • MCP Server:运行Agent Tool服务的服务器;
  • MCP Client:调用MCP Server服务的Agent。
  • 规范内容:定义通信方式、MCP Server需提供的接口(如工具查询、功能描述、参数格式)。

4.2 MCP Server提供的服务类型

  • Tool:函数调用形式的服务;
  • Resource:数据提供服务(如文件读写);
  • Prompt:提示词模板提供服务。

4.3 MCP的部署方式

  • 可与Agent同机运行,通过标准输入输出通信;
  • 可部署在网络上,通过HTTP通信。

4.4 MCP与AI模型的关系

  • MCP是AI定制标准,与AI模型本身无关;
  • 仅负责帮助Agent管理工具、资源和提示词,不关注具体使用的AI模型。

五、整体流程梳理与相互关系

5.1 完整协作流程示例

  1. 用户向AI Agent提问(MCP Client部分);
  2. AI Agent将用户请求包装为用户提示词;
  3. 通过MCP协议从MCP Server获取Agent Tool信息;
  4. 将Tool信息转为通用格式/Functions Calling格式,与用户提示词发给AI模型;
  5. AI模型生成工具调用请求(如调用网页浏览工具);
  6. AI Agent通过MCP协议调用MCP Server上的工具;
  7. 工具执行并返回结果给AI Agent;
  8. AI Agent转发结果给AI模型;
  9. AI模型结合知识生成最终答案;
  10. AI Agent将结果展示给用户。

image.png

5.2 关键概念间的关系

系统提示词、用户提示词、AI Agent、Agent Tool、Function Calling、MCP、AI模型并非相互取代,而是协同工作,构成AI自动化协作体系。

image.png