agent skills 渐进式加载具体流程

Claude Agent Skills 的渐进式加载机制是一种高效管理上下文窗口的架构设计，通过分层加载策略确保模型在处理任务时仅加载必要的信息，从而节省资源并提高性能。以下是其具体流程的详细解析：

1. Level 1：元数据（Metadata） - 启动时加载

加载时机：Claude 启动时自动加载所有已安装技能的元数据。
内容：每个技能的 YAML 格式的元数据，包括技能名称（name）和描述（description）。
作用：元数据是模型判断是否使用某个技能的基础。例如，技能描述中可能包含“当用户提到报销、发票时使用此技能”。
特点：
- 始终加载：无论任务是否相关，元数据始终存在于上下文中。
- 低消耗：每个技能的元数据通常仅占用约 100 tokens。
- 路由决策：模型通过匹配用户请求与元数据中的关键词，决定是否触发技能。

2. Level 2：指令（Instructions） - 触发时加载

加载时机：当模型判断某个技能与当前任务相关时，才会加载该技能的完整指令内容。
内容：SKILL.md 文件中的正文内容，包括任务处理的详细步骤、注意事项、示例等。
作用：提供具体的业务处理逻辑和标准操作流程（SOP），指导模型如何执行任务。
特点：
- 按需加载：仅在任务匹配时加载，避免上下文窗口浪费。
- 中等消耗：通常控制在 5k tokens 以内。
- 动态扩展：如果指令内容过长，可以拆分到多个文件中，通过引用方式加载。

3. Level 3：资源和代码（Resources & Scripts） - 按需加载

加载时机：当模型需要执行具体操作时，才会加载技能目录中的资源文件或脚本。
内容：包括外部文档（如 reference.md）、脚本文件（如 scripts/fill_form.py）等。
作用：提供必要的领域知识或执行具体任务的代码逻辑。
特点：
- 条件触发：仅在特定场景下加载，例如用户请求填写 PDF 表单时，才会加载 forms.md。
- 高消耗：资源文件可能占用大量 tokens，但仅在需要时加载。
- 执行分离：脚本文件（如 Python 脚本）在不加载到上下文的情况下执行，仅输出结果。

4. 加载流程示例

以 PDF 表单填充任务为例，Claude 的加载流程如下：

初始状态：上下文窗口包含核心系统提示、所有技能的元数据（name 和 description）以及用户的消息。
触发技能：模型判断用户请求与 PDF 技能相关，读取 pdf/SKILL.md 文件。
加载补充信息：如果任务涉及表单填充，模型进一步读取 forms.md 文件。
执行任务：加载完相关指令后，模型开始处理用户的任务。

5. 优化策略

条件式加载：通过在 SKILL.md 中设置触发器（如“仅当提及报销时加载 finance_manual.md”），避免不必要的资源加载。
目录结构优化：对于较长的参考文件，使用目录结构帮助导航，避免深层嵌套引用。
脚本执行分离：脚本文件（如 Python 脚本）在不加载到上下文的情况下执行，仅输出结果，减少 tokens 消耗。

6. 技术优势

减少上下文消耗：通过分层加载，Claude 在闲置状态下仅加载元数据，几乎不占用上下文窗口。
支持大规模技能：渐进式披露机制使得模型可以支持数百个技能而不影响性能。
降低 API 成本：按需加载策略显著减少了 tokens 消耗，从而降低了 API 调用成本。

7. 总结

Claude Agent Skills 的渐进式加载机制通过分层策略（元数据、指令、资源）实现了高效的上下文管理。这种设计不仅节省了资源，还使得模型能够灵活应对复杂任务，同时保持高性能和低成本。对于企业用户而言，这一机制使得将 SOP（标准操作流程）转化为 AI 可执行的技能包成为可能。