针对已经完成抽取的任务,可以使用抽取特定字段接口为该任务抽取额外的字段,或重新抽取个别已有的字段。该接口会返回所有字段的完整抽取结果。Documentation Index
Fetch the complete documentation index at: https://docs-docflow.textin.com/llms.txt
Use this file to discover all available pages before exploring further.
功能说明
- 抽取额外字段:为已完成抽取的任务添加新的字段抽取
- 重新抽取字段:对已有字段进行重新抽取,可用于修正或优化抽取结果
- 支持表格字段:可以抽取表格中的特定字段
- 返回完整结果:返回所有字段的完整抽取结果,结构同
/api/app-api/sip/platform/v2/file/fetch
字段抽取规则
接口会根据字段是否在原分类配置中存在,采用不同的抽取策略:额外字段(原结果中不存在的字段)
对于原抽取结果中不存在的字段(额外字段),系统会使用请求中提供的prompt 进行抽取:
- 如果请求中提供了
prompt,则使用该prompt指导字段抽取 - 如果请求中未提供
prompt,则使用默认抽取逻辑
已配置字段(原分类中已存在的字段)
对于原分类配置中已存在的字段,系统会优先使用分类配置中的设置进行抽取:- 使用分类配置中的
prompt(如果已配置) - 应用分类配置中的后处理规则
- 忽略请求中传入的
prompt参数
使用建议
- 抽取新字段:在请求中提供
prompt,系统会使用该prompt进行抽取 - 重新抽取已有字段:直接指定
key即可,系统会自动使用分类配置中的规则,无需在请求中提供prompt
API 接口
接口地址:POST /api/app-api/sip/platform/v2/file/extract_fields
请求参数:
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
| workspace_id | string | 是 | 工作空间ID |
| task_id | string | 是 | 任务ID |
| fields | array | 否 | 要抽取的字段列表,每个字段包含 key(字段名称)和 prompt(字段提示,可选) |
| tables | array | 否 | 要抽取的表格字段列表,每个表格包含 name(表格名称)和 fields(字段列表) |
字段结构
ExtractFieldReqVO:示例代码
请求示例
仅抽取基本字段
仅抽取表格字段
同时抽取基本字段和表格字段
返回数据示例
注意事项
- 任务状态:该接口仅适用于已完成抽取的任务(
recognition_status为 1 或 2) - 字段名称:
key字段名称需要与配置的字段模板中的字段名称一致(对于已配置字段)或使用自定义名称(对于额外字段) - 字段提示(prompt):
- 对于额外字段(原结果中不存在),
prompt会生效,可用于指导抽取逻辑 - 对于已配置字段(原分类中已存在),
prompt会被忽略,系统使用分类配置中的规则
- 对于额外字段(原结果中不存在),
- 返回结果:接口返回所有字段的完整抽取结果,包括之前已抽取的字段和新抽取的字段
- 表格名称:
tables中的name需要与文档中实际的表格名称匹配

