Documentation Index
Fetch the complete documentation index at: https://docs-docflow.textin.com/llms.txt
Use this file to discover all available pages before exploring further.
功能概述
对于包含多份、多类别文件的复杂文档,文件拆分功能支持智能识别文档内容,实现文档的自动拆分及分类。使用场景
1. 医疗保险理赔场景
一份多页文件包含:- 第1-2页:保单信息
- 第3-5页:医疗发票
- 第6-10页:住院记录
2. 物流进出口场景
一份文件包含:- 第1页:出口报关单
- 第2页:商业发票
- 第3页:装箱单(Packing List)
- 第4页:销售合同
文件拆分功能可以按文档类型进行智能拆分。
API 参数配置
启用文件拆分功能
在上传接口中设置split_flag=true 来启用文件拆分功能:
参数说明
| 参数名 | 类型 | 默认值 | 说明 |
|---|---|---|---|
split_flag | boolean | false | 是否启用文件拆分功能 |
示例代码
返回结果说明
文件拆分结果结构
当启用文件拆分功能后,file/fetch 接口返回的结果中会包含 child_files 字段,用于描述拆分后的子文档信息:
关键字段说明
| 字段名 | 类型 | 说明 |
|---|---|---|
child_files | array | 拆分后的子文件列表 |
child_files[].id | string | 子文件唯一标识 |
child_files[].task_type | integer | 任务类型,0表示文件拆分产生 |
child_files[].category | string | 文档分类结果 |
child_files[].pages | string | 拆分后的子文件页面信息,含子文件在原文件中的页码 |

