当在 DocFlow 空间设置页面配置好文件分类模板后,后续文件上传时,如果不指定该文件类型,Docflow 都会自动对文件进行分类,以便后续抽取或审核使用。 文件分类的使用场景Documentation Index
Fetch the complete documentation index at: https://docs-docflow.textin.com/llms.txt
Use this file to discover all available pages before exploring further.
- 报销场景有餐饮发票、出租车发票、飞机行程单等类型单据需要分类
- 物流进出口场景有进口报关单、出口报关单、货运保单、原产地证明等材料需要分类
分类原理
Docflow 配置的分类示例文件后,示例文件先经过解析,然后会对示例文件的标题、文件类型、字段配置、分类提示词等进行向量化分析。 在新文件上传并完成解析后,通过算法将新文件与已配置的分类进行比较,得出最匹配的分类结果。获取分类结果
可通过结果获取接口file/fetch 查询。接口返回 JSON 结构,文件分类信息在
result.files[].category字段中。
分类结果结构与状态
file/fetch 的返回中,每个文件的关键字段包括:
id:文件 IDname:文件名category:分类结果(例如invoice)recognition_status:识别状态
RecognitionStatus):
0待识别1识别成功(完整流程结束时)2识别失败3分类中10分类完成(仅当上传时target_process=classify才会出现此终态)

