- 报销场景有餐饮发票、出租车发票、飞机行程单等类型单据需要分类
- 物流进出口场景有进口报关单、出口报关单、货运保单、原产地证明等材料需要分类
必须在 Docflow 空间下配置好分类模板,才能使用分类功能。
Docflow 默认会进行完整的 解析->分类->抽取 流程。
如果只想要分类结果,请参考仅分类文档说明。
如果只想要分类结果,请参考仅分类文档说明。
分类原理
Docflow 配置的分类示例文件后,示例文件先经过解析,然后会对示例文件的标题、文件类型、字段配置、分类提示词等进行向量化分析。 在新文件上传并完成解析后,通过算法将新文件与已配置的分类进行比较,得出最匹配的分类结果。获取分类结果
可通过结果获取接口file/fetch 查询。接口返回 JSON 结构,文件分类信息在
result.files[].category字段中。
分类结果结构与状态
file/fetch 的返回中,每个文件的关键字段包括:
- id:文件 ID
- name:文件名
- category:分类结果(例如- invoice)
- recognition_status:识别状态
RecognitionStatus):
- 0待识别
- 1识别成功(完整流程结束时)
- 2识别失败
- 3分类中
- 10分类完成(仅当上传时- target_process=classify才会出现此终态)

