触发抽取
Docflow 默认业务流程是 解析->分类->抽取。因此上传文件后,默认情况下,最终都能获取到抽取结果。
category 指定文档类别,这会跳过自动分类,以便匹配相应的字段模板:
获取并解析抽取结果
result.files[].recognition_status表示文件识别状态。跟抽取相关的状态有:
- 0: 待识别
- 1: 抽取成功
- 2: 抽取失败
result.files[].data 中,关键字段如下:
- fields[]: 关键键值对,每项包含- key、- value与- position[](可用于画坐标)
- items[][]: 表格行的键值对集合
- stamps[]: 印章信息
- handwritings[]: 手写体信息
Python 示例:打印字段和表格
Python
关联页面坐标进行可视化
结合files[].pages[] 的 width/height/angle/dpi 与 fields[].position[].vertices,可在前端精确绘制字段框,详见解析结果可视化。

