Docflow 默认会进行完整的 解析->分类->抽取 流程。
如果按照业务需求只想要分类结果,可以在上传接口中加入target_process=classify参数,流程就会在完成分类后终止,跳过抽取过程。

上传文件进行仅分类

curl -X POST \
  -H "x-ti-app-id: <your-app-id>" \
  -H "x-ti-secret-code: <your-secret-code>" \
  -F "file=@/path/to/your/file.pdf" \
  "https://docflow.textin.com/api/app-api/sip/platform/v2/file/upload?workspace_id=<your-workspace-id>&target_process=classify"

查询分类结果

使用 file/fetch 接口查询分类结果:
curl \
  -H "x-ti-app-id: <your-app-id>" \
  -H "x-ti-secret-code: <your-secret-code>" \
  "https://docflow.textin.com/api/app-api/sip/platform/v2/file/fetch?workspace_id=<your-workspace-id>&file_id=<your-file-id>"

仅分类时的 recognition_status 状态说明

当使用 target_process=classify 进行仅分类时,recognition_status 字段会有以下状态变化:

状态值说明

  • 0 - 待识别:文件刚上传,等待处理
  • 3 - 分类中:正在进行分类处理
  • 10 - 分类完成:仅分类流程的最终状态,表示分类已完成,不会进行抽取
  • 2 - 分类失败:分类过程中出现错误

与完整流程的区别

**完整流程(默认)**的状态变化:
  • 0341(待识别 → 分类中 → 抽取中 → 识别成功)
仅分类流程的状态变化:
  • 0310(待识别 → 分类中 → 分类完成)

返回示例

{
  "code": 200,
  "result": {
    "files": [
      {
        "id": "202412190001",
        "name": "invoice.pdf",
        "category": "invoice",
        "recognition_status": 10,
        "data": null
      }
    ]
  }
}