使用 docflow-sdk Python SDK 快速集成 Docflow 文档流程管理能力
docflow-sdk 是 TextIn Docflow 的官方 Python SDK,提供工作空间管理、文档分类、智能审核、类型安全的响应模型和完善的错误处理。
- PyPI: docflow-sdk
- GitHub: docflow-python-sdk
安装
认证与初始化
SDK 支持多种认证方式(优先级:构造参数 > 环境变量 > .env 文件):API 概览
| 资源 | 说明 | 主要方法 |
|---|---|---|
client.workspace | 工作空间管理 | create(), list(), get(), update(), delete(), iter() |
client.category | 文档类别管理 | create(), list(), get(), update(), delete(), iter() |
client.category.fields | 类别字段管理 | add(), list(), update(), delete() |
client.category.tables | 类别表格管理 | add(), list(), update(), delete() |
client.category.samples | 类别样本管理 | upload(), list(), download(), delete() |
client.file | 文件管理与识别 | upload(), fetch(), download(), delete() |
client.review | 智能审核规则管理 | create_repo(), create_group(), create_rule(), submit_task() |
工作空间管理
工作空间是 Docflow 的顶层组织单位,用于隔离不同业务场景的文档处理流程。创建工作空间
获取工作空间列表
链式调用(推荐)
通过上下文绑定简化代码,减少重复参数传递:文档类别管理
类别定义文档的结构化字段和抽取规则。创建类别(带样本文件)
字段管理
表格管理
样本管理
文件处理
上传文件并识别
获取识别结果
智能审核
Docflow 提供基于 LLM 的智能审核能力,支持单文档规则校验和跨文档交叉审核。创建审核规则库
跨文档交叉审核
提交审核任务
获取审核结果
枚举类型
SDK 提供完整的枚举类型定义,避免参数传错:自动分页迭代器
使用迭代器自动处理分页,无需手动循环:错误处理
SDK 提供了完善的错误分类,方便精确处理不同的异常情况。错误类型
| 错误类 | 说明 |
|---|---|
DocflowException | 基础错误类,捕获所有 SDK 错误 |
ValidationError | 参数校验失败 |
AuthenticationError | 认证失败(app-id 或 secret-code 错误) |
PermissionDeniedError | 权限不足 |
ResourceNotFoundError | 资源不存在 |
APIError | API 调用失败(HTTP 4xx/5xx) |
NetworkError | 网络连接错误 |
错误处理示例
国际化(i18n)
SDK 支持多语言错误消息:高级配置
超时与重试
自定义重试配置
自定义 API 地址
资源管理
使用上下文管理器自动关闭连接:调试日志
启用 DEBUG 级别日志查看请求详情:完整示例
查看 examples 目录 获取完整的使用示例:- 快速开始: quick_start.py - 费用报销场景端到端流程
- 完整工作流: complete_workflow_example.py - 发票处理完整流程
- 文件处理: file_examples.py - 文件上传、识别、下载示例
- 审核规则: review_examples.py - 审核规则配置示例
常见问题
| 问题 | 解决方案 |
|---|---|
AuthenticationError | 检查 DOCFLOW_APP_ID 和 DOCFLOW_SECRET_CODE 是否正确 |
ResourceNotFoundError | 确认工作空间ID/类别ID是否存在且有权限访问 |
ValidationError | 检查参数格式和取值范围(如工作空间名称最大50字符) |
| 识别结果为空 | 确认类别配置正确(字段、表格、样本文件),等待识别完成后再获取结果 |
| 审核任务失败 | 检查规则配置(referenced_fields 的 field_id 必须正确)和 extract_task_ids 有效性 |

