抽出を実行
Docflow のデフォルト業務フローは「解析 → 分類 → 抽出」です。そのため、ファイルをアップロードすると、通常は最終ステップで抽出結果を取得できます。
category と組み合わせて文書カテゴリを指定することもできます。この場合、自動分類をスキップし、対応するフィールドテンプレートに直接マッチさせます。
抽出結果を取得して解析
result.files[].recognition_status はファイルの認識ステータスを表します。抽出に関連するステータスは次のとおりです。
0: 認識待ち1: 抽出成功2: 抽出失敗
result.files[].data に格納されます。主なプロパティは次のとおりです。
fields[]: キーと値のペア。各要素にkey、value、position[]が含まれます(座標描画に利用できます)items[][]: 表の行単位のキーと値のペア集合stamps[]: 印影情報handwritings[]: 手書き情報
Python 例: フィールドと表を出力
Python
可視化のためにページ座標を関連付ける
files[].pages[] のプロパティ(width、height、angle、dpi)と fields[].position[].vertices を組み合わせると、フロントエンドでフィールドの境界ボックスを正確に描画できます。詳細は 解析結果の可視化 を参照してください。
主要な返却フィールド例(抜粋)
関連ページ
- 基本フィールド情報 - 基本フィールド情報の構造と処理方法の詳細説明
- テーブルフィールド情報 - テーブルフィールド情報の構造と処理方法の詳細説明
- 印影情報 - 印影情報の構造と処理方法の詳細説明
- 手書き情報 - 手書き情報の構造と処理方法の詳細説明
- 特定フィールドを抽出 - 抽出済みタスクに対して追加フィールドの抽出や既存フィールドの再抽出を行う

