基盤スマート文書抽出 API とは
基盤スマート文書抽出 API(Entity Extraction)は、TextIn が提供する独立型の文書情報抽出サービスです。大規模モデルを活用して文書から重要なフィールドやテーブルを抽出し、自然言語で抽出内容を指定する Prompt モードと、fields / table_fields で構造化して指定するフィールドモードに対応しています。
この API は Docflow プラットフォーム内部で使用される基盤抽出エンジンであり、Docflow から独立して呼び出すこともできます。
Docflow 文書抽出との違い
| 比較項目 | Docflow 文書抽出 | 基盤スマート文書抽出 API(Entity Extraction) |
|---|---|---|
| 呼び出し方法 | Docflow のアップロード → 分類 → 抽出フローを利用 | 直接呼び出す TextIn Entity Extraction API |
| API タイプ | 非同期 API:ファイルアップロード後、タスク ID で結果を照会 | 同期 API:リクエスト後すぐに抽出結果を返し、ポーリングは不要 |
| タスク記録 | 完全なタスク記録があり、履歴結果をいつでも照会可能 | タスク記録なし、結果は永続保存されません、呼び出し側で保存する必要があります |
| 前提条件 | 事前にファイルカテゴリとフィールド/テーブルテンプレートを設定する必要があります | 事前設定は不要で、リクエストパラメータで抽出内容を指定します |
| 抽出モード | カテゴリテンプレートに基づくフィールド抽出。フィールド、テーブル、印影、手書き情報に対応 | Prompt モード: 自然言語で抽出したい内容を指定。フィールドモード: fields と table_fields で構造化して指定 |
| 結果特徴 | Docflow の処理フローと深く連携し、レビュー規則チェックにも対応 | llm_json(直接結果)と raw_json(座標付き)を返し、token 使用量の統計も含みます |
| 適した利用シーン | 同種文書を一括処理し、分類やレビューまで含む業務フローを構築したい場合 | 抽出効果をすばやく検証したい場合、柔軟に抽出したい場合、Docflow の完全なフローが不要な軽量シナリオ |
基盤スマート文書抽出 API は同期 API です。呼び出し後すぐに抽出結果を返し、プラットフォーム側にタスク記録は作成されません。後から履歴結果を照会することもできません。永続保存や履歴照会が必要な場合は、Docflow の文書抽出フローを使用してください。

