Docflow 文書抽出との違い

基盤スマート文書抽出 API とは

基盤スマート文書抽出 API（Entity Extraction）は、TextIn が提供する独立型の文書情報抽出サービスです。大規模モデルを活用して文書から重要なフィールドやテーブルを抽出し、自然言語で抽出内容を指定する Prompt モードと、fields / table_fields で構造化して指定するフィールドモードに対応しています。

この API は Docflow プラットフォーム内部で使用される基盤抽出エンジンであり、Docflow から独立して呼び出すこともできます。

Docflow 文書抽出との違い

比較項目	Docflow 文書抽出	基盤スマート文書抽出 API（Entity Extraction）
呼び出し方法	Docflow のアップロード → 分類 → 抽出フローを利用	直接呼び出す TextIn Entity Extraction API
API タイプ	非同期 API:ファイルアップロード後、タスク ID で結果を照会	同期 API:リクエスト後すぐに抽出結果を返し、ポーリングは不要
タスク記録	完全なタスク記録があり、履歴結果をいつでも照会可能	タスク記録なし、結果は永続保存されません、呼び出し側で保存する必要があります
前提条件	事前にファイルカテゴリとフィールド/テーブルテンプレートを設定する必要があります	事前設定は不要で、リクエストパラメータで抽出内容を指定します
抽出モード	カテゴリテンプレートに基づくフィールド抽出。フィールド、テーブル、印影、手書き情報に対応	Prompt モード: 自然言語で抽出したい内容を指定。フィールドモード: `fields` と `table_fields` で構造化して指定
結果特徴	Docflow の処理フローと深く連携し、レビュー規則チェックにも対応	`llm_json`（直接結果）と `raw_json`（座標付き）を返し、token 使用量の統計も含みます
適した利用シーン	同種文書を一括処理し、分類やレビューまで含む業務フローを構築したい場合	抽出効果をすばやく検証したい場合、柔軟に抽出したい場合、Docflow の完全なフローが不要な軽量シナリオ

基盤スマート文書抽出 API は同期 API です。呼び出し後すぐに抽出結果を返し、プラットフォーム側にタスク記録は作成されません。後から履歴結果を照会することもできません。永続保存や履歴照会が必要な場合は、Docflow の文書抽出フローを使用してください。

​基盤スマート文書抽出 API とは

​Docflow 文書抽出との違い

基盤スマート文書抽出 API とは

Docflow 文書抽出との違い