メインコンテンツへスキップ

基盤スマート文書抽出 API とは

基盤スマート文書抽出 API(Entity Extraction)は、TextIn が提供する独立型の文書情報抽出サービスです。大規模モデルを活用して文書から重要なフィールドやテーブルを抽出し、自然言語で抽出内容を指定する Prompt モードと、fields / table_fields で構造化して指定するフィールドモードに対応しています。 この API は Docflow プラットフォーム内部で使用される基盤抽出エンジンであり、Docflow から独立して呼び出すこともできます。

Docflow 文書抽出との違い

比較項目Docflow 文書抽出基盤スマート文書抽出 API(Entity Extraction)
呼び出し方法Docflow のアップロード → 分類 → 抽出フローを利用直接呼び出す TextIn Entity Extraction API
API タイプ非同期 API:ファイルアップロード後、タスク ID で結果を照会同期 API:リクエスト後すぐに抽出結果を返し、ポーリングは不要
タスク記録完全なタスク記録があり、履歴結果をいつでも照会可能タスク記録なし、結果は永続保存されません、呼び出し側で保存する必要があります
前提条件事前にファイルカテゴリとフィールド/テーブルテンプレートを設定する必要があります事前設定は不要で、リクエストパラメータで抽出内容を指定します
抽出モードカテゴリテンプレートに基づくフィールド抽出。フィールド、テーブル、印影、手書き情報に対応Prompt モード: 自然言語で抽出したい内容を指定。フィールドモード: fieldstable_fields で構造化して指定
結果特徴Docflow の処理フローと深く連携し、レビュー規則チェックにも対応llm_json(直接結果)と raw_json(座標付き)を返し、token 使用量の統計も含みます
適した利用シーン同種文書を一括処理し、分類やレビューまで含む業務フローを構築したい場合抽出効果をすばやく検証したい場合、柔軟に抽出したい場合、Docflow の完全なフローが不要な軽量シナリオ
基盤スマート文書抽出 API は同期 API です。呼び出し後すぐに抽出結果を返し、プラットフォーム側にタスク記録は作成されません。後から履歴結果を照会することもできません。永続保存や履歴照会が必要な場合は、Docflow の文書抽出フローを使用してください。