基盤文書解析 API とは
基盤文書解析 API(xParse)は TextIn が提供する独立した文書解析サービスです。PDF、画像、Word などのファイルを Markdown / JSON の構造化コンテンツへ直接変換でき、テーブル、目次、画像、座標などの豊富な出力に対応しています。 この API は Docflow プラットフォーム内部で使用される基盤解析エンジンであり、Docflow から独立して呼び出すこともできます。Docflow 文書解析との違い
| 比較項目 | Docflow 文書解析 | 基盤文書解析 API(xParse) |
|---|---|---|
| 呼び出し方法 | Docflow の結果取得 API で with_document=true パラメータを指定 | 直接呼び出す TextIn 文書解析 API |
| API タイプ | 非同期 API:ファイルアップロード後、タスク ID で結果を照会 | 同期 API:リクエスト後すぐに解析結果を返し、ポーリングは不要 |
| タスク記録 | 完全なタスク記録があり、履歴結果をいつでも照会可能 | タスク記録なし、結果は永続保存されません、呼び出し側で保存する必要があります |
| 前提条件 | 先にファイルを Docflow ワークスペースへアップロードする必要があります | Docflow は不要、ファイルを直接アップロードするだけで利用できます |
| 戻り値形式 | Docflow のファイル結果に統合されます result.files[].document、pages/lines/position を含みます | Markdown、detail、pages、catalog、テーブル、画像などを含む完全な解析結果を独立して返します |
| 設定の柔軟性 | Docflow 内部で管理されます | 豊富なパラメータ設定に対応(parse_mode、page_details、markdown_details など) |
| 適した利用シーン | 分類、抽出、レビューなど後続工程を含む Docflow の完全なフローを利用する場合 | 仅需文書解析能力、如构建知识库、RAG 应用、文書形式转换など |
基盤文書解析 API は同期 API です。呼び出し後すぐに解析結果を返し、プラットフォーム側にタスク記録は作成されません。後から履歴結果を照会することもできません。永続保存や履歴照会が必要な場合は、Docflow の文書解析フローを使用してください。

