Docflow 文書解析との違い

基盤文書解析 API とは

基盤文書解析 API（xParse）は TextIn が提供する独立した文書解析サービスです。PDF、画像、Word などのファイルを Markdown / JSON の構造化コンテンツへ直接変換でき、テーブル、目次、画像、座標などの豊富な出力に対応しています。

この API は Docflow プラットフォーム内部で使用される基盤解析エンジンであり、Docflow から独立して呼び出すこともできます。

Docflow 文書解析との違い

比較項目	Docflow 文書解析	基盤文書解析 API（xParse）
呼び出し方法	Docflow の結果取得 API で `with_document=true` パラメータを指定	直接呼び出す TextIn 文書解析 API
API タイプ	非同期 API:ファイルアップロード後、タスク ID で結果を照会	同期 API:リクエスト後すぐに解析結果を返し、ポーリングは不要
タスク記録	完全なタスク記録があり、履歴結果をいつでも照会可能	タスク記録なし、結果は永続保存されません、呼び出し側で保存する必要があります
前提条件	先にファイルを Docflow ワークスペースへアップロードする必要があります	Docflow は不要、ファイルを直接アップロードするだけで利用できます
戻り値形式	Docflow のファイル結果に統合されます `result.files[].document`、pages/lines/position を含みます	Markdown、detail、pages、catalog、テーブル、画像などを含む完全な解析結果を独立して返します
設定の柔軟性	Docflow 内部で管理されます	豊富なパラメータ設定に対応（`parse_mode`、`page_details`、`markdown_details` など）
適した利用シーン	分類、抽出、レビューなど後続工程を含む Docflow の完全なフローを利用する場合	仅需文書解析能力、如构建知识库、RAG 应用、文書形式转换など

基盤文書解析 API は同期 API です。呼び出し後すぐに解析結果を返し、プラットフォーム側にタスク記録は作成されません。後から履歴結果を照会することもできません。永続保存や履歴照会が必要な場合は、Docflow の文書解析フローを使用してください。

​基盤文書解析 API とは