メインコンテンツへスキップ

基盤文書解析 API とは

基盤文書解析 API(xParse)は TextIn が提供する独立した文書解析サービスです。PDF、画像、Word などのファイルを Markdown / JSON の構造化コンテンツへ直接変換でき、テーブル、目次、画像、座標などの豊富な出力に対応しています。 この API は Docflow プラットフォーム内部で使用される基盤解析エンジンであり、Docflow から独立して呼び出すこともできます。

Docflow 文書解析との違い

比較項目Docflow 文書解析基盤文書解析 API(xParse)
呼び出し方法Docflow の結果取得 API で with_document=true パラメータを指定直接呼び出す TextIn 文書解析 API
API タイプ非同期 API:ファイルアップロード後、タスク ID で結果を照会同期 API:リクエスト後すぐに解析結果を返し、ポーリングは不要
タスク記録完全なタスク記録があり、履歴結果をいつでも照会可能タスク記録なし、結果は永続保存されません、呼び出し側で保存する必要があります
前提条件先にファイルを Docflow ワークスペースへアップロードする必要がありますDocflow は不要、ファイルを直接アップロードするだけで利用できます
戻り値形式Docflow のファイル結果に統合されます result.files[].document、pages/lines/position を含みますMarkdown、detail、pages、catalog、テーブル、画像などを含む完全な解析結果を独立して返します
設定の柔軟性Docflow 内部で管理されます豊富なパラメータ設定に対応(parse_modepage_detailsmarkdown_details など)
適した利用シーン分類、抽出、レビューなど後続工程を含む Docflow の完全なフローを利用する場合仅需文書解析能力、如构建知识库、RAG 应用、文書形式转换など
基盤文書解析 API は同期 API です。呼び出し後すぐに解析結果を返し、プラットフォーム側にタスク記録は作成されません。後から履歴結果を照会することもできません。永続保存や履歴照会が必要な場合は、Docflow の文書解析フローを使用してください。