智能审核功能可以帮助您自动检查文档抽取结果的准确性和合规性。本文介绍如何在界面上使用审核功能,让您快速了解审核功能的基本使用流程。
智能审核是 DocFlow 提供的一项自动化审核功能,它基于您配置的审核规则,自动对文档抽取结果进行审核,帮助您快速发现潜在问题。
审核功能概述
智能审核功能的核心流程包括:
- 配置审核规则 - 在规则库中创建规则组和规则,定义审核标准
- 创建审核任务 - 选择需要审核的抽取任务,提交审核任务
- 查看审核结果 - 获取审核结果,查看哪些规则通过、哪些不通过,以及审核依据
界面使用流程
步骤 1: 创建规则库
在审核管理界面,首先需要创建一个规则库(Rule Repository)。规则库是审核规则的容器,用于组织和管理相关的审核规则。
- 点击”创建规则库”按钮
- 输入规则库名称(例如:“发票审核规则库”)
- 保存后获得规则库ID
步骤 2: 创建规则组
在规则库下创建规则组(Rule Group),用于对规则进行分类管理。
- 选择已创建的规则库
- 点击”创建规则组”
- 输入规则组名称(例如:“发票合规性检查”)
- 保存后获得规则组ID
步骤 3: 创建审核规则
在规则组下创建具体的审核规则(Rule),定义审核的具体标准。
创建规则时需要配置:
- 规则名称:规则的标识名称
- 规则提示词:描述审核规则的提示词,用于指导AI进行审核判断
- 适用分类:规则适用于哪些文档分类(如:发票、合同等)
- 风险等级:规则的风险等级(高风险、中风险、低风险)
- 关联字段:规则需要关联的抽取字段,用于审核时获取字段值
示例规则:
- 规则名称:“发票金额校验”
- 规则提示词:“检查发票金额是否大于0且小于1000000”
- 适用分类:发票
- 风险等级:高风险
- 关联字段:发票金额
步骤 4: 创建审核任务
当您有已完成抽取的任务时,可以创建审核任务进行审核。
- 选择需要审核的抽取任务(extract_task_ids)
- 选择要使用的规则库(repo_id)
- 输入任务名称
- 提交审核任务
系统会自动将规则库中的规则与抽取任务进行匹配,对匹配的规则执行审核。
步骤 5: 查看审核结果
审核任务提交后,系统会自动执行审核。您可以查看审核结果:
- 任务状态:查看审核任务的整体状态(待审核、审核中、审核成功、审核失败等)
- 规则组结果:查看每个规则组的审核情况
- 规则结果:查看每个具体规则的审核结果(通过/不通过)
- 审核依据:查看AI给出的审核依据,了解为什么通过或不通过
- 位置回溯:查看审核依据在原文中的位置,便于定位问题
审核结果说明
审核结果包含以下信息:
-
审核状态:
0: 未审核
1: 审核通过
2: 审核失败
3: 审核中
4: 审核不通过
-
审核依据:AI给出的审核理由,说明为什么得出该审核结果
-
位置回溯:审核依据在原文中的位置坐标,可用于在文档中高亮显示相关区域
术语解释
本文介绍智能审核功能中的核心概念,帮助您更好地理解和使用审核功能。
规则库管理
规则库管理采用三层结构:规则库(Rule Repository) → 规则组(Rule Group) → 规则(Rule)
规则库(Rule Repository)
规则库是审核规则的顶层容器,用于组织和管理相关的审核规则。一个工作空间可以创建多个规则库,每个规则库可以包含多个规则组。
特点:
- 规则库是规则的逻辑分组,便于管理不同业务场景的审核规则
- 创建审核任务时需要指定使用的规则库
- 规则库可以独立创建、更新和删除
示例:
- “发票审核规则库” - 包含所有发票相关的审核规则
- “合同审核规则库” - 包含所有合同相关的审核规则
规则组(Rule Group)
规则组是规则库下的二级分类,用于对规则进行更细粒度的分组管理。一个规则库可以包含多个规则组,一个规则组可以包含多个规则。
特点:
- 规则组用于对规则进行分类,便于查找和管理
- 在审核结果中,规则组是结果展示的一个维度
- 规则组可以独立创建、更新和删除
示例:
在”发票审核规则库”下可以创建:
- “发票合规性检查” - 检查发票是否符合合规要求
- “发票金额校验” - 检查发票金额的合理性
- “发票日期校验” - 检查发票日期的有效性
规则(Rule)
规则是审核的最小执行单元,定义了具体的审核标准和逻辑。一个规则组可以包含多个规则。
规则组成:
- 规则名称:规则的标识名称,便于识别和管理
- 规则提示词(Prompt):描述审核规则的提示词,用于指导AI进行审核判断。这是规则的核心,需要清晰描述审核的标准和逻辑
- 适用分类(Category IDs):规则适用于哪些文档分类。只有匹配到这些分类的抽取任务才会应用该规则
- 风险等级(Risk Level):
- 关联字段(Referenced Fields):规则需要关联的抽取字段,用于审核时获取字段值
规则示例:
{
"name": "发票金额校验",
"prompt": "检查发票金额是否大于0且小于1000000,如果不在范围内则审核不通过",
"category_ids": ["invoice_category_id"],
"risk_level": 10,
"referenced_fields": [
{
"category_id": "invoice_category_id",
"category_name": "发票",
"fields": [
{
"field_id": "amount_field_id",
"field_name": "发票金额"
}
]
}
]
}
审核对象
审核对象是抽取任务(Extract Task),即已完成文档抽取的任务。
抽取任务的特点:
- 抽取任务由文档上传和抽取流程产生
- 每个抽取任务对应一个或多个文件
- 抽取任务包含抽取结果,包括字段、表格、印章等信息
- 只有已完成抽取的任务才能作为审核对象
获取抽取任务ID:
- 通过文件上传接口返回的
task_id
- 通过文件查询接口获取已完成抽取的文件对应的任务ID
审核任务
审核任务(Review Task)是将规则库应用到抽取任务上的一次审核执行。
审核任务的组成:
- 任务名称:审核任务的标识名称
- 规则库ID:指定使用的规则库
- 抽取任务ID列表:需要审核的抽取任务ID
审核任务的执行流程:
- 规则匹配:系统根据规则库中的规则,与抽取任务的分类进行匹配
- 匹配标准:规则的
category_ids 中的所有分类都必须存在于抽取任务的分类列表中
- 匹配结果:只有匹配成功的规则才会被执行
- 字段获取:对于匹配的规则,如果规则配置了关联字段,系统会从抽取结果中获取这些字段的值
- 关联字段可以为空,如果为空则只使用文档原始内容
- 如果字段缺失,该字段值为空,但审核仍会执行
- AI审核:基于规则提示词和字段值(如果有),AI进行审核判断
- 结果生成:生成审核结果,包括审核状态、审核依据、位置回溯等信息
审核规则和抽取任务的匹配方法
系统通过分类匹配的方式将审核规则与抽取任务进行匹配。关联字段与规则匹配无关,关联字段只是说明在审核该分类时,如果需要使用抽取字段,则使用哪些字段。关联字段可以为空。
匹配规则
规则匹配的判断标准:
- 规则配置了
category_ids(适用分类列表)
- 抽取任务包含一个或多个文档分类
- 如果规则的
category_ids 中的所有分类都在抽取任务的分类列表中,则规则匹配成功
- 如果规则的
category_ids 中有任何一个分类不在抽取任务的分类列表中,则规则不匹配
匹配示例
假设待审核的抽取任务中包含 A、B、C 三个分类:
- 审核规则一:关联分类
["A", "B"]
- 审核规则二:关联分类
["C"]
- 审核规则三:关联分类
["C", "D"]
匹配结果:
- ✅ 审核规则一:匹配成功(A 和 B 都在抽取任务的分类列表中)
- ✅ 审核规则二:匹配成功(C 在抽取任务的分类列表中)
- ❌ 审核规则三:匹配失败(D 不在抽取任务的分类列表中)
关联字段的作用
重要说明:关联字段(referenced_fields)与规则匹配无关。
关联字段的作用是:
- 当规则匹配成功后,系统需要执行审核时,如果规则提示词中需要使用抽取字段的值,则从关联字段中获取
- 关联字段可以为空,如果为空,则审核时只使用文档的原始内容,不使用抽取字段
- 如果规则关联了字段,但抽取任务中该字段缺失,审核仍然会执行,只是该字段的值为空
示例:
{
"name": "发票金额校验",
"prompt": "检查发票金额是否大于0且小于1000000",
"category_ids": ["invoice"],
"referenced_fields": [
{
"category_id": "invoice",
"fields": [
{
"field_id": "amount_field_id",
"field_name": "发票金额"
}
]
}
]
}
在这个例子中:
- 规则匹配:只要抽取任务的分类包含
invoice,规则就会匹配
- 关联字段:如果规则匹配成功,审核时会从抽取结果中获取”发票金额”字段的值,用于审核判断
- 如果”发票金额”字段缺失,审核仍然会执行,只是该字段值为空
关联字段
关联字段(Referenced Fields)用于指定在审核时需要使用哪些抽取字段的值。关联字段与规则匹配无关,它只是在规则匹配成功后,用于告诉系统在审核该分类时应该使用哪些字段的值。
重要说明:
- 关联字段可以为空,如果为空,审核时只使用文档的原始内容
- 关联字段不影响规则匹配,规则匹配只基于分类(
category_ids)
- 如果关联的字段在抽取结果中缺失,审核仍然会执行,只是该字段的值为空
关联字段的结构:
关联字段按分类组织,每个分类下可以包含:
- 普通字段(Fields):文档中的键值对字段
- 表格字段(Tables):文档中的表格字段
关联字段的作用:
- 当规则匹配成功并执行审核时,系统会从抽取结果中获取关联字段的值
- 字段值会作为上下文信息提供给AI,结合规则提示词进行审核判断
- 如果字段值缺失,审核仍然会执行,但可能影响审核的准确性(取决于规则提示词是否依赖该字段)
关联字段示例:
{
"referenced_fields": [
{
"category_id": "invoice_category_id",
"category_name": "发票",
"fields": [
{
"field_id": "invoice_code_id",
"field_name": "发票代码"
},
{
"field_id": "invoice_amount_id",
"field_name": "发票金额"
}
],
"tables": [
{
"table_id": "invoice_items_table_id",
"table_name": "发票明细",
"fields": [
{
"field_id": "item_name_id",
"field_name": "货物名称"
}
]
}
]
}
]
}
审核依据
审核依据(Reasoning)是AI给出的审核理由,说明为什么得出该审核结果。
审核依据的特点:
- 审核依据是文本形式,描述审核的判断过程
- 审核依据中会引用相关的字段值或文档内容
- 审核依据可以帮助用户理解审核结果
位置回溯(Anchors):
位置回溯是审核依据在原文中的位置信息,用于定位审核依据在文档中的具体位置。
位置回溯的结构:
{
"anchors": [
{
"start_pos": 0, // 在reasoning中的起始字符位置
"end_pos": 10, // 在reasoning中的结束字符位置
"text": "原文内容", // 原文内容
"vertices": [ // 原文内容的外接四边形坐标
0, 0, 100, 0, 100, 100, 0, 100
],
"file_id": "file_id" // 文件ID
}
]
}
位置回溯的作用:
- 可以在文档中高亮显示审核依据的位置
- 帮助用户快速定位问题所在
- 提供可视化的审核结果展示
审核结果状态
审核结果有多种状态,表示审核的不同阶段和结果:
0: 未审核
1: 审核通过
2: 审核失败
3: 审核中
4: 审核不通过
5: 识别中
6: 排队中
7: 识别失败
智能审核功能通过规则库、规则组、规则的三层结构管理审核标准,通过分类匹配和字段关联将规则应用到抽取任务上,使用AI进行审核判断,并生成包含审核依据和位置回溯的审核结果,帮助用户快速发现文档中的潜在问题。
下一步