Document AI 故障排除

在使用 Document AI 时,以下场景可以帮助您解决可能发生的问题。

提取查询不起作用

要使 提取查询 正常工作,必须在内部或外部暂存区存储要提取的文档。确保在创建内部暂存区时指定 SNOWFLAKE_SSE 加密类型。

错误

根据文档格式的不同,您可能会收到以下错误:

{   "__processingErrors": [     "File extension does not match actual mime type. Mime-Type: application/octet-stream"   ] }
{   "__processingErrors": [     "cannot identify image file <_io.BytesIO object at 0x7f8a800ba020>"   ] }

原因

创建内部暂存区存储文档时未指定 SNOWFLAKE_SSE 加密类型。

解决方案

要创建 内部暂存区,请运行 CREATE STAGE 命令,如下例所示:

CREATE STAGE doc_ai_stage
  DIRECTORY = (ENABLE = TRUE)
  ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE');
Copy

预签名 URL 已过期

暂存文档的预签名 URL 是 <model_build_name>!PREDICT 的必要实参。要获取预签名 URL,请调用 GET_PRESIGNED_URL 函数,该函数有默认的有效期。

有关更多信息,请参阅 GET_PRESIGNED_URL

错误

{ "__processingErrors": [ "Received HTTP 403 response for presigned URL. URL may be expired." ] }

原因

预签名 URL 已过期。

解决方案

要么减少一次查询的文档数量,要么延长有效期。有关延长有效期的更多信息,请参阅 GET_PRESIGNED_URL

一次查询的文档过多

Document AI 对一次 提取查询 的文档数量进行了限制。有关更多信息,请参阅 Document AI 的已知限制

错误

{ "__processingErrors": [ "Query limit reached: too many documents in a single query." ] }

原因

您试图在一次查询中处理过多文档。

解决方案

使用多个查询来处理文档。

文档不符合特定要求

您使用 Document AI 处理的文档必须满足特定要求。有关更多信息,请参阅 为 Document AI 准备文档

错误

您可能会收到以下错误之一:

{ "__processingErrors": [ "Page 0 size is larger than the limit. Actual: 1083 mm x 1384 mm. Maximum: 1200 mm x 1200 mm." ] }
{ "__processingErrors": [ "Document has too many pages. Actual: 150. Maximum: 125." ] }
{ "__processingErrors": [ "Image size is too small. Actual: 20x20 px. Minimum: 50x50 px." ] }
{ "__processingErrors": [ "Unsupported file format. Actual: csv. Supported: docx, eml, htm, html, jpeg, jpg, pdf, png, text, tif, tiff, txt." ] }
{ "__processingErrors": [ "File exceeds maximum size. Actual: 54096026 bytes. Maximum: 50000000 bytes." ] }

原因

试图处理的文档不符合 Document AI 的要求。有关要求的详细信息,请参阅 为 Document AI 准备文档

解决方案

准备好符合要求的文档。

Document AI 模型构建未发布

要使用 Document AI 提取信息,您需要发布 Document AI 模型构建。如果您训练了模型,并且在训练后没有添加新的数据值(提出新的问题),则无需发布模型构建。

错误

错误消息开头如下:

Request failed for external function DOCUMENT_EXTRACT_FEATURES$V1 with remote service error: 422

原因

Document AI 模型构建未发布。

解决方案

发布 Document AI 模型构建。有关更多信息,请参阅 发布 Document AI 模型构建

未授予所需权限或模型构建名称重复

要创建 Document AI 模型构建,必须授予角色所需的权限,并选择一个唯一的模型构建名称。

有关所需权限的更多信息,请参阅 Document AI 访问控制

错误

Unable to create a build on the specified database and schema. Please check the documentation to learn more.

原因

可能的原因有:

  • 角色未获得 CREATE SNOWFLAKE.ML.DOCUMENT_INTELLIGENCE 权限。

  • 数据库和架构中已存在模型构建名称。

解决方案

语言: 中文