Document AI 故障排除¶
在使用 Document AI 时,以下场景可以帮助您解决可能发生的问题。
提取查询不起作用¶
要使 提取查询 正常工作,必须在内部或外部暂存区存储要提取的文档。确保在创建内部暂存区时指定 SNOWFLAKE_SSE
加密类型。
错误 |
根据文档格式的不同,您可能会收到以下错误: { "__processingErrors": [ "File extension does not match actual mime type. Mime-Type: application/octet-stream" ] }
{ "__processingErrors": [ "cannot identify image file <_io.BytesIO object at 0x7f8a800ba020>" ] }
|
---|---|
原因 |
创建内部暂存区存储文档时未指定 |
解决方案 |
要创建 内部暂存区,请运行 CREATE STAGE 命令,如下例所示: CREATE STAGE doc_ai_stage
DIRECTORY = (ENABLE = TRUE)
ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE');
|
预签名 URL 已过期¶
暂存文档的预签名 URL 是 <model_build_name>!PREDICT 的必要实参。要获取预签名 URL,请调用 GET_PRESIGNED_URL 函数,该函数有默认的有效期。
有关更多信息,请参阅 GET_PRESIGNED_URL。
错误 |
{ "__processingErrors": [ "Received HTTP 403 response for presigned URL. URL may be expired." ] }
|
---|---|
原因 |
预签名 URL 已过期。 |
解决方案 |
要么减少一次查询的文档数量,要么延长有效期。有关延长有效期的更多信息,请参阅 GET_PRESIGNED_URL。 |
一次查询的文档过多¶
Document AI 对一次 提取查询 的文档数量进行了限制。有关更多信息,请参阅 Document AI 的已知限制。
错误 |
{ "__processingErrors": [ "Query limit reached: too many documents in a single query." ] }
|
---|---|
原因 |
您试图在一次查询中处理过多文档。 |
解决方案 |
使用多个查询来处理文档。 |
文档不符合特定要求¶
您使用 Document AI 处理的文档必须满足特定要求。有关更多信息,请参阅 为 Document AI 准备文档。
错误 |
您可能会收到以下错误之一: { "__processingErrors": [ "Page 0 size is larger than the limit. Actual: 1083 mm x 1384 mm. Maximum: 1200 mm x 1200 mm." ] }
{ "__processingErrors": [ "Document has too many pages. Actual: 150. Maximum: 125." ] }
{ "__processingErrors": [ "Image size is too small. Actual: 20x20 px. Minimum: 50x50 px." ] }
{ "__processingErrors": [ "Unsupported file format. Actual: csv. Supported: docx, eml, htm, html, jpeg, jpg, pdf, png, text, tif, tiff, txt." ] }
{ "__processingErrors": [ "File exceeds maximum size. Actual: 54096026 bytes. Maximum: 50000000 bytes." ] }
|
---|---|
原因 |
试图处理的文档不符合 Document AI 的要求。有关要求的详细信息,请参阅 为 Document AI 准备文档。 |
解决方案 |
准备好符合要求的文档。 |
Document AI 模型构建未发布¶
要使用 Document AI 提取信息,您需要发布 Document AI 模型构建。如果您训练了模型,并且在训练后没有添加新的数据值(提出新的问题),则无需发布模型构建。
错误 |
错误消息开头如下: Request failed for external function DOCUMENT_EXTRACT_FEATURES$V1 with remote service error: 422
|
---|---|
原因 |
Document AI 模型构建未发布。 |
解决方案 |
发布 Document AI 模型构建。有关更多信息,请参阅 发布 Document AI 模型构建。 |
未授予所需权限或模型构建名称重复¶
要创建 Document AI 模型构建,必须授予角色所需的权限,并选择一个唯一的模型构建名称。
有关所需权限的更多信息,请参阅 Document AI 访问控制。
错误 |
Unable to create a build on the specified database and schema. Please check the documentation to learn more.
|
---|---|
原因 |
可能的原因有:
|
解决方案 |
|