<model_build_name>!PREDICT

在暂存区中从文件中提取信息,并在 JSON 对象中提供答案。如果指定的是单个文档,该方法将返回该文档的结果。否则,该方法将返回暂存区中每个文档的结果。

语法

<model_build_name>!PREDICT(<presigned_url>,
                           [ <model_build_version> ]
                          )
Copy

实参

必填:

presigned_url

暂存文档的预签名 URL。

要获取预签名 URL 以作为实参传入,请调用 GET_PRESIGNED_URL 函数。请参阅 GET_PRESIGNED_URL

有关更多信息,请参阅 示例

可选:

model_build_version

Document AI 模型构建的版本。

如果未指定,则默认使用最新的可用模型构建版本。

返回

返回具有以下字段的 JSON 对象:

ocrScore

指定光学字符识别 (OCR) 过程的置信度分数。

score

指定特定值的置信度分数。

value

指定问题的提取答案。

{
  "__documentMetadata": {
    "ocrScore": 0.918
  },
  "invoice_number": [
    {
      "score": 0.925,
      "value": "123/20"
    }
  ],
  "invoice_items": [
    {
      "score": 0.839,
      "value": "NEW CRUSHED VELVET DIVAN BED"
    },
    {
      "score": 0.839,
      "value": "Vintage Radiator"
    },
    {
      "score": 0.839,
      "value": "Solid Wooden Worktop"
    },
    {
      "score": 0.839,
      "value": "Sienna Crushed Velvet Curtains"
    }
  ],
  "tax_amount": [
    {
      "score": 0.879,
      "value": "77.57"
    }
  ],
  "total_amount": [
    {
      "score": 0.809,
      "value": "465.43 GBP"
    }
  ],
  "buyer_name": [
    {
      "score": 0.925
    }
  ]
  "vendor_name": [
    {
      "score": 0.9,
      "value": "UK Exports & Imports Ltd"
    }
  ]
}
Copy

访问控制要求

要使用 Document AI 提取信息,则必须使用被授予 SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR 数据库角色的账户角色。有关更多信息,请参阅 Document AI 访问控制

使用说明

  • 请确保满足使用此方法的先决条件。有关更多信息,请参阅 先决条件

  • 此预览版对一次查询中处理的文档数量有限制。有关更多信息,请参阅 Document AI 的已知限制

  • 所有文档必须位于暂存区的同一目录中。

  • Document AI 使用目录表。有关更多信息,请参阅 查询目录表

  • 如果 Document AI 模型在文档中找不到答案,模型不会返回 value 键。但是,它确实会返回 score 键,这表示模型对文档不包含答案的置信度。请参阅 buyer_name 字段作为示例。

  • Document AI 模型可以返回列表。请参阅 invoice_items 字段作为示例。

示例

下面的示例从 pdf_inspections_stage 暂存区上的所有文档中提取了 inspections 模型构建版本 1 的信息:

SELECT inspections!PREDICT(
  GET_PRESIGNED_URL(@pdf_inspections_stage, RELATIVE_PATH), 1)
  FROM DIRECTORY(@pdf_inspections_stage);
Copy

下面的示例从 pdf_paystubs_stage 暂存区上的 'paystubs/paystub01.pdf' 文档中提取了 paystubs 模型构建版本 1 的信息:

SELECT paystubs!PREDICT(
  GET_PRESIGNED_URL(@pdf_paystubs_stage, 'paystubs/paystub01.pdf'), 1);
Copy
语言: 中文