<model_build_name>!PREDICT¶
在暂存区中从文件中提取信息,并在 JSON 对象中提供答案。如果指定的是单个文档,该方法将返回该文档的结果。否则,该方法将返回暂存区中每个文档的结果。
语法¶
<model_build_name>!PREDICT(<presigned_url>,
[ <model_build_version> ]
)
实参¶
必填:
presigned_url
暂存文档的预签名 URL。
要获取预签名 URL 以作为实参传入,请调用 GET_PRESIGNED_URL 函数。请参阅 GET_PRESIGNED_URL。
有关更多信息,请参阅 示例。
可选:
model_build_version
Document AI 模型构建的版本。
如果未指定,则默认使用最新的可用模型构建版本。
返回¶
返回具有以下字段的 JSON 对象:
ocrScore
指定光学字符识别 (OCR) 过程的置信度分数。
score
指定特定值的置信度分数。
value
指定问题的提取答案。
{
"__documentMetadata": {
"ocrScore": 0.918
},
"invoice_number": [
{
"score": 0.925,
"value": "123/20"
}
],
"invoice_items": [
{
"score": 0.839,
"value": "NEW CRUSHED VELVET DIVAN BED"
},
{
"score": 0.839,
"value": "Vintage Radiator"
},
{
"score": 0.839,
"value": "Solid Wooden Worktop"
},
{
"score": 0.839,
"value": "Sienna Crushed Velvet Curtains"
}
],
"tax_amount": [
{
"score": 0.879,
"value": "77.57"
}
],
"total_amount": [
{
"score": 0.809,
"value": "465.43 GBP"
}
],
"buyer_name": [
{
"score": 0.925
}
]
"vendor_name": [
{
"score": 0.9,
"value": "UK Exports & Imports Ltd"
}
]
}
访问控制要求¶
要使用 Document AI 提取信息,则必须使用被授予 SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR 数据库角色的账户角色。有关更多信息,请参阅 Document AI 访问控制。
使用说明¶
请确保满足使用此方法的先决条件。有关更多信息,请参阅 先决条件。
此预览版对一次查询中处理的文档数量有限制。有关更多信息,请参阅 Document AI 的已知限制。
所有文档必须位于暂存区的同一目录中。
Document AI 使用目录表。有关更多信息,请参阅 查询目录表。
如果 Document AI 模型在文档中找不到答案,模型不会返回
value
键。但是,它确实会返回score
键,这表示模型对文档不包含答案的置信度。请参阅buyer_name
字段作为示例。Document AI 模型可以返回列表。请参阅
invoice_items
字段作为示例。
示例¶
下面的示例从 pdf_inspections_stage
暂存区上的所有文档中提取了 inspections
模型构建版本 1
的信息:
SELECT inspections!PREDICT(
GET_PRESIGNED_URL(@pdf_inspections_stage, RELATIVE_PATH), 1)
FROM DIRECTORY(@pdf_inspections_stage);
下面的示例从 pdf_paystubs_stage
暂存区上的 'paystubs/paystub01.pdf'
文档中提取了 paystubs
模型构建版本 1
的信息:
SELECT paystubs!PREDICT(
GET_PRESIGNED_URL(@pdf_paystubs_stage, 'paystubs/paystub01.pdf'), 1);