Document Processing Playground¶
Document Processing Playground 提供了一个用户界面,用于探索 AI_EXTRACT 和 AI_PARSE_DOCUMENT 函数。您可以从暂存区上传自己的文档,使用 AI_EXTRACT 提问来提取信息,并预览由 AI_PARSE_DOCUMENT 生成的布局和 OCR 结果。通过 Playground,您可以探索函数如何处理文档,并复制相应代码段以便进一步使用。
有关更多信息,请参阅 AI_EXTRACT 和 。
所需权限¶
用户必须使用已被授予 SNOWFLAKE.CORTEX_USER 数据库角色 的角色。有关授予此权限的信息,请参阅 Cortex LLM privileges。
开始使用 Document Processing Playground¶
要访问 Document Processing Playground,请执行以下操作:
登录 Snowsight。
在导航菜单中,选择 AI & ML » AI Studio。Document Processing Playground 显示在其他 Studio 函数中。
要打开 Document Processing Playground,请选择 Open。
上传文档¶
您最多可以上传 10 个文档。
从本地计算机上传文档¶
备注
要从本地计算机上传文档,您必须启用个人数据库。有关更多信息,请参阅 个人数据库。
文件大小上限为 50 MB。
选择 Select Warehouse,然后从下拉列表中选择仓库。
选择 Choose file。
拖放文件,或选择 Browse 以便从本地计算机中选择文件。
选择 Upload。
此时会出现 Playground。
从暂存区上传文档¶
备注
从暂存区上传文件时,系统会选择默认仓库。要变更仓库,或者如果您没有默认仓库,请使用 Select Warehouse 从下拉列表中选择仓库。
选择 Add from stage。
系统随即显示对话框。
选择包含文档的数据库、架构和暂存区。
选择要添加到 Playground 的文档文件。
选择 Open playground。
此时会出现 Playground。
Document Processing Playground 界面¶
Document Processing Playground 界面在右侧显示文档预览,在左侧显示提示区域,您可以在其中输入提示。
小技巧
要更改正在预览的文档,请选择文档名称,然后从列表中选择另一个文档。
Document Processing Playground 界面由以下选项卡组成:
Extraction:选择使用 时默认使用的角色和仓库。您可以通过提问从文档中提取信息的视图。
Markdown:选择使用 时默认使用的角色和仓库。通过该视图,您可以查看文档的 Markdown 表示形式。这是来自 AI_PARSE_DOCUMENT 的 LAYOUT 模式输出。
Text:选择使用 时默认使用的角色和仓库。通过该视图,您可以查看文档的文本表示形式。这是来自 AI_PARSE_DOCUMENT 的 OCR 模式输出。
通过提问提取信息¶
您可以提出问题以从文档中提取信息。
选择 Extraction 选项卡。
选择提取类型:
要提问,请选择 Ask。
要提取列表,请选择 List。
要提取表,请选择 Extract table。
创建键和问题对,例如:
键:
company问题:
What is the name of the company?
要确认,请选择 Add Prompt。
预览文档的 Markdown 和文本版本¶
Markdown 和 Text 选项卡显示 AI_PARSE_DOCUMENT 函数的结果。
要查看布局模式结果,请选择 Markdown 选项卡。
要查看 OCR 模式结果,请选择 Text 选项卡。
获取代码段以供进一步使用¶
Playground 创建的代码片段使用 AI_EXTRACT 和 AI_PARSE_DOCUMENT 函数来处理文档。
如果您从本地计算机上传文件,则可以预览和复制代码片段:
在界面的右上角,选择 Code Snippets。
选择代码段的语言:SQL 或 Python。
您现在可以复制代码片段。
如果您从暂存区上传文件,则可以直接在工作区中打开代码片段:
在界面的右上角,选择 Open in Workspaces。
将打开一个包含代码段的新工作区。
区域可用性¶
Document Processing Playground 已在以下区域推出:
云平台 |
云区域 |
|---|---|
Amazon Web Services (AWS) |
|
Microsoft Azure |
|
Google Cloud |
|
限制¶
AI_EXTRACT 和 AI_PARSE_DOCUMENT 函数的限制适用于 Document Processing Playground。有关更多信息,请参阅 AI_EXTRACT 和 。