Document Processing Playground

Document Processing Playground 提供了一个用户界面,用于探索 AI_EXTRACT 和 AI_PARSE_DOCUMENT 函数。您可以从暂存区上传自己的文档,使用 AI_EXTRACT 提问来提取信息,并预览由 AI_PARSE_DOCUMENT 生成的布局和 OCR 结果。通过 Playground,您可以探索函数如何处理文档,并复制相应代码段以便进一步使用。

有关更多信息,请参阅 AI_EXTRACT 和 。

所需权限

用户必须使用已被授予 SNOWFLAKE.CORTEX_USER 数据库角色 的角色。有关授予此权限的信息,请参阅 Cortex LLM privileges

开始使用 Document Processing Playground

要访问 Document Processing Playground,请执行以下操作:

  1. 登录 Snowsight

  2. 在导航菜单中,选择 AI & ML » AI Studio。Document Processing Playground 显示在其他 Studio 函数中。

  3. 要打开 Document Processing Playground,请选择 Open

上传文档

您最多可以上传 10 个文档。

从本地计算机上传文档

备注

  • 要从本地计算机上传文档,您必须启用个人数据库。有关更多信息,请参阅 个人数据库

  • 文件大小上限为 50 MB。

  1. 选择 Select Warehouse,然后从下拉列表中选择仓库。

  2. 选择 Choose file

  3. 拖放文件,或选择 Browse 以便从本地计算机中选择文件。

  4. 选择 Upload

    此时会出现 Playground。

从暂存区上传文档

备注

从暂存区上传文件时,系统会选择默认仓库。要变更仓库,或者如果您没有默认仓库,请使用 Select Warehouse 从下拉列表中选择仓库。

  1. 选择 Add from stage

    系统随即显示对话框。

  2. 选择包含文档的数据库、架构和暂存区。

  3. 选择要添加到 Playground 的文档文件。

  4. 选择 Open playground

    此时会出现 Playground。

Document Processing Playground 界面

Document Processing Playground 界面在右侧显示文档预览,在左侧显示提示区域,您可以在其中输入提示。

小技巧

要更改正在预览的文档,请选择文档名称,然后从列表中选择另一个文档。

Document Processing Playground 界面由以下选项卡组成:

  • Extraction:选择使用 时默认使用的角色和仓库。您可以通过提问从文档中提取信息的视图。

  • Markdown:选择使用 时默认使用的角色和仓库。通过该视图,您可以查看文档的 Markdown 表示形式。这是来自 AI_PARSE_DOCUMENT 的 LAYOUT 模式输出。

  • Text:选择使用 时默认使用的角色和仓库。通过该视图,您可以查看文档的文本表示形式。这是来自 AI_PARSE_DOCUMENT 的 OCR 模式输出。

通过提问提取信息

您可以提出问题以从文档中提取信息。

  1. 选择 Extraction 选项卡。

  2. 选择提取类型:

    • 要提问,请选择 Ask

    • 要提取列表,请选择 List

    • 要提取表,请选择 Extract table

  3. 创建键和问题对,例如:

    • 键:company

    • 问题:What is the name of the company?

  4. 要确认,请选择 Add Prompt

预览文档的 Markdown 和文本版本

MarkdownText 选项卡显示 AI_PARSE_DOCUMENT 函数的结果。

  • 要查看布局模式结果,请选择 Markdown 选项卡。

  • 要查看 OCR 模式结果,请选择 Text 选项卡。

获取代码段以供进一步使用

Playground 创建的代码片段使用 AI_EXTRACT 和 AI_PARSE_DOCUMENT 函数来处理文档。

如果您从本地计算机上传文件,则可以预览和复制代码片段:

  1. 在界面的右上角,选择 Code Snippets

  2. 选择代码段的语言:SQL 或 Python。

    您现在可以复制代码片段。

如果您从暂存区上传文件,则可以直接在工作区中打开代码片段:

  • 在界面的右上角,选择 Open in Workspaces

    将打开一个包含代码段的新工作区。

区域可用性

Document Processing Playground 已在以下区域推出:

云平台

云区域

Amazon Web Services (AWS)

  • US 东部(弗吉尼亚北部)

  • US 东部(俄亥俄州)

  • US 西部(俄勒冈州)

  • 加拿大(中部)

  • 南美(圣保罗)

  • 欧洲(伦敦)

  • EU(斯德哥尔摩)

  • EU(爱尔兰)

  • EU(法兰克福)

  • 亚太地区(孟买)

  • 亚太地区(东京)

  • 亚太地区(首尔)

  • 亚太地区(悉尼)

  • 亚太地区(雅加达)

Microsoft Azure

  • US 东部 2(弗吉尼亚州)

  • US 西部 2(华盛顿)

  • US 中南部(得克萨斯州)

  • 加拿大中部(多伦多)

  • UK 南部(伦敦)

  • 欧洲北部(爱尔兰)

  • 欧洲西部(荷兰)

  • 东南亚(新加坡)

  • UAE 北部(迪拜)

  • 澳大利亚东部(新南威尔士州)

  • 印度中部(浦那)

  • 日本东部(东京)

Google Cloud

  • US 东部 4(弗吉尼亚州北部)

  • US 中部 1(爱荷华州)

  • 欧洲西部 2(伦敦)

  • 欧洲西部 3(法兰克福)

  • 欧洲西部 4(荷兰)

限制

AI_EXTRACT 和 AI_PARSE_DOCUMENT 函数的限制适用于 Document Processing Playground。有关更多信息,请参阅 AI_EXTRACT 和 。