Document AI 停用(待定)

Snowflake 即将弃用并最终停用 Document AI UI 体验和 <model_build_name>!PREDICT 方法,转而采用基于 arctic-extract 模型驱动的下一代文档提取解决方案 AI_EXTRACT 函数进行文档提取。此模型具备更强的可扩展性与准确性,提供更快的推理速度,并增强了多项功能,包括更长的输出令牌限制,以及通过单次 API 调用即可提取实体、列表和表的能力。

重要

Document AI UI 和 <model_build_name>!PREDICT 方法将于 2026 年 2 月 28 日 停用。停用后,您将无法再访问以下目录中的现有模型构建: |document-ai|UI。在停用日期之后,您将无法访问 |document-ai| UI 和 <model_build_name>!PREDICT 方法,并且未迁移到 Snowflake Model Registry 的现有 Document AI 模型在停用日期之后将无法用于推理。

要继续对现有 Document AI 模型运行推理,请按照 需要采取的操作 中的步骤进行操作。

行为变更

变更前

从文档中提取数据的工作流程如下:

  1. 创建模型构建。

    您可以在专用的 Document AI UI 中创建模型构建,您还可以在其中上传文档、定义提取值,并验证模型所提供的答案。

  2. 可选:微调模型。

    如果 Snowflake Arctic-TILT 模型提供的结果不尽如人意,您可以在 Document AI UI 中对模型进行微调。

  3. 运行推理。

    您可以使用 <model_build_name>!PREDICT 方法和在 Document AI UI 中创建的模型构建从文档中提取信息。

备注

您可以查看 Document AI UI 中的 Document AI 模型以及 Snowflake Model Registry。

变更后

从文档中提取数据的工作流程如下:

  • 您可以使用 AI_EXTRACT 函数来定义提取值并从文档中提取信息。您不再在 Document AI UI 中创建模型构建。

以前,您必须完成涉及创建模型构建的三步工作流程,但现在此过程已简化为一个步骤,即使用 AI_EXTRACT 函数。

备注

如果您已将模型迁移至 Snowflake Model Registry(请参阅 需要采取的操作),则此前创建和/或在 Document AI UI 进行微调的模型均可在其中查看。

您可以使用微调后的模型进行推理,但不能对新版本的模型进行微调。

重要

AI_EXTRACT 使用基于令牌的计费。有关更多信息,请参阅 Snowflake 服务消耗表

需要采取的操作

要继续对您在 Document AI 中创建的现有模型运行推理,您必须在 2026 年 2 月 28 日 之前完成以下步骤:

  1. 将现有的 Document AI 模型(已发布和已训练)迁移到 Snowflake Model Registry。Document AI UI 显示提示时,要将现有模型集成到模型注册表中,请按照集成横幅上的说明进行操作。

    有关如何在同一账户的数据库或架构之间或同一组织的不同账户之间复制 Document AI 模型的信息,请参阅 Copy Document AI models between databases, schemas, and accounts

  2. 更新提取管道,使用 AI_EXTRACT 函数来对 Document AI 旧版模型进行推理。

    这确保了生产环境中推理过程的持续性。有关通过旧版本 Document AI 模型使用 AI_EXTRACT 的更多信息,请参阅 AI_EXTRACT(Document AI 旧模型)

  3. 推荐:要继续使用 Document AI 数据,请将所有现有的 Document AI 模型构建(包含文档、提示和注释)导出到目标内部暂存区。

    有关如何导出模型构建的信息,请参阅 导出 Document AI 模型构建

参考:2156

语言: 中文