2025 年 8 月 21 日:AI 解析文档布局模式(正式发布

Snowflake Cortex AI_PARSE_DOCUMENT 文档现已正式发布,具有高级布局提取功能。这项完全托管的 SQL 函数以 Markdown 格式提取页面布局,以企业级精度和规模保留文档中的文本、表和结构元素。

备注

AI_PARSE_DOCUMENT 函数是 SNOWFLAKE.CORTEX.PARSE_DOCUMENT 的新版本。仍支持旧函数,但 Snowflake 建议使用新函数。

AI_PARSE_DOCUMENT 的关键功能包括:

  • 复杂的布局技巧: 精确处理多栏研究论文、财务报告和技术文档,同时保持阅读顺序和文档层次结构。

  • 精确的表提取: 维护财务报表、监管文件和数据密集型文档中的表结构、标头和关系,以便进行下游分析

  • 高级布局保留 在不丢失上下文或含义的情况下处理混合内容,包括嵌入式图像、引言块和复杂格式

有关更多信息,请参阅 AISQL AI_PARSE_DOCUMENT

语言: 中文