2025 年 3 月 6 日 - OCR 的 Cortex AI PARSE_DOCUMENT 函数 - 正式发布¶
Snowflake 很高兴地宣布 Snowflake Cortex AI PARSE_DOCUMENT 的 OCR 模式现已正式发布,使客户能够从数百万个文档页面中准确提取文本和数据。完全托管的 SQL 函数提供与其他云提供商相当的 OCR 质量,并结合了 Snowflake 的可扩展性、性能和易用性。PARSE_DOCUMENT OCR 使用 SQL 从存储在 Snowflake 或外部暂存区的 PDF、DOCX 和 PPTX 文件中提取文本内容,无需复杂的云架构。
Cortex AI PARSE_DOCUMENT OCR 模式支持:
从数字文档和扫描文档中提取文本。
高质量提取英语、德语、法语、意大利语、挪威语、波兰语、葡萄牙语、西班牙语和瑞典语文档。
与为 Cortex Search 提供支持的 RAG 管道无缝集成,以及用于生成文档摘要、翻译和实体提取的 Cortex AI Functions。
自动页面方向检测。
有关详细信息,请参阅 Cortex PARSE_DOCUMENT。