2024 年 5 月 16 日 – 向量数据类型和向量相似性函数 – 正式发布

在此版本中,我们很高兴地宣布 VECTOR 数据类型、向量相似性函数和向量嵌入函数已正式发布。这些功能支持需要语义向量搜索和检索的重要应用程序。

有关更多信息,请参阅 向量嵌入

新的 SQL 数据类型

以下数据类型现已随此版本正式发布:

类别

新数据类型

描述

向量

VECTOR

通过 VECTOR 数据类型,Snowflake 可以高效地编码和处理向量。此数据类型支持语义向量搜索和检索应用程序,如基于 RAG 的应用程序,以及向量处理应用程序中对向量的常见操作。

新 SQL 函数

此版本现已正式发布以下函数:

函数类别

新函数

描述

向量相似性函数

VECTOR_INNER_PRODUCT

返回两个向量的内积。内积(也称为点积或标量积)乘以两个向量

向量相似性函数

VECTOR_L2_DISTANCE

测量两个向量之间的 L2 距离。

向量相似性函数

VECTOR_COSINE_SIMILARITY

测量两个向量之间的余弦相似性,即多维空间中向量之间的角距离。

LLM 函数

EMBED_TEXT_768 (SNOWFLAKE.CORTEX)

为给定的英语文本字符串创建向量嵌入。

语言: 中文