准备卸载数据

本主题概述了卸载数据所支持的数据文件格式。

本主题内容:

支持的文件格式

支持以下文件格式:

结构化/半结构化

类型

备注

结构化

分隔符(CSV、TSV 等)

支持任何有效的单字节分隔符;默认值为逗号(即 CSV)。

半结构化

JSON、Parquet

文件格式选项指定文件中包含的数据类型,以及有关数据格式的其他相关特征。根据卸载的数据类型不同,可以指定的文件格式选项也不同。Snowflake 提供了一整套文件格式选项默认值。

半结构化数据

卸载到 JSON 文件时,Snowflake 输出为 NDJSON (https://github.com/ndjson/ndjson-spec) (换行符分隔 JSON)标准格式。

指定文件格式选项

可以在以下任何位置指定单个文件格式选项:

  • 在表的定义中。

  • 在命名暂存区的定义中。有关更多信息,请参阅 CREATE STAGE

  • 卸载数据时直接在 COPY INTO <location> 命令中指定。

此外,为了简化数据卸载,Snowflake 支持创建命名文件格式,这些文件格式是封装所有必需格式信息的数据库对象。然后,可以在可以指定单个文件格式选项的所有相同位置使用命名文件格式作为输入,从而有助于简化类似格式数据的数据卸载过程。

命名文件格式是可选的,但在计划定期卸载类似格式的数据时,建议 使用命名文件格式。

创建命名文件格式

您可以使用 Web 界面或 SQL 创建文件格式:

Classic Console:

点击 Databases Databases 选项卡 » <db_name> » File Formats

SQL:

CREATE FILE FORMAT

有关所有文件格式选项的详细说明,请参阅 CREATE FILE FORMAT

示例

以下示例使用指定的字段分隔符创建命名 CSV 文件格式:

CREATE OR REPLACE FILE FORMAT my_csv_unload_format
  TYPE = 'CSV'
  FIELD_DELIMITER = '|';
Copy

以下示例创建命名 JSON 文件格式:

CREATE OR REPLACE FILE FORMAT my_json_unload_format
  TYPE = 'JSON';
Copy
语言: 中文