使用 Web 界面加载数据¶
You can add data to tables through the Snowsight.
通过这些界面,您可以上传包含结构化数据(包括 CSV 或 TSV 格式)或半结构化数据(包括 JSON、Avro、ORC、Parquet 或 XML 格式)的文件。
您可以从以下位置上传数据:
本地计算机。
现有暂存区。
An existing cloud storage location on Snowflake, Amazon S3, Google Cloud Storage, or Microsoft Azure that is not yet added to Snowflake as an external stage (Classic Console only).
You can upload up to 250 files at a time. Each file can be up to 250 MB. To load larger files, or a large number of files, use the Snowflake CLI or SnowSQL client. For more information, see 从本地文件系统批量加载.
使用 Snowsight 加载数据¶
加载数据时,您可以 创建新表,也可以 将数据加载到现有表中。
对于 Snowsight 中的数据加载会话,Snowflake 在 显式事务 中运行所有 SQL 命令。无论您在 ACCOUNT 或 USER 级别为 AUTOCOMMIT 设置了什么值,都将提交这些命令。
使用 Snowsight 创建新表¶
加载数据时,通常可以同时为数据创建和自动配置新表。
Sign in to Snowsight.
在左下角,选择您的姓名 » Switch role,然后选择包含以下权限的角色:
对象
权限
备注
数据库
USAGE
架构
CREATE TABLE
暂存区
USAGE
表
OWNERSHIP
At the top of the navigation menu, select
(Create) » Table » From File.随即出现 Load Data into Table 对话框。
选择或创建要在其中创建表的数据库和架构。
使用以下方法之一选择包含数据的文件:
输入新表的名称,然后选择 Next。此时将显示表架构对话框。
Snowsight 检测文件的元数据架构,并返回由 INFER_SCHEMA 函数标识的文件格式和列定义。
查看推断的文件格式、数据类型、列名称和列数据示例。确保所有信息准确无误,并在需要时进行更新。
选择 Load。
Snowsight 加载文件并为该文件创建新表。
使用 Snowsight 将数据加载到现有表中¶
Sign in to Snowsight.
打开 用户菜单,选择至少包含以下权限的账户角色:
对象
权限
备注
数据库
USAGE
架构
USAGE
暂存区
USAGE
从暂存区加载文件时需要。
文件格式
USAGE
使用 命名文件格式 时需要。
表
INSERT
In the navigation menu, select Ingestion » Add Data.
选择 Load data into a Table。此时将出现“Load Data into Table”对话框。
使用以下方法之一选择包含数据的文件:
选择要将数据加载到其中的数据库、架构和表。
选择 Next。“Edit Schema”页面出现在“Load Data into Table”的对话框中。
根据需要进行最终自定义:
从当前数据库中选择 文件格式。
选择要自定义的文件类型,然后选择数据文件的相关设置。
备注
要将 Parquet 数据加载到 Snowflake 管理的 Iceberg 表中,请取消选择 Load as a single variant column?。Snowflake 会将 Parquet 数据直接加载到 Iceberg 表列中。使用 Snowsight 加载 Parquet 文件时,仅支持默认的 LOAD_MODE = FULL_INGEST。有关更多信息,请参阅 COPY INTO <table>。
(可选)选择 格式类型选项 的 :ui:`View options`(示例:指定日期和时间格式或替换无效字符)。
(可选)选择在加载过程中发生错误时应采取的措施。默认情况下,不会从文件加载任何数据。
选择 Table loading methods 的以下选项之一。默认选项为 Append。
Append:在数据加载期间,新数据将附加到现有表中。
Replace:新数据将取代表中的现有数据。
选择其中一个 Match by column names 选项,以自动匹配源文件和目标表。默认选项为 case insensitive。
选择表架构对话框右侧的 Edit Schema 选项卡。如果源文件和目标表之间存在差异,请根据需要进行调整。
从下拉列表中选择正确的列名,使源文件与目标表匹配。例如,在以下屏幕截图中,源文件具有名为
building的列,目标表具有名为BUILDING_ID的列。
可选:选择 Table Preview 选项卡,以预览传入源文件的数据在目标表中的显示方式。
选择 Load。
Snowsight loads your file and displays the number of rows successfully inserted into the table.
选择角色¶
Select a role that has the appropriate privileges. (In the lower-left corner, select your name » Switch role » ACCOUNTADMIN.)
要加载数据,角色必须具有数据库和架构的 USAGE 权限,且数据库和架构包含将数据加载到其中的表。
要在加载数据时创建暂存区,角色必须具有数据库架构的 CREATE STAGE 权限。
要在加载数据时创建文件格式,角色必须具有数据库架构的 CREATE FILE FORMAT 权限。
选择要在其中加载数据的表¶
选择要加载的数据¶
根据您选择从中加载数据的位置,请执行相关步骤。如果要从多个位置加载数据,请多次使用 Load Data 向导。
要从计算机加载数据,请执行以下操作:
选择 Load files from your computer 选项,然后选择 Select Files,浏览要加载的文件。
选择一个或多个本地数据文件,然后选择 Open。
选择 Next。
要从现有暂存区加载数据,请执行以下操作:
选择 Load files from external stage 选项。
从 Stage 下拉列表中选择现有的暂存区。
(可选)指定暂存区中文件的路径。
选择 Next。
要创建暂存区,例如从外部云存储加载数据,请执行以下操作:
选择 Load files from external stage 选项。
选择 Stage 下拉列表旁边的 +。
选择文件所在的受支持的云存储服务。
选择 Next。
填写描述暂存区的字段。有关更多信息,请参阅 CREATE STAGE。
选择 Finish。
系统会自动从 Stage 下拉列表中选择新的暂存区。
(可选)指定暂存区中文件的路径。
选择 Next。
完成加载数据¶
选择要加载的文件后,完成将数据加载到表中的操作。
备注
如果在完成加载数据时仓库未运行,则必须等待仓库恢复(不超过 5 分钟)后才能加载数据。
要完成加载数据的操作,请执行以下步骤:
从下拉列表中选择现有的命名文件格式,或者创建一个文件格式。
要创建文件格式,请执行以下步骤:
选择下拉列表旁边的 +。
填写字段以匹配数据文件的格式。有关选项的说明,请参阅 CREATE FILE FORMAT。
选择 Finish。
系统会自动从下拉列表中选择新的命名文件格式。
确定如何处理加载数据时发生的错误:
如果希望在发生错误时停止数据加载,请选择 Load。
如果希望以不同的方式处理错误,请执行以下步骤:
选择 Next。
选择描述如何处理错误的选项。有关选项的详细信息,请参阅 COPY INTO <table> 的
ON_ERROR部分。选择 Load。
Snowflake 使用您选择的仓库将数据加载到您选择的表中。
选择 OK 即可关闭 Load Data 向导。
