- 类别:
ICEBERG_TABLE_FILES¶
返回有关在指定时间点注册到外部管理的 Apache Iceberg™ 表的数据文件的信息。
语法¶
ICEBERG_TABLE_FILES(
TABLE_NAME => '<table_name>'
[, AT => '<timestamp_ltz>']
)
实参¶
必填
TABLE_NAME => 'table_name'要检索数据文件信息的 外部管理的 Iceberg 表 的名称。
可选
输出¶
该函数返回以下列:
列名称 |
数据类型 |
描述 |
|---|---|---|
REGISTERED_ON |
TIMESTAMP_LTZ |
注册 Parquet 文件的时间戳。 |
FILE_NAME |
TEXT |
注册文件的完整路径。 |
FILE_SIZE |
NUMBER |
文件大小(以字节为单位)。 |
ROW_COUNT |
NUMBER |
文件中的行数。 |
ROW_COUNT_GROUP |
NUMBER |
文件中的行组数。 |
MD5 |
不适用 |
此字段返回占位符值,不应使用。此字段可能会在未来版本中弃用。 |
ETAG |
不适用 |
此字段返回占位符值,不应使用。此字段可能会在未来版本中弃用。 |
LAST_MODIFIED_ON |
不适用 |
此字段返回占位符值,不应使用。此字段可能会在未来版本中弃用。 |
备注
ETAG、MD5 和 LAST_MODIFIED_ON 字段返回占位符值,不应使用。这些字段可能会在未来版本中弃用。
示例¶
检索有关注册到名为 my_iceberg_table 的外部管理的 Iceberg 表的 当前快照 的 Parquet 数据文件的信息:
SELECT *
FROM TABLE(
INFORMATION_SCHEMA.ICEBERG_TABLE_FILES(
TABLE_NAME => 'my_iceberg_table'
)
);
输出:
+-------------------------------------------------------+--------------------------------+------------+--------------------------------+------------+------------------+-----------------------------------+-----------------------------------+
| FILE_NAME | REGISTERED_ON | FILE_SIZE | LAST_MODIFIED_ON | ROW_COUNT | ROW_GROUP_COUNT | ETAG | MD5 |
| data/87/snow_D9zlAoeipII_AODxT1uXDxg_0_1_003.parquet | 1969-12-31 16:00:00.000 -0800 | 27136 | 1969-12-31 16:00:00.000 -0800 | 30000 | 1 | NULL | NULL |
| data/08/snow_D9zlAoeipII_AODxT1uXDxg_0_1_006.parquet | 1969-12-31 16:00:00.000 -0800 | 45568 | 1969-12-31 16:00:00.000 -0800 | 45000 | 1 | NULL | NULL |
| data/94/snow_D9zlAoeipII_AODxT1uXDxg_0_1_008.parquet | 1969-12-31 16:00:00.000 -0800 | 45056 | 1969-12-31 16:00:00.000 -0800 | 45000 | 1 | NULL | NULL |
| data/24/snow_D9zlAoeipII_AODxT1uXDxg_0_1_004.parquet | 1969-12-31 16:00:00.000 -0800 | 27136 | 1969-12-31 16:00:00.000 -0800 | 30000 | 1 | NULL | NULL |
+-------------------------------------------------------+--------------------------------+------------+--------------------------------+------------+------------------+-----------------------------------+-----------------------------------+
在指定的时间和日期检索有关名为 my_iceberg_table 的表的 Parquet 数据文件的信息:
SELECT file_name, file_size, row_count, row_group_count, etag, md5
FROM TABLE(
INFORMATION_SCHEMA.ICEBERG_TABLE_FILES(
TABLE_NAME => 'my_iceberg_table',
AT => CAST('2024-12-09 11:02:00' AS TIMESTAMP_LTZ)
)
);
输出:
+------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------+
| FILE_NAME | FILE_SIZE | ROW_COUNT | ROW_GROUP_COUNT | ETAG | MD5 |
|------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------|
| data/87/snow_D9zlAoeipII_AODxT1uXDxg_0_1_003.parquet | 27136 | 30000 | 1 | NULL | NULL |
| data/08/snow_D9zlAoeipII_AODxT1uXDxg_0_1_006.parquet | 45568 | 45000 | 1 | NULL | NULL |
| data/94/snow_D9zlAoeipII_AODxT1uXDxg_0_1_008.parquet | 45056 | 45000 | 1 | NULL | NULL |
| data/24/snow_D9zlAoeipII_AODxT1uXDxg_0_1_004.parquet | 27136 | 30000 | 1 | NULL | NULL |
+------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------+
4 Row(s) produced. Time Elapsed: 1.502s