类别:

表函数

ICEBERG_TABLE_FILES

返回有关在指定时间点注册到外部管理的 Apache Iceberg™ 表的数据文件的信息。

另请参阅:

Apache Iceberg™ 表Apache Iceberg™ 表的元数据与保留ALTER ICEBERG TABLE ... REFRESH

语法

ICEBERG_TABLE_FILES(
  TABLE_NAME => '<table_name>'
  [, AT => '<timestamp_ltz>']
)
Copy

实参

必填

TABLE_NAME => 'table_name'

要检索数据文件信息的 外部管理的 Iceberg 表 的名称。

可选

AT => 'timestamp_ltz'

指定用于检索文件信息的确切日期和时间。该值必须显式转换为 TIMESTAMP_LTZ 数据类型。有关信息,请参阅 日期和时间数据类型

如果未指定,该函数将返回有关当前 快照 的表文件的信息。

输出

该函数返回以下列:

列名称

数据类型

描述

REGISTERED_ON

TIMESTAMP_LTZ

注册 Parquet 文件的时间戳。

FILE_NAME

TEXT

注册文件的完整路径。

FILE_SIZE

NUMBER

文件大小(以字节为单位)。

ROW_COUNT

NUMBER

文件中的行数。

ROW_COUNT_GROUP

NUMBER

文件中的行组数。

MD5

不适用

此字段返回占位符值,不应使用。此字段可能会在未来版本中弃用。

ETAG

不适用

此字段返回占位符值,不应使用。此字段可能会在未来版本中弃用。

LAST_MODIFIED_ON

不适用

此字段返回占位符值,不应使用。此字段可能会在未来版本中弃用。

备注

ETAG、MD5 和 LAST_MODIFIED_ON 字段返回占位符值,不应使用。这些字段可能会在未来版本中弃用。

示例

检索有关注册到名为 my_iceberg_table 的外部管理的 Iceberg 表的 当前快照 的 Parquet 数据文件的信息:

SELECT *
  FROM TABLE(
    INFORMATION_SCHEMA.ICEBERG_TABLE_FILES(
      TABLE_NAME => 'my_iceberg_table'
    )
  );
Copy

输出:

+-------------------------------------------------------+--------------------------------+------------+--------------------------------+------------+------------------+-----------------------------------+-----------------------------------+
| FILE_NAME                                             | REGISTERED_ON                  | FILE_SIZE  | LAST_MODIFIED_ON               | ROW_COUNT  | ROW_GROUP_COUNT  | ETAG                              | MD5                               |
| data/87/snow_D9zlAoeipII_AODxT1uXDxg_0_1_003.parquet  | 1969-12-31 16:00:00.000 -0800  | 27136      | 1969-12-31 16:00:00.000 -0800  | 30000      | 1                | NULL                              | NULL                              |
| data/08/snow_D9zlAoeipII_AODxT1uXDxg_0_1_006.parquet  | 1969-12-31 16:00:00.000 -0800  | 45568      | 1969-12-31 16:00:00.000 -0800  | 45000      | 1                | NULL                              | NULL                              |
| data/94/snow_D9zlAoeipII_AODxT1uXDxg_0_1_008.parquet  | 1969-12-31 16:00:00.000 -0800  | 45056      | 1969-12-31 16:00:00.000 -0800  | 45000      | 1                | NULL                              | NULL                              |
| data/24/snow_D9zlAoeipII_AODxT1uXDxg_0_1_004.parquet  | 1969-12-31 16:00:00.000 -0800  | 27136      | 1969-12-31 16:00:00.000 -0800  | 30000      | 1                | NULL                              | NULL                              |
+-------------------------------------------------------+--------------------------------+------------+--------------------------------+------------+------------------+-----------------------------------+-----------------------------------+

在指定的时间和日期检索有关名为 my_iceberg_table 的表的 Parquet 数据文件的信息:

SELECT file_name, file_size, row_count, row_group_count, etag, md5
  FROM TABLE(
    INFORMATION_SCHEMA.ICEBERG_TABLE_FILES(
      TABLE_NAME => 'my_iceberg_table',
      AT => CAST('2024-12-09 11:02:00' AS TIMESTAMP_LTZ)
    )
  );
Copy

输出:

+------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------+
| FILE_NAME                                            | FILE_SIZE | ROW_COUNT | ROW_GROUP_COUNT | ETAG                             | MD5                              |
|------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------|
| data/87/snow_D9zlAoeipII_AODxT1uXDxg_0_1_003.parquet | 27136     | 30000     | 1               | NULL                             | NULL                             |
| data/08/snow_D9zlAoeipII_AODxT1uXDxg_0_1_006.parquet | 45568     | 45000     | 1               | NULL                             | NULL                             |
| data/94/snow_D9zlAoeipII_AODxT1uXDxg_0_1_008.parquet | 45056     | 45000     | 1               | NULL                             | NULL                             |
| data/24/snow_D9zlAoeipII_AODxT1uXDxg_0_1_004.parquet | 27136     | 30000     | 1               | NULL                             | NULL                             |
+------------------------------------------------------+-----------+-----------+-----------------+----------------------------------+----------------------------------+
4 Row(s) produced. Time Elapsed: 1.502s
语言: 中文