使用数据分析来了解数据¶
数据分析通过自动收集数据类型、值分布、NULL 值数量及唯一性等统计信息,帮助您了解数据集的结构、内容与质量。数据配置文件揭示了模式、异常和潜在的质量问题,使您可以评估数据可靠性,并就如何清理、转换或有效使用数据做出明智的决策。数据分析无需手动设置即可提供见解,从而简化了持续数据质量监控的路径。
数据配置文件包括以下统计信息:
表中的行数。
上次更新表的时间。
一列中存在多少个 NULL 值。
列中的最小值和最大值。
列中最常见的值。
开始使用¶
要查看表或视图的数据配置文件,请完成以下步骤:
Sign in to Snowsight.
In the navigation menu, select Catalog » Database Explorer, and then select the table or view.
选择 Data Quality 选项卡。
选择 Data Profile。
仓库注意事项¶
数据分析在后台运行 SQL 查询以显示有关表或视图的信息。Snowflake 建议使用 X-Small 仓库来运行这些查询;但是,使用更大的仓库可能会提高较重工作负载的性能。一般来说,仓库越大,消耗的 Credit 就越多。
默认情况下,数据分析使用为当前用户默认设置的仓库。要选择其他仓库,请使用页面顶部的下拉列表。