安装 Snowpark Submit¶
您可以直接在 Snowflake 的基础设施上安装 Snowpark Submit,以运行面向批处理的 Spark 工作负载。
要安装 Snowpark Submit,请完成以下步骤:
使用
pip
安装 Snowpark Submit。pip install snowpark-submit
在用于 Snowflake 身份验证的 connections.toml 文件中,添加一个名为
snowpark-submit
的连接。如果您还没有这样的文件,请按 使用 connections.toml 文件进行连接 中所述创建一个。
[snowpark-submit] host = "<account>.snowflakecomputing.cn" port = 443 account = "<account>" user = "test_user" role = "test_role" password = "<password for user>" protocol = "https" warehouse = "test_warehouse" database = "test_db" schema = "test_schema" compute_pool = "test_compute_pool"
确认您可以从客户端计算机连接到 Snowflake。
要验证您的客户端计算机上的连接是否正常,请使用连接到 Snowflake 的代码创建一个
.py
文件。创建一个
connection_test.py
文件,然后添加以下代码:# connection_test.py code import sys import snowflake.connector conn_name = sys.argv[1] print(f"Trying connection named {conn_name}..") conn = snowflake.connector.connect(connection_name=conn_name) print("Connected.") cursor = conn.cursor() cursor.execute("SELECT 'Connection successful'") for col in cursor: print(col) print("\nListing first 5 tables:\n") cursor = conn.cursor() cursor.execute('show tables limit 5') for col in cursor: print(col) print("\nDone")
在活动的 Python 虚拟环境中运行以下命令,指定您添加到
connections.toml
文件中的连接的名称。python connection_test.py snowpark-submit