安装 Snowpark Submit

您可以直接在 Snowflake 的基础设施上安装 Snowpark Submit,以运行面向批处理的 Spark 工作负载。

要安装 Snowpark Submit,请完成以下步骤:

  1. 使用 pip 安装 Snowpark Submit。

    pip install snowpark-submit
    
    Copy
  2. 在用于 Snowflake 身份验证的 connections.toml 文件中,添加一个名为 snowpark-submit 的连接。

    如果您还没有这样的文件,请按 使用 connections.toml 文件进行连接 中所述创建一个。

    [snowpark-submit]
    host = "<account>.snowflakecomputing.cn"
    port = 443
    account = "<account>"
    user = "test_user"
    role = "test_role"
    password = "<password for user>"
    protocol = "https"
    warehouse = "test_warehouse"
    database = "test_db"
    schema = "test_schema"
    compute_pool = "test_compute_pool"
    
    Copy
  3. 确认您可以从客户端计算机连接到 Snowflake。

    要验证您的客户端计算机上的连接是否正常,请使用连接到 Snowflake 的代码创建一个 .py 文件。

    1. 创建一个 connection_test.py 文件,然后添加以下代码:

      # connection_test.py code
      
      import sys
      import snowflake.connector
      
      conn_name = sys.argv[1]
      
      print(f"Trying connection named {conn_name}..")
      conn = snowflake.connector.connect(connection_name=conn_name)
      print("Connected.")
      
      cursor = conn.cursor()
      cursor.execute("SELECT 'Connection successful'")
      for col in cursor:
          print(col)
      
      print("\nListing first 5 tables:\n")
      cursor = conn.cursor()
      cursor.execute('show tables limit 5')
      for col in cursor:
          print(col)
      print("\nDone")
      
      Copy
    2. 在活动的 Python 虚拟环境中运行以下命令,指定您添加到 connections.toml 文件中的连接的名称。

      python connection_test.py snowpark-submit
      
      Copy
语言: 中文