aws · claytonparnell · Sep 29, 2025 · Sep 12, 2025 · reganbaum · Sep 12, 2025
@@ -425,7 +425,7 @@ if [ "${SAGEMAKER_APP_TYPE_LOWERCASE}" = "jupyterlab" ] && [ "$is_express_mode"
     bash /etc/sagemaker-ui/libmgmt/install-lib.sh
 
     # Install sm-spark-cli
-    bash /etc/sagemaker-ui/workflows/sm-spark-cli-install.sh
+    bash /etc/sagemaker-ui/workflows/sm-spark-cli-install.sh || echo "Warning: sm-spark-cli installation failed, continuing..."
 fi
 
 # Execute network validation script, to check if any required AWS Services are unreachable

@@ -1,9 +1,18 @@
 #!/bin/bash
+RESOURCE_METADATA_FILE=/opt/ml/metadata/resource-metadata.json
+DZ_DOMAIN_ID=$(jq -r '.AdditionalMetadata.DataZoneDomainId' < $RESOURCE_METADATA_FILE)
+DZ_PROJECT_ID=$(jq -r '.AdditionalMetadata.DataZoneProjectId' < $RESOURCE_METADATA_FILE)
+DZ_DOMAIN_REGION=$(jq -r '.AdditionalMetadata.DataZoneDomainRegion' < $RESOURCE_METADATA_FILE)
+DZ_ENDPOINT=$(jq -r '.AdditionalMetadata.DataZoneEndpoint' < $RESOURCE_METADATA_FILE)
 
-# install sm-spark-cli
-sudo curl -LO https://github.com/aws-samples/amazon-sagemaker-spark-ui/releases/download/v0.9.1/amazon-sagemaker-spark-ui.tar.gz && \
-sudo tar -xvzf amazon-sagemaker-spark-ui.tar.gz && \
-sudo chmod +x amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
-sudo amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
-rm -rf ~/.m2 && \
-sudo rm -rf amazon-sagemaker-spark-ui*
+# install sm-spark-cli if workflows blueprint is enabled
+if  [ "$(python /etc/sagemaker-ui/workflows/workflow_client.py check-blueprint --region "$DZ_DOMAIN_REGION" --domain-id "$DZ_DOMAIN_ID" --endpoint "$DZ_ENDPOINT" --project-id "$DZ_PROJECT_ID")" = "True" ]; then
+    echo "Workflows blueprint is enabled. Installing sm-spark-cli."
+    # install sm-spark-cli
+    sudo curl -LO https://github.com/aws-samples/amazon-sagemaker-spark-ui/releases/download/v0.9.1/amazon-sagemaker-spark-ui.tar.gz && \
+    sudo tar -xvzf amazon-sagemaker-spark-ui.tar.gz && \
+    sudo chmod +x amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
+    sudo amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
+    rm -rf ~/.m2 && \
+    sudo rm -rf amazon-sagemaker-spark-ui*
+fi
@@ -3,7 +3,11 @@ set -eu
 
 # Get project directory based on storage type
 PROJECT_DIR=${SMUS_PROJECT_DIR:-"$HOME/src"}
-MOUNT_DIR=$(readlink -f "$PROJECT_DIR")  # get the symlink source if it's symlink
+if [ -z "${SMUS_PROJECT_DIR:-}" ]; then
+    MOUNT_DIR=$PROJECT_DIR
+else
+    MOUNT_DIR=$(readlink -f "$PROJECT_DIR")  # get the symlink source
+fi
 
 # Datazone project metadata
 RESOURCE_METADATA_FILE=/opt/ml/metadata/resource-metadata.json
@@ -75,7 +79,7 @@ if [ ! -f "${WORKFLOW_HEALTH_PATH}/status.json" ]; then
 fi
 
 # Only start local runner if Workflows blueprint is enabled
-if  [ "$(python /etc/sagemaker-ui/workflows/workflow_client.py check-blueprint --region "$DZ_DOMAIN_REGION" --domain-id "$DZ_DOMAIN_ID" --endpoint "$DZ_ENDPOINT")" = "False" ]; then
+if  [ "$(python /etc/sagemaker-ui/workflows/workflow_client.py check-blueprint --region "$DZ_DOMAIN_REGION" --domain-id "$DZ_DOMAIN_ID" --endpoint "$DZ_ENDPOINT" --project-id "$DZ_PROJECT_ID")" = "False" ]; then
     echo "Workflows blueprint is not enabled. Workflows will not start."
     handle_workflows_startup_error 0
 fi

@@ -47,23 +47,45 @@ def stop_local_runner(session: requests.Session, **kwargs):
     )
     return _validate_response("StopLocalRunner", response)
 
-
-def check_blueprint(region: str, domain_id: str, endpoint: str, **kwargs):
+def check_blueprint(region: str, domain_id: str, endpoint: str, project_id: str, **kwargs):
     DZ_CLIENT = boto3.client("datazone")
     # add correct endpoint for gamma env
     if endpoint != "":
         DZ_CLIENT = boto3.client("datazone", endpoint_url=endpoint)
     try:
+        # check if workflows blueprint is enabled in project profile
+        project_profile_id = DZ_CLIENT.get_project(
+            domainIdentifier=domain_id, identifier=project_id
+        )["projectProfileId"]
+        project_blueprints = DZ_CLIENT.get_project_profile(
+                domainIdentifier=domain_id, identifier=project_profile_id
+            )['environmentConfigurations']
+        proj_blueprint_ids = [proj_env_config["environmentBlueprintId"] for proj_env_config in project_blueprints]
         blueprint_id = DZ_CLIENT.list_environment_blueprints(
             managed=True, domainIdentifier=domain_id, name="Workflows"
         )["items"][0]["id"]
-        blueprint_config = DZ_CLIENT.get_environment_blueprint_configuration(
-            domainIdentifier=domain_id, environmentBlueprintIdentifier=blueprint_id
-        )
-        enabled_regions = blueprint_config["enabledRegions"]
-        print(str(region in enabled_regions))
+
+        if blueprint_id in proj_blueprint_ids:
+            blueprint_config = DZ_CLIENT.get_environment_blueprint_configuration(
+                domainIdentifier=domain_id, environmentBlueprintIdentifier=blueprint_id
+            )
+            enabled_regions = blueprint_config["enabledRegions"]
+            print(str(region in enabled_regions))
+        else:
+            print("False")
     except:
-        print("False")
+        # fallback to checking if only workflows blueprint exists
+        try:
+            blueprint_id = DZ_CLIENT.list_environment_blueprints(
+                managed=True, domainIdentifier=domain_id, name="Workflows"
+            )["items"][0]["id"]
+            blueprint_config = DZ_CLIENT.get_environment_blueprint_configuration(
+                domainIdentifier=domain_id, environmentBlueprintIdentifier=blueprint_id
+            )
+            enabled_regions = blueprint_config["enabledRegions"]
+            print(str(region in enabled_regions))
+        except:
+            print("False")
 
 
 COMMAND_REGISTRY = {
@@ -94,6 +116,9 @@ def main():
     check_blueprint_parser.add_argument(
         "--endpoint", type=str, required=True, help="Datazone endpoint for blueprint check"
     )
+    check_blueprint_parser.add_argument(
+        "--project-id", type=str, required=True, help="Datazone Project ID for blueprint check"
+    )
 
     args = parser.parse_args()
 

@@ -426,7 +426,7 @@ if [ "${SAGEMAKER_APP_TYPE_LOWERCASE}" = "jupyterlab" ] && [ "$is_express_mode"
     bash /etc/sagemaker-ui/libmgmt/install-lib.sh
 
     # Install sm-spark-cli
-    bash /etc/sagemaker-ui/workflows/sm-spark-cli-install.sh
+    bash /etc/sagemaker-ui/workflows/sm-spark-cli-install.sh || echo "Warning: sm-spark-cli installation failed, continuing..."
 fi
 
 # Execute network validation script, to check if any required AWS Services are unreachable

@@ -1,9 +1,18 @@
 #!/bin/bash
+RESOURCE_METADATA_FILE=/opt/ml/metadata/resource-metadata.json
+DZ_DOMAIN_ID=$(jq -r '.AdditionalMetadata.DataZoneDomainId' < $RESOURCE_METADATA_FILE)
+DZ_PROJECT_ID=$(jq -r '.AdditionalMetadata.DataZoneProjectId' < $RESOURCE_METADATA_FILE)
+DZ_DOMAIN_REGION=$(jq -r '.AdditionalMetadata.DataZoneDomainRegion' < $RESOURCE_METADATA_FILE)
+DZ_ENDPOINT=$(jq -r '.AdditionalMetadata.DataZoneEndpoint' < $RESOURCE_METADATA_FILE)
 
-# install sm-spark-cli
-sudo curl -LO https://github.com/aws-samples/amazon-sagemaker-spark-ui/releases/download/v0.9.1/amazon-sagemaker-spark-ui.tar.gz && \
-sudo tar -xvzf amazon-sagemaker-spark-ui.tar.gz && \
-sudo chmod +x amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
-sudo amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
-rm -rf ~/.m2 && \
-sudo rm -rf amazon-sagemaker-spark-ui*
+# install sm-spark-cli if workflows blueprint is enabled
+if  [ "$(python /etc/sagemaker-ui/workflows/workflow_client.py check-blueprint --region "$DZ_DOMAIN_REGION" --domain-id "$DZ_DOMAIN_ID" --endpoint "$DZ_ENDPOINT" --project-id "$DZ_PROJECT_ID")" = "True" ]; then
+    echo "Workflows blueprint is enabled. Installing sm-spark-cli."
+    # install sm-spark-cli
+    sudo curl -LO https://github.com/aws-samples/amazon-sagemaker-spark-ui/releases/download/v0.9.1/amazon-sagemaker-spark-ui.tar.gz && \
+    sudo tar -xvzf amazon-sagemaker-spark-ui.tar.gz && \
+    sudo chmod +x amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
+    sudo amazon-sagemaker-spark-ui/install-scripts/studio/install-history-server.sh && \
+    rm -rf ~/.m2 && \
+    sudo rm -rf amazon-sagemaker-spark-ui*
+fi
@@ -3,7 +3,11 @@ set -eu
 
 # Get project directory based on storage type
 PROJECT_DIR=${SMUS_PROJECT_DIR:-"$HOME/src"}
-MOUNT_DIR=$(readlink -f "$PROJECT_DIR")  # get the symlink source if it's symlink
+if [ -z "${SMUS_PROJECT_DIR:-}" ]; then
+    MOUNT_DIR=$PROJECT_DIR
+else
+    MOUNT_DIR=$(readlink -f "$PROJECT_DIR")  # get the symlink source
+fi
 
 # Datazone project metadata
 RESOURCE_METADATA_FILE=/opt/ml/metadata/resource-metadata.json
@@ -75,7 +79,7 @@ if [ ! -f "${WORKFLOW_HEALTH_PATH}/status.json" ]; then
 fi
 
 # Only start local runner if Workflows blueprint is enabled
-if  [ "$(python /etc/sagemaker-ui/workflows/workflow_client.py check-blueprint --region "$DZ_DOMAIN_REGION" --domain-id "$DZ_DOMAIN_ID" --endpoint "$DZ_ENDPOINT")" = "False" ]; then
+if  [ "$(python /etc/sagemaker-ui/workflows/workflow_client.py check-blueprint --region "$DZ_DOMAIN_REGION" --domain-id "$DZ_DOMAIN_ID" --endpoint "$DZ_ENDPOINT" --project-id "$DZ_PROJECT_ID")" = "False" ]; then
     echo "Workflows blueprint is not enabled. Workflows will not start."
     handle_workflows_startup_error 0
 fi

@@ -47,23 +47,45 @@ def stop_local_runner(session: requests.Session, **kwargs):
     )
     return _validate_response("StopLocalRunner", response)
 
-
-def check_blueprint(region: str, domain_id: str, endpoint: str, **kwargs):
+def check_blueprint(region: str, domain_id: str, endpoint: str, project_id: str, **kwargs):
     DZ_CLIENT = boto3.client("datazone")
     # add correct endpoint for gamma env
     if endpoint != "":
         DZ_CLIENT = boto3.client("datazone", endpoint_url=endpoint)
     try:
+        # check if workflows blueprint is enabled in project profile
+        project_profile_id = DZ_CLIENT.get_project(
+            domainIdentifier=domain_id, identifier=project_id
+        )["projectProfileId"]
+        project_blueprints = DZ_CLIENT.get_project_profile(
+                domainIdentifier=domain_id, identifier=project_profile_id
+            )['environmentConfigurations']
+        proj_blueprint_ids = [proj_env_config["environmentBlueprintId"] for proj_env_config in project_blueprints]
         blueprint_id = DZ_CLIENT.list_environment_blueprints(
             managed=True, domainIdentifier=domain_id, name="Workflows"
         )["items"][0]["id"]
-        blueprint_config = DZ_CLIENT.get_environment_blueprint_configuration(
-            domainIdentifier=domain_id, environmentBlueprintIdentifier=blueprint_id
-        )
-        enabled_regions = blueprint_config["enabledRegions"]
-        print(str(region in enabled_regions))
+
+        if blueprint_id in proj_blueprint_ids:
+            blueprint_config = DZ_CLIENT.get_environment_blueprint_configuration(
+                domainIdentifier=domain_id, environmentBlueprintIdentifier=blueprint_id
+            )
+            enabled_regions = blueprint_config["enabledRegions"]
+            print(str(region in enabled_regions))
+        else:
+            print("False")
     except:
-        print("False")
+        # fallback to checking if only workflows blueprint exists
+        try:
+            blueprint_id = DZ_CLIENT.list_environment_blueprints(
+                managed=True, domainIdentifier=domain_id, name="Workflows"
+            )["items"][0]["id"]
+            blueprint_config = DZ_CLIENT.get_environment_blueprint_configuration(
+                domainIdentifier=domain_id, environmentBlueprintIdentifier=blueprint_id
+            )
+            enabled_regions = blueprint_config["enabledRegions"]
+            print(str(region in enabled_regions))
+        except:
+            print("False")
 
 
 COMMAND_REGISTRY = {
@@ -94,6 +116,9 @@ def main():
     check_blueprint_parser.add_argument(
         "--endpoint", type=str, required=True, help="Datazone endpoint for blueprint check"
     )
+    check_blueprint_parser.add_argument(
+        "--project-id", type=str, required=True, help="Datazone Project ID for blueprint check"
+    )
 
     args = parser.parse_args()