AKS 클러스터 프로비저닝 오류 Azure Machine Learning 서비스 Python SDK

AKS 클러스터 프로비저닝 오류 Azure Machine Learning 서비스 Python SDK

이 튜토리얼에 따라 ML 모델을 AKS에 배포하려고 합니다.https://docs.microsoft.com/en-us/azure/machine-learning/service/how-to-deploy-azure-kubernetes-service.

Python SDK를 사용하여 클러스터를 생성하는 경우:

from azureml.core.compute import AksCompute, ComputeTarget

# Use the default configuration (you can also provide parameters to customize this).
# For example, to create a dev/test cluster, use:
# prov_config = AksCompute.provisioning_configuration(cluster_purpose = AksCompute.ClusterPurpose.DEV_TEST)
prov_config = AksCompute.provisioning_configuration()

aks_name = 'myaks'
# Create the cluster
aks_target = ComputeTarget.create(workspace = ws,
                                    name = aks_name,
                                    provisioning_configuration = prov_config)

# Wait for the create process to complete
aks_target.wait_for_completion(show_output = True)

다음 오류가 발생합니다.

ComputeTargetException: ComputeTargetException:
    Message: Compute object provisioning polling reached non-successful terminal state, current provisioning state: Failed
Provisioning operation error:
StatusCode: 400
Message: The request is invalid
    InnerException None
    ErrorResponse 
{
    "error": {
        "message": "Compute object provisioning polling reached non-successful terminal state, current provisioning state: Failed\nProvisioning operation error:\nStatusCode: 400\nMessage: The request is invalid"
    }
}

Azure Portal 내에서 컴퓨팅 대상은 프로비저닝 상태가 실패함과 다음 오류로 표시됩니다. 프로비저닝 오류: InvalidTemplateDeployment: 템플릿 배포 '0086633c-90b8-466d-9124-7e2cd78c5abc'는 유효성 검사 절차에 따라 유효하지 않습니다. 추적 ID는 'f0ca368a-dd3c-4fa3-9daf-ee49c82f41e4'입니다. 자세한 내용은 내부 오류를 참조하세요.

클라이언트 요청 ID : fe9ff62f-666d-4b23-b6ff-33cd38f669ff 서비스 요청 ID : |64f42c9db113451395735386668ae64c.

다양한 VM 크기를 시도했지만 모두 동일한 오류가 발생했습니다. 미국 동부 지역에 배포 중입니다.

관련 정보