
이 튜토리얼에 따라 ML 모델을 AKS에 배포하려고 합니다.https://docs.microsoft.com/en-us/azure/machine-learning/service/how-to-deploy-azure-kubernetes-service.
Python SDK를 사용하여 클러스터를 생성하는 경우:
from azureml.core.compute import AksCompute, ComputeTarget
# Use the default configuration (you can also provide parameters to customize this).
# For example, to create a dev/test cluster, use:
# prov_config = AksCompute.provisioning_configuration(cluster_purpose = AksCompute.ClusterPurpose.DEV_TEST)
prov_config = AksCompute.provisioning_configuration()
aks_name = 'myaks'
# Create the cluster
aks_target = ComputeTarget.create(workspace = ws,
name = aks_name,
provisioning_configuration = prov_config)
# Wait for the create process to complete
aks_target.wait_for_completion(show_output = True)
다음 오류가 발생합니다.
ComputeTargetException: ComputeTargetException:
Message: Compute object provisioning polling reached non-successful terminal state, current provisioning state: Failed
Provisioning operation error:
StatusCode: 400
Message: The request is invalid
InnerException None
ErrorResponse
{
"error": {
"message": "Compute object provisioning polling reached non-successful terminal state, current provisioning state: Failed\nProvisioning operation error:\nStatusCode: 400\nMessage: The request is invalid"
}
}
Azure Portal 내에서 컴퓨팅 대상은 프로비저닝 상태가 실패함과 다음 오류로 표시됩니다. 프로비저닝 오류: InvalidTemplateDeployment: 템플릿 배포 '0086633c-90b8-466d-9124-7e2cd78c5abc'는 유효성 검사 절차에 따라 유효하지 않습니다. 추적 ID는 'f0ca368a-dd3c-4fa3-9daf-ee49c82f41e4'입니다. 자세한 내용은 내부 오류를 참조하세요.
클라이언트 요청 ID : fe9ff62f-666d-4b23-b6ff-33cd38f669ff 서비스 요청 ID : |64f42c9db113451395735386668ae64c.
다양한 VM 크기를 시도했지만 모두 동일한 오류가 발생했습니다. 미국 동부 지역에 배포 중입니다.