azure-machine-learning-service - 如何对 AML 端点进行健康检查?

我在 AKS 集群上部署了一个正在运行的 AML 端点,看起来像 http://[IP 地址]:80/api/v1/service/modelscoring36/score。这是响应任何传入模型评分请求的 POST 端点。有什么方法可以检查相关的 AML 服务或附加的 AKS 群集是否健康?在 Asp.Net 中,我们习惯于在一个控制器中构建一些虚拟的 GET 方法,用于此健康检查目的。 AML 服务是否提供这种健康检查方法?或任何其他建议?谢谢你。

回答1

获取端点的健康检查

  1. 使用命令提示符安装 Azure ML SDK

    pip install azureml-core

  2. 获取完整的工作区详细信息,例如订阅 ID 和其他详细信息。要求如下:

    subscription_id = '<your_subscription_id>'

    resource_group = '<your_resource_group>'

    workspace_name = '<your_workspace_name>'

    ws = Workspace(subscription_id, resource_group, workspace_name)

  3. 使用中间的 _get() 方法,我们可以得到健康检查的详细信息,如下所示

    for service in Webservice.list(workspace= ws):

    service_properties = Webservice._get(workspace= ws, name = service.name)
    
     print('Service Name: {} - {}'.format(service_properties['name'], service_properties['state']))

结果如下所示:

服务名称:模型名称 - 失败

服务名称:模型名称 - 正常

服务名称:模型名称 - 正常