¿Cómo recorrer el archivo json?

¿Cómo recorrer el archivo json?

Tengo un archivo json a continuación y quiero obtener el ID de host, solo si namecontiene algún valor específico. Quiero usar un script de shell para lograr esto.

{
  "items" : [ {
    "name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
    "type" : "STORE",
    "hostRef" : {
      "hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
    },
    "roleState" : "STARTED",
    "healthSummary" : "GOOD",

    },
  {
   "name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
    "type" : "STORE",
    "hostRef" : {
      "hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
    },
    "roleState" : "STARTED",
    "healthSummary" : "GOOD",
  }

  {
   "name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
    "type" : "STORE",
    "hostRef" : {
      "hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
    },
    "roleState" : "STARTED",
    "healthSummary" : "GOOD",
  }

}

Por ejemplo: si el nombre contiene algo con "primer bloque", entonces debería obtener el hosdId como

166219e3-be5c-46d0-b4c7-33543a29ce32
176429e3-ae1d-46d0-b4c7-66123a24fa82

¿Cómo puedo recorrer el archivo json? ¿Qué expresión regular debo usar para filtrar el elemento que contiene algún valor específico namey obtener el hostid?

Respuesta1

Podrías usar jq:

Fichero de entrada:

{
  "items" : [
    {
      "name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
      "type" : "STORE",
      "hostRef" : {
        "hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
      },
      "roleState" : "STARTED",
      "healthSummary" : "GOOD"

    },
    {
      "name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
      "type" : "STORE",
      "hostRef" : {
        "hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
      },
      "roleState" : "STARTED",
      "healthSummary" : "GOOD"
    },

    {
      "name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
      "type" : "STORE",
      "hostRef" : {
        "hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
      },
      "roleState" : "STARTED",
      "healthSummary" : "GOOD"
    }
  ]
}

dominio:

Editar:con la contribución de @Runium

$ jq '.items[] | select( .name | startswith("first-block-"))|.hostRef.hostId' < file.json 
"e70a2fe8fd0531ad1f87de49f03537a6"
"a85d2fe6fd0482ad1f54de49f45174a0"

Respuesta2

Un ejemplo muy simple usando Python:

#!/usr/bin/env python

import sys
import json

def print_first(data):
    for item in data["items"]:
        if item["name"].startswith("first"):
            print item["hostRef"]["hostId"]

def main(argv):
    for json_file in argv:
        with open(json_file) as data_file:
            data = json.load(data_file)
            print_first(data)

if __name__ == "__main__":
    main(sys.argv[1:])

Eso es con sus datos de muestra reformateados como:

{
    "items" : [
        {
            "name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
            "type" : "STORE",
            "hostRef" : {
                "hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
            },
            "roleState" : "STARTED",
            "healthSummary" : "GOOD"

        },
        {
            "name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
            "type" : "STORE",
            "hostRef" : {
                "hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
            },
            "roleState" : "STARTED",
            "healthSummary" : "GOOD"
        },
        {
            "name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
            "type" : "STORE",
            "hostRef" : {
                "hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
            },
            "roleState" : "STARTED",
            "healthSummary" : "GOOD"
        }
    ]
}

Respuesta3

Como mencionó @Theophrastus, primero desea instalar el analizador JSON jq. Después de eso, sólo es cuestión de filtrar por el valor que deseas.

Debo mencionar que el bloque JSON que publicaste no es válido; el corchete de apertura de "elementos" no está cerrado y la segunda entrada itemsdebe tener un separador de coma. A pesar de eso, voy a asumir que tienes un bloqueo válido y que solo cortas y pegas lo que crees que es relevante. Si cada bloque es realmente representativo, entonces todo lo que debe agregar es (suponiendo que bashsea su caparazón)

echo "${YOUR_JSON_BLOCK}"  |  jq '.items[].hostRef.hostId'

Esto generará solo esas líneas, como se especifica, suponiendo que YOUR_JSON_BLOCK sea la cadena json válida completa con sus datos.

Respuesta4

Recientemente se me ocurrió una alternativa Unix/Shell más sencilla (es completamente FOSS y gratuita) para manejar consultas json como esa: eche un vistazo ajtc. La herramienta permite manejar recorridos relativos (es decir, encontrar uno y luego desplazarse hacia otro).

Suponiendo que su json original esté arreglado (tiene un par de problemas), entonces cli sería así:

bash $ cat file.json | jtc -w'[name]:<^first-block>R: [-1] [hostRef] [hostId]'
"166219e3-be5c-46d0-b4c7-33543a29ce32"
"176429e3-ae1d-46d0-b4c7-66123a24fa82"
bash $ 

información relacionada