Como percorrer o arquivo json?

Como percorrer o arquivo json?

Eu tenho um arquivo json abaixo e quero obter o hostId, somente se namecontiver algum valor específico. Eu quero usar o script Shell para conseguir isso.

{
  "items" : [ {
    "name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
    "type" : "STORE",
    "hostRef" : {
      "hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
    },
    "roleState" : "STARTED",
    "healthSummary" : "GOOD",

    },
  {
   "name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
    "type" : "STORE",
    "hostRef" : {
      "hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
    },
    "roleState" : "STARTED",
    "healthSummary" : "GOOD",
  }

  {
   "name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
    "type" : "STORE",
    "hostRef" : {
      "hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
    },
    "roleState" : "STARTED",
    "healthSummary" : "GOOD",
  }

}

Por exemplo: se o nome contiver algo com 'primeiro bloco', devo obter o hosdId como

166219e3-be5c-46d0-b4c7-33543a29ce32
176429e3-ae1d-46d0-b4c7-66123a24fa82

Como posso iterar pelo arquivo json? Qual regex devo usar para filtrar o elemento que contém algum valor específico namee obter o hostid?

Responder1

Você poderia usar jq:

Arquivo de entrada:

{
  "items" : [
    {
      "name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
      "type" : "STORE",
      "hostRef" : {
        "hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
      },
      "roleState" : "STARTED",
      "healthSummary" : "GOOD"

    },
    {
      "name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
      "type" : "STORE",
      "hostRef" : {
        "hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
      },
      "roleState" : "STARTED",
      "healthSummary" : "GOOD"
    },

    {
      "name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
      "type" : "STORE",
      "hostRef" : {
        "hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
      },
      "roleState" : "STARTED",
      "healthSummary" : "GOOD"
    }
  ]
}

comando:

Editar:com a contribuição de @Runium

$ jq '.items[] | select( .name | startswith("first-block-"))|.hostRef.hostId' < file.json 
"e70a2fe8fd0531ad1f87de49f03537a6"
"a85d2fe6fd0482ad1f54de49f45174a0"

Responder2

Um exemplo muito simples usando python:

#!/usr/bin/env python

import sys
import json

def print_first(data):
    for item in data["items"]:
        if item["name"].startswith("first"):
            print item["hostRef"]["hostId"]

def main(argv):
    for json_file in argv:
        with open(json_file) as data_file:
            data = json.load(data_file)
            print_first(data)

if __name__ == "__main__":
    main(sys.argv[1:])

Isso ocorre com seus dados de amostra reformatados como:

{
    "items" : [
        {
            "name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
            "type" : "STORE",
            "hostRef" : {
                "hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
            },
            "roleState" : "STARTED",
            "healthSummary" : "GOOD"

        },
        {
            "name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
            "type" : "STORE",
            "hostRef" : {
                "hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
            },
            "roleState" : "STARTED",
            "healthSummary" : "GOOD"
        },
        {
            "name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
            "type" : "STORE",
            "hostRef" : {
                "hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
            },
            "roleState" : "STARTED",
            "healthSummary" : "GOOD"
        }
    ]
}

Responder3

Como @Theophrastus mencionou, você deseja instalar o analisador JSON jqprimeiro. Depois disso, é só filtrar pelo valor desejado.

Devo mencionar que o bloco JSON que você postou não é válido; o colchete de abertura de "itens" não está fechado e a segunda entrada itemsdeve ter um separador de vírgula. Apesar disso, vou assumir que você tem um bloco válido e apenas recortou e colou o que achou relevante. Se cada bloco for realmente representativo, tudo o que você precisa adicionar é (assumindo que bashseja o seu shell)

echo "${YOUR_JSON_BLOCK}"  |  jq '.items[].hostRef.hostId'

Isso produzirá apenas essas linhas, conforme especificado, assumindo que YOUR_JSON_BLOCK é a string JSON completa e válida com seus dados.

Responder4

recentemente eu criei uma alternativa unix/shell mais fácil (é totalmente FOSS e gratuita) para lidar com consultas json como essa - dê uma olhada emjtc. A ferramenta permite lidar com passeios relativos (ou seja, encontrar um e depois compensar para outro).

supondo que seu json original esteja corrigido (ele tem alguns problemas), então cli seria assim:

bash $ cat file.json | jtc -w'[name]:<^first-block>R: [-1] [hostRef] [hostId]'
"166219e3-be5c-46d0-b4c7-33543a29ce32"
"176429e3-ae1d-46d0-b4c7-66123a24fa82"
bash $ 

informação relacionada