Eu tenho um arquivo json abaixo e quero obter o hostId, somente se name
contiver algum valor específico. Eu quero usar o script Shell para conseguir isso.
{
"items" : [ {
"name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
"type" : "STORE",
"hostRef" : {
"hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD",
},
{
"name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
"type" : "STORE",
"hostRef" : {
"hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD",
}
{
"name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
"type" : "STORE",
"hostRef" : {
"hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD",
}
}
Por exemplo: se o nome contiver algo com 'primeiro bloco', devo obter o hosdId como
166219e3-be5c-46d0-b4c7-33543a29ce32
176429e3-ae1d-46d0-b4c7-66123a24fa82
Como posso iterar pelo arquivo json? Qual regex devo usar para filtrar o elemento que contém algum valor específico name
e obter o hostid
?
Responder1
Você poderia usar jq:
Arquivo de entrada:
{
"items" : [
{
"name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
"type" : "STORE",
"hostRef" : {
"hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD"
},
{
"name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
"type" : "STORE",
"hostRef" : {
"hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD"
},
{
"name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
"type" : "STORE",
"hostRef" : {
"hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD"
}
]
}
comando:
Editar:com a contribuição de @Runium
$ jq '.items[] | select( .name | startswith("first-block-"))|.hostRef.hostId' < file.json
"e70a2fe8fd0531ad1f87de49f03537a6"
"a85d2fe6fd0482ad1f54de49f45174a0"
Responder2
Um exemplo muito simples usando python:
#!/usr/bin/env python
import sys
import json
def print_first(data):
for item in data["items"]:
if item["name"].startswith("first"):
print item["hostRef"]["hostId"]
def main(argv):
for json_file in argv:
with open(json_file) as data_file:
data = json.load(data_file)
print_first(data)
if __name__ == "__main__":
main(sys.argv[1:])
Isso ocorre com seus dados de amostra reformatados como:
{
"items" : [
{
"name" : "first-block-e70a2fe8fd0531ad1f87de49f03537a6",
"type" : "STORE",
"hostRef" : {
"hostId" : "166219e3-be5c-46d0-b4c7-33543a29ce32"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD"
},
{
"name" : "second-block-c21a1ae8dd2831cd1b87de49f98274e8",
"type" : "STORE",
"hostRef" : {
"hostId" : "176429e3-be5c-46d0-b4c7-33543a29ad63"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD"
},
{
"name" : "first-block-a85d2fe6fd0482ad1f54de49f45174a0",
"type" : "STORE",
"hostRef" : {
"hostId" : "176429e3-ae1d-46d0-b4c7-66123a24fa82"
},
"roleState" : "STARTED",
"healthSummary" : "GOOD"
}
]
}
Responder3
Como @Theophrastus mencionou, você deseja instalar o analisador JSON jq
primeiro. Depois disso, é só filtrar pelo valor desejado.
Devo mencionar que o bloco JSON que você postou não é válido; o colchete de abertura de "itens" não está fechado e a segunda entrada items
deve ter um separador de vírgula. Apesar disso, vou assumir que você tem um bloco válido e apenas recortou e colou o que achou relevante. Se cada bloco for realmente representativo, tudo o que você precisa adicionar é (assumindo que bash
seja o seu shell)
echo "${YOUR_JSON_BLOCK}" | jq '.items[].hostRef.hostId'
Isso produzirá apenas essas linhas, conforme especificado, assumindo que YOUR_JSON_BLOCK é a string JSON completa e válida com seus dados.
Responder4
recentemente eu criei uma alternativa unix/shell mais fácil (é totalmente FOSS e gratuita) para lidar com consultas json como essa - dê uma olhada emjtc
. A ferramenta permite lidar com passeios relativos (ou seja, encontrar um e depois compensar para outro).
supondo que seu json original esteja corrigido (ele tem alguns problemas), então cli seria assim:
bash $ cat file.json | jtc -w'[name]:<^first-block>R: [-1] [hostRef] [hostId]'
"166219e3-be5c-46d0-b4c7-33543a29ce32"
"176429e3-ae1d-46d0-b4c7-66123a24fa82"
bash $