Decodificação instantânea de corpos HTTP no Linux?

Decodificação instantânea de corpos HTTP no Linux?

Meu desejo é monitorar as trocas HTTP entre meu servidor e um navegador. Atualmente, uso o localhost porque estou desenvolvendo o aplicativo. Eu instalei e useifluxo tcpe achei bastante útil, mas o corpo da resposta está criptografado (sem https, acredito que esteja compactado se eu me referir ao cabeçalho). Aqui está a troca de tcpflow -i lo -c -e:

127.000.000.001.59549-127.000.000.001.00080: GET /dom/test.html HTTP/1.1
Host: localhost
Connection: keep-alive
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/37.0.2062.120 Chrome/37.0.2062.120 Safari/537.36
Referer: http://localhost/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: fr-FR,fr;q=0.8,en-US;q=0.6,en;q=0.4


127.000.000.001.00080-127.000.000.001.59549: HTTP/1.1 200 OK
Date: Mon, 05 Oct 2015 03:44:53 GMT
Server: Apache/2.2.22 (Ubuntu)
Last-Modified: Mon, 05 Oct 2015 03:06:42 GMT
ETag: "36031e-8e-52152cd86200d"
Accept-Ranges: bytes
Vary: Accept-Encoding
Content-Encoding: gzip
Content-Length: 118
Keep-Alive: timeout=5, max=98
Connection: Keep-Alive
Content-Type: text/html

...........Qt.w....qU.(......Q..)v\

6..%.
...E..%.J.%i..J.`.....T;....|......E.}....>D.MR~J%Xq.!.J..P.D....
.r..0....

E aqui está oHTMLcódigo:

<!DOCSTYLE html>
<html>
<head>
  <meta charset="utf-8"/>
  <title>Hello World!</title>
</head>
<body>
  <h1>Hello World!</h1>
</body>
</html>

O que eu gostaria de ver comorespostaé antes:

...
Vary: Accept-Encoding
Content-Encoding: gzip
Content-Length: 118
Keep-Alive: timeout=5, max=98
Connection: Keep-Alive
Content-Type: text/html

<!DOCSTYLE html>
<html>
<head>
  <meta charset="utf-8"/>
  <title>Hello World!</title>
</head>
<body>
  <h1>Hello World!</h1>
</body>
</html>

Acho que as entradas do cabeçalho Vary: Accept-Encodingsão Content-Encoding: gzipa origem do meu problema. Existe alguma maneira de se livrar dessa confusão e ver oHTMLcódigo em claro? Quero dizer, uma maneira bastante fácil? Na verdade, não terei controle sobre o navegador que solicita o Accept-Encoding: gzip,deflate,sdch.Mas para fins de depuração, se a única maneira for configurar o navegador para não solicitar codificação/compactação, posso conviver com isso.

Obrigado pela ajuda!

Responder1

O conteúdo codificado com Content-Encoding: gzippode ser facilmente descompactado canalizando o conteúdo através do gzip -d. Para deflate, não conheço um utilitário, mas isso pode ser feito com alguma programação zlib. SDCH não é tão fácil porque para descompactá-lo você precisaria ter acesso ao dicionário usado para compactação, que pode estar em algum outro lugar na captura de pacotes ou em nenhum lugar.

Gzip e provavelmente deflate também devem ser manipulados de forma transparente pelo wireshark, para que você possa ver os cabeçalhos decodificados lá. Uma ferramenta httpflow que vem com oRede::InspecionarO pacote perl também pode decodificar o gzip e desinflar a carga útil para você e também pode ser usado para extrair pares de solicitações/respostas HTTP de um arquivo pcap e salvar cada um desses pares como um único arquivo pcap com carga útil já decodificada.

informação relacionada