Я хотел бы отфильтровать html-ответ, поступающий из cURL-вывода. Какой фильтр мне применить? Просмотр html-контента с помощью Midnight Commander не вызывает проблем, он отображает их как довольно отформатированный простой текст, так что, я думаю, такой фильтр есть.
решение1
Мы называем эти фильтры «веб-браузерами» — это программы, которые анализируют HTML-код и выводят красивый документ.
Ссылкиодин из консольных веб-браузеров, работающий на Linux.
Elinksеще один.
Также естьW3M.
Вы всегда можете скопировать свой HTML-код в текстовый файл и открыть его с помощью браузера с графическим интерфейсом, например Firefox, Chrome, Opera и т. д.
Пожалуйста, неиспользовать регулярные выражения для анализа HTML.
РЕДАКТИРОВАТЬ. Я только что понял, что вы можете захотеть украсить свой HTML и увидеть его с тегами. В этом случае вы можете использоватьПроект библиотеки HTML Tidyили
Скопируйте ваш HTML в текстовый файл и окружите его <pre>
</pre>
тегами. Затем откройте его в браузере.
решение2
решение3
midnight commander использует "links" или "lynx". Я подозреваю, что у вас установлен один из них, если вы видите проанализированный HTML в mcview.
решение4
Если вы просто хотите просмотреть HTML-вывод curl в привлекательном виде, то вам будет достаточно w3m, links или lynx, как предложено выше.
Если вы хотите проанализировать или сделать что-то с выводом, то я рекомендую либо пакет html-xml-utils для Linux, либоПрекрасный супЭто очень удобный пакет Python для любого проекта, включающего веб-скрапинг.