Существует ли фильтр для Linux, который преобразует HTML в простой и красиво отформатированный текст?

Существует ли фильтр для Linux, который преобразует HTML в простой и красиво отформатированный текст?

Я хотел бы отфильтровать html-ответ, поступающий из cURL-вывода. Какой фильтр мне применить? Просмотр html-контента с помощью Midnight Commander не вызывает проблем, он отображает их как довольно отформатированный простой текст, так что, я думаю, такой фильтр есть.

решение1

Мы называем эти фильтры «веб-браузерами» — это программы, которые анализируют HTML-код и выводят красивый документ.

Ссылкиодин из консольных веб-браузеров, работающий на Linux.

Elinksеще один.

Также естьW3M.

Вы всегда можете скопировать свой HTML-код в текстовый файл и открыть его с помощью браузера с графическим интерфейсом, например Firefox, Chrome, Opera и т. д.

Пожалуйста, неиспользовать регулярные выражения для анализа HTML.

РЕДАКТИРОВАТЬ. Я только что понял, что вы можете захотеть украсить свой HTML и увидеть его с тегами. В этом случае вы можете использоватьПроект библиотеки HTML Tidyили

Скопируйте ваш HTML в текстовый файл и окружите его <pre> </pre>тегами. Затем откройте его в браузере.

решение2

длярысь, синтаксис следующий:

curl ... | lynx --stdin

(видетьКак передать HTML в Lynx?)

решение3

midnight commander использует "links" или "lynx". Я подозреваю, что у вас установлен один из них, если вы видите проанализированный HTML в mcview.

решение4

Если вы просто хотите просмотреть HTML-вывод curl в привлекательном виде, то вам будет достаточно w3m, links или lynx, как предложено выше.

Если вы хотите проанализировать или сделать что-то с выводом, то я рекомендую либо пакет html-xml-utils для Linux, либоПрекрасный супЭто очень удобный пакет Python для любого проекта, включающего веб-скрапинг.

Связанный контент