HTML을 간단하고 예쁜 형식의 텍스트로 변환하는 Linux 필터가 있습니까?

HTML을 간단하고 예쁜 형식의 텍스트로 변환하는 Linux 필터가 있습니까?

cURL 출력에서 ​​오는 HTML 응답을 필터링하고 싶습니다. 어떤 필터를 적용해야 하나요? Midnight Commander로 html 콘텐츠를 보는 것은 문제가 없습니다. 꽤 형식화된 일반 텍스트로 표시되므로 그런 필터가 있는 것 같습니다.

답변1

우리는 이러한 필터를 "웹 브라우저"라고 부릅니다. 이는 HTML 코드를 구문 분석하고 예쁜 문서를 출력하는 프로그램입니다.

연결Linux에서 실행되는 콘솔 웹 브라우저 중 하나입니다.

엘링크또 다른 것입니다.

또한 있다W3M.

언제든지 HTML 코드를 텍스트 파일로 복사하고 Firefox, Chrome, Opera 등과 같은 GUI 브라우저로 열 수 있습니다.

이러지마 제발정규식을 사용하여 HTML 구문 분석.

편집하다. HTML을 예쁘게 만들고 태그로 보고 싶을 수도 있다는 것을 방금 깨달았습니다. 이 경우 다음을 사용할 수 있습니다.HTML 깔끔한 라이브러리 프로젝트또는

HTML을 텍스트 파일로 복사하고 <pre> </pre>태그로 묶습니다. 그런 다음 브라우저로 엽니다.

답변2

~을 위한스라소니, 구문은 다음과 같습니다

curl ... | lynx --stdin

(보다HTML을 Lynx에 파이프하는 방법은 무엇입니까?)

답변3

자정 사령관은 "링크" 또는 "lynx"를 사용합니다. mcview에서 구문 분석된 HTML을 본다면 그 중 하나가 설치되어 있는 것 같습니다.

답변4

매력적인 방식으로 컬의 html 출력을 보고 싶다면 위에서 제안한 w3m, 링크 또는 lynx이면 충분합니다.

출력을 구문 분석하거나 수행하려는 경우 html-xml-utils Linux 패키지 또는아름다운 수프이는 웹 스크래핑과 관련된 모든 프로젝트에 매우 편리한 Python 패키지입니다.

관련 정보