xj: herramienta para traducir html (no muy pocho) a json

De casualidad en algún portal de estos de noticias (no se si newsycombinator u otro) he encontrado el proyecto xj que convierte cualquier html a json.

Me parece muy útil cuando lo conjugas con jq para parsear el html y sacarle algún dato sin tener que tirar de xpath o inventos similares.

Aunque en el este awesomelist en github listan muchas alternativas: https://github.com/dbohdan/structured-text-tools

Después de instalado es bastante sencillo de usar:

$ echo "<html><head><title>prueba 1</title></head><body style='background: red;'><h1>TITULO</h1><p>aaa <b>bbb</b> ccc</p><p>ddd</p></body></html>" | xj | jq '.html[] | select(.body) | .[] | .[] | select(.h1) | .[] | .[0]' -r

TITULO

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos:

Responsable: Miguel de Dios Matías

Finalidad de la recogida y tratamiento de los datos personales: Responder a los comentarios enviados a través de la web

Legitimación: Consentimiento del interesado/a.

Destinatarios: No se comunican datos a terceros

Derechos: Podrás ejercer tus derechos de acceso, rectificación,  limitación y suprimir los datos en este formulario  así como el derecho a presentar una reclamación ante una autoridad de control.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.