awk
ist kein HTML-Parser. Benutze xpath
oder sogar xslt
dafür. xmllint
ist ein Kommandozeilen-Tool, das XPath-Abfragen ausführen kann und xsltproc
kann für die Durchführung von XSL-Transformationen verwendet werden. Beide Werkzeuge gehören zum Paket libxml2-utils
.
Sie können auch eine Programmiersprache verwenden, die HTML analysieren kann