Verwenden Sie SimpleXML:
%Vor%Dies setzt voraus, dass die Attribute immer Name / Wert-Paare sind ...
Sie können einen regulären Ausdruck verwenden, um diese Informationen zu extrahieren:
%Vor% Jetzt müssen Sie nur noch die Klassen von class
(aufgeteilt nach Whitespaces) und die Eigenschaftsdeklarationen von style
parsen (etwas schwieriger, da es Kommentare und URLs mit ;
enthalten kann).
Sie können keinen regulären Ausdruck verwenden, um HTML-Attribute zu analysieren. Dies liegt daran, dass die Syntax kontextabhängig ist. Sie können reguläre Ausdrücke verwenden, um die Eingabe zu token, aber Sie benötigen eine Zustandsmaschine, um sie zu analysieren.
Wenn die Leistung keine große Sache ist, besteht der sicherste Weg darin, die Attribute in ein Tag zu packen und dann über einen HTML-Parser zu senden. ZB:
%Vor%Sie könnten das Obige optimieren, indem Sie den Parser wiederverwenden, oder indem Sie XmlReader oder XmlReader verwenden der Sax Parser .
Vielleicht hilft dir das .. Was es macht ..