Google's Indizierung von XSLT-Seiten

8

Meine Website wurde mit XML als Datenspeicher und XSLT als Vorlage erstellt. Es scheint, dass Google nicht sehr gut darin ist, Websites zu indexieren, die auf XML / XSLT basieren. Gibt es effiziente / einfach zu implementierende Softwarekomponenten, die das XSLT nur für den Google Bot Indexer rendern können? Es wäre noch besser, wenn sie mit PHP arbeiten würden.

    
monksy 23.02.2011, 04:08
quelle

2 Antworten

3

Sehen Sie sich den PHP XSLT-Prozessor an.

Ссылка

Verwenden Sie wie folgt:

%Vor%

(Aus Ссылка )

AKTUALISIEREN

Sie haben im Kommentar gefragt, wie Sie eine Anfrage von einem bestimmten Benutzeragenten (z. B. dem Googlebot) abfangen können. Je nach der von Ihnen verwendeten Web-Server-Technologie gibt es verschiedene Möglichkeiten.

Bei Apache wäre eine Methode, mod_rewrite zu verwenden, um die Verarbeitung des Anfrage an ein PHP-Skript, das Code enthält, der dem ähnelt, was wir oben sehen. Dieses Skript ruft den XML-Code von der ursprünglich angeforderten URL ab und überträgt die Umwandlung in den Client. Die Regel zum Umschreiben hätte eine Bedingung zum erneuten Schreiben , die den Header HTTP_USER_AGENT mit dem von Google vergleicht. Hier ist ein Beispiel für die Regel (ungeprüft, aber Sie sollten die Idee bekommen):

%Vor%

Kurz gesagt sucht die Bedingung nach einem Referrer, der mit der Zeichenfolge "googlebot" beginnt und die Rewrite-Regel stimmt mit einer beliebigen URL mit der Zeichenfolge ".xml" überein und übergibt die vollständige URL an die Seite renderxslt.php Querystring-Parameter.

Ein Port von mod_rewrite existiert auch für IIS ( Ссылка ).

Alternativ dazu können Sie mit IIS ein ASP.NET HTTP-Modul zum Abfangen verwenden die Anfrage, erneut überprüft Request.Headers["HTTP_USER_AGENT"] für die Unterschrift von Google. Sie können dann in ähnlicher Weise wie oben beschrieben vorgehen, indem Sie den von Ihrem PHP-Skript generierten HTML-Code lesen oder alternativ das ASP.NET XML-Steuerelement verwenden:

%Vor%     
Mike Chamberlain 23.02.2011, 04:13
quelle
-2

Warum nicht einfach das Verzeichnis ausschließen, das Ihre xsl-Dateien in Ihrer robots.txt enthält?

    
Yitzhak 03.08.2012 17:29
quelle

Tags und Links