Wie benutze ich cURL um bestimmte Daten von einer Webseite zu holen und speichere sie dann mit php

7

kann mir jemand sagen, wie man mit curl oder file_get_contents bestimmte Daten von einer Website herunterlädt und dann diese spezifischen Daten in meiner mysql-Datenbank speichert. Ich möchte die neuesten Filme von dieser Website Ссылка erhalten und möchte sie in meiner Datenbank speichern (täglich; dieser Text und HTML-Link wird auf meiner Website angezeigt werden). Ich brauche nur den Text und den HTML-Link. (Im Bild hervorgehoben)

Ich habe überall gesucht, aber ich habe kein nützliches Tutorial gefunden. Ich habe zwei Hauptfragen zu stellen

1) Wie kann ich bestimmte Daten mit cURL oder file_get_contents erhalten.

2) Wie kann ich den spezifischen Inhalt in meiner mysql Datenbanktabelle speichern (Text in einer Spalte und Link in einer anderen Spalte)

    
Eka 01.03.2012, 12:05
quelle

2 Antworten

14

Verwenden von cURL:

%Vor%

Dann können Sie das Element in ein DOM-Objekt laden und das dom für die spezifischen Daten analysieren. Sie könnten auch versuchen, die Daten mithilfe von Suchzeichenfolgen zu analysieren, aber die Verwendung von Regex in HTML ist sehr verpönt.

%Vor%
SS44 01.03.2012, 12:10
quelle
8

Dies sollte funktionieren, aber es ist unordentlich und möglich, dass es kaputt geht, wenn die Site, die Sie scrappen, seine Markierung ändert, was sich auf das Scrapping auswirkt:

%Vor%

Das sollte es sein, jetzt haben Sie eine Variable für den Link und den Titel, die Sie in Ihre Datenbank einfügen können.

DISCLAIMER

Ich habe dies von meinem Kopf geschrieben, also entschuldige ich mich, wenn es nicht sofort funktioniert, aber lass es mich wissen, wenn es nicht klappt und ich werde versuchen, weiter zu helfen.

Ich bin mir auch bewusst, dass dies schlauer und mit weniger Schritten erledigt werden könnte, aber das würde mehr Nachdenken auf meiner Seite bedeuten, und das OP kann dies tun, wenn sie den Code, den ich geschrieben habe, verstanden haben, da ich es annehmen würde Viel wichtiger wäre es, dass sie verstehen, was ich getan habe und in der Lage bin, es selbst zu bearbeiten.

Ich würde auch empfehlen, die Seite nachts zu kratzen, um sie nicht mit zusätzlichem Verkehr zu belasten, und ich würde vorschlagen, um die Erlaubnis dieser Seite zu bitten, denn wenn sie Sie fangen, werden sie in der Lage sein, Ihr Kratzen zu beenden : (

Um Ihren letzten Punkt zu beantworten - um dies zu einem bestimmten Zeitpunkt auszuführen, würden Sie einen Cron-Job verwenden.

    
martincarlin87 01.03.2012 12:38
quelle

Tags und Links