html-content-extraction

___ tag123excel ___ Nur für Fragen zur Programmierung von Excel-Objekten oder -Dateien oder zur Entwicklung komplexer Formeln. Sie können das Excel-Tag mit VBA, VSTO, C #, VB.NET, PowerShell, OLE-Automatisierung und anderen programmierbezogenen Tags und Fragen kombinieren, falls zutreffend. Allgemeine Hilfe zu MS Excel für einzelne Arbeitsblattfunktionen ist bei Super User verfügbar. ___ answer22129948 ___

Überprüfen Sie den Bereitschaftszustand.

%Vor%

Das bedeutet, dass es geladen wird. Dann können Sie den Status

überprüfen %Vor%

Das heißt, Sie haben die URL nicht durcheinander gebracht. Wenn readystate 4 ist und status 200 ist, können Sie den responseText lesen.

    
___ tag123vba ___ Visual Basic für Applikationen (VBA) ist eine ereignisgesteuerte, objektorientierte Programmiersprache zum Schreiben von Makros, die für die gesamte Office-Suite und andere Anwendungen verwendet wird. VBA entspricht nicht VB.NET oder VBS; Wenn Sie in Visual Studio arbeiten, verwenden Sie [vb.net]. Wenn sich Ihre Frage speziell auf die Programmierung einer MS Office-Anwendung bezieht, verwenden Sie auch das entsprechende Tag: [Excel-VBA], [Zugriff-VBA], [Word-VBA], [Outlook-VBA] oder [Microsoft-Project-VBA] . ___ qstntxt ___

Ich versuche, historische Aktienkursdaten von finance.yahoo.com für 1000s Aktien herunterzuladen. Die Website zeigt nur 60 Tage Daten auf einer einzelnen Seite an, so dass ich die Zeitperiode, in der ich lade, zusammen mit der Schleife für verschiedene Wertpapiere durchlaufen muss. Ich habe den folgenden Code verwendet, um auf die entsprechende Seite zuzugreifen.

%Vor%

Das funktioniert wie ein Zauber für 99% der Daten, auf die ich zugreife. Aber hin und wieder stellt sich heraus, dass das von der Website zurückgegebene Objekt leer ist, obwohl die exakt gleiche URL mir die richtigen Daten im Internet Explorer anzeigt. Wenn ich den Code nur für diese URL erneut durchführe, kann es beim nächsten Mal fehlschlagen.

Ich würde gerne wissen, ob es eine stabilere / konsistentere Art der Verwendung der obigen Methode gibt. Ich hatte zuvor die InternetExplorer.Application-Methode implementiert, um Daten herunterzuladen, fand diese aber viel langsamer und umständlicher.

    
___ tag123msxml ___ MSXML sind die Microsoft XML-Kerndienste, die eine vollständige XML-DOM-Implementierung enthalten. ___ tag123htmlcontetextraction ___ Techniken zum Vorhersagen / Erkennen bestimmter Artikeltexte und zum Extrahieren bestimmter Artikeltexte aus einem bestimmten Dokument. ___ qstnhdr ___ Verwenden von MSXML2.XMLHTTP in Excel VBA zum Extrahieren großer Mengen von Textdaten von der Website ___ answer32665864 ___

Ich hatte das gleiche Problem, eine leere Antwort bekommen, mit %code% (d. h. Ok). Mein Problem war, dass das http, wenn Sie in den Browser gehen, zu https umleitet. Als ich es in meiner Anfrage änderte, war es in Ordnung.

Für eine generische Funktion könnten Sie versuchen, http und wenn Sie %code% und %code% erhalten, dann wiederholen Sie aber mit https.

    
___
4
Antworten

Mit welchen Algorithmen kann ich Inhalte auf einer Webseite identifizieren?

Ich habe eine Webseite im Browser geladen (dh ihr DOM und ihre Elementpositionierung sind beide für mich zugänglich) und ich möchte das Blockelement (oder eine sortierte Liste dieser Elemente) finden, das wahrscheinlich den meisten Inhalt enthäl...
04.01.2010, 12:22
3
Antworten

Wie kann ich den Inhalt einer Webseite in R lesen und analysieren?

Ich würde gerne den Inhalt einer URL (eq, Ссылка ) in R lesen. Ich frage mich, wie ich das machen kann es     
04.12.2009, 04:18
5
Antworten

python-Methode zum Extrahieren von Inhalt (ohne Navigation) von einer HTML-Seite

Natürlich kann eine HTML-Seite mit einer beliebigen Anzahl von Python-Parsern geparst werden, aber ich bin überrascht, dass es offenbar keine öffentlichen Parsing-Skripte gibt, um aussagekräftigen Inhalt (ausgenommen Seitenleisten, Navigation, e...
28.04.2009, 06:40
2
Antworten

Verwenden von MSXML2.XMLHTTP in Excel VBA zum Extrahieren großer Mengen von Textdaten von der Website

Ich versuche, historische Aktienkursdaten von finance.yahoo.com für 1000s Aktien herunterzuladen. Die Website zeigt nur 60 Tage Daten auf einer einzelnen Seite an, so dass ich die Zeitperiode, in der ich lade, zusammen mit der Schleife für versc...
02.03.2014, 08:10