Extrahieren ausgewählter Spalten aus einer Tabelle mit BeautifulSoup

8

Ich versuche, die erste und dritte Spalte von dieser Datentabelle <th> -Tag. Die andere Spalte von Interesse hat als <td> -Tag. In jedem Fall war alles, was ich herausbekommen konnte, eine Liste der Spalte mit den Tags. Aber ich will nur den Text.

table ist bereits eine Liste, daher kann ich findAll(text=True) nicht verwenden. Ich bin nicht sicher, wie man die Auflistung der ersten Spalte in einer anderen Form erhält.

%Vor%     
mac389 25.10.2012, 18:08
quelle

3 Antworten

23

Sie können diesen Code ausprobieren:

%Vor%

Wie Sie sehen können, verbindet sich der Code einfach mit der URL und ruft den HTML-Code ab, und die BeautifulSoup-Datei findet die erste Tabelle, dann alle 'tr' und wählt die erste Spalte aus, die die 'th' und die dritte Spalte ist , das ist ein 'td'.

    
jonhkr 25.10.2012, 18:30
quelle
3

Zusätzlich zu @ jonhkrs Antwort dachte ich, ich würde eine alternative Lösung posten, die mir einfiel.

%Vor%

Im Gegensatz zu jonhkrs Antwort, die sich in die Webseite einwählt, geht meins davon aus, dass Sie sie auf Ihrem Computer speichern und als Befehlszeilenargument übergeben. Zum Beispiel:

%Vor%     
mac389 25.10.2012 18:42
quelle
0

Sie können diesen Code auch ausprobieren

%Vor%     
KUSHA B K 02.12.2017 09:26
quelle