Ich versuche, die erste und dritte Spalte von dieser Datentabelle <td>
-Tag. In jedem Fall war alles, was ich herausbekommen konnte, eine Liste der Spalte mit den Tags. Aber ich will nur den Text.
table
ist bereits eine Liste, daher kann ich findAll(text=True)
nicht verwenden. Ich bin nicht sicher, wie man die Auflistung der ersten Spalte in einer anderen Form erhält.
Sie können diesen Code ausprobieren:
%Vor%Wie Sie sehen können, verbindet sich der Code einfach mit der URL und ruft den HTML-Code ab, und die BeautifulSoup-Datei findet die erste Tabelle, dann alle 'tr' und wählt die erste Spalte aus, die die 'th' und die dritte Spalte ist , das ist ein 'td'.
Zusätzlich zu @ jonhkrs Antwort dachte ich, ich würde eine alternative Lösung posten, die mir einfiel.
%Vor%Im Gegensatz zu jonhkrs Antwort, die sich in die Webseite einwählt, geht meins davon aus, dass Sie sie auf Ihrem Computer speichern und als Befehlszeilenargument übergeben. Zum Beispiel:
%Vor%Tags und Links python beautifulsoup html-parsing