Ich habe folgende Daten:
%Vor%Die PDF-Datei, aus der Daten extrahiert werden sollen, sieht folgendermaßen aus:
%Vor%Ich möchte es verarbeiten und eine .csv damit erstellen, damit ich es in einem Datenrahmen speichern und damit analysieren kann. Ich weiß nicht, wie ich es reinigen könnte.
Ich habe versucht mit:
%Vor%Dennoch sollte ich von der Marke MotorCycle trennen und sie in einen Datenrahmen umwandeln. Vielleicht gibt es bessere Ansätze als die, die ich benutze.
Beim Extrahieren der Daten im HTML-Format bekomme ich:
%Vor%