Ich möchte eine Textmanipulationssprache lernen und habe mich auf Python eingestellt. Neben der Textbearbeitung wird Python auch für numerische Anwendungen, maschinelles Lernen, KI usw. eingesetzt.
Meine Frage ist, wie ich mich dem Erlernen der Python-Sprache annähere, damit ich schnell anspruchsvolle Textmanipulationsprogramme schreiben kann. Abgesehen von regulären Ausdrücken im Zusammenhang mit "Textmanipulation" sind die Sprachmerkmale wichtiger als andere, welche Module nützlich sind und so weiter.
Über regulären Ausdrücken hinaus sind hier einige wichtige Eigenschaften:
Für Werkzeuge empfehle ich Folgendes:
Whoosh , eine reine Python-Suchmaschine, die Ihnen einige praktische Beispiele für das Parsen von Text mit pysparsing und Textverarbeitung in Python im Allgemeinen.
Ned Batcheldors nette Rezensionen verschiedener Python-Parsing-Tools .
Docutils Quellcode für erweiterte Textverarbeitung in Python, einschließlich eines ausgeklügelten Zustandsautomaten.
Bearbeiten: Gute Links zur Textverarbeitung in Python:
Es gibt ein Buch Textverarbeitung in Python . Ich habe es selbst noch nicht gelesen, aber ich habe andere Artikel dieses Autors gelesen und im Allgemeinen sind sie ein gutes Personal.
Ich fand die Objekte .__ doc__ und dir (obj) Befehle unglaublich nützlich beim Erlernen der Sprache.
z.B.
%Vor%Was kann ich mit einem tun? dir (a). Scheint, ich kann ein teilen.
%Vor%Was ist vec? vec .__ doc __:
"neue Liste initialisiert aus den Elementen der Sequenz"
Was kann ich mit vec tun? Dir (Vec).
%Vor%usw. ...
Obwohl ich nicht gelesen habe, Python für die Datenanalyse von Wes McKinney - 1 Ausgabe (8. Oktober 2012) sieht vielversprechend aus.