text-processing

Mechanisierung der Erstellung oder Manipulation von elektronischem Text.
1
Antwort

Extrahiert Emoticons aus einem Text

Ich muss Text Emoticons aus einem Text mit Python extrahieren und ich habe nach einigen Lösungen gesucht, aber die meisten von ihnen mögen dies oder dies deckt nur ab einfache Emoticons. Ich muss alle analysieren. Momentan verwende ich...
21.05.2015, 10:22
1
Antwort

Python: PyEnchant und 64-Bit-Python

Ich mache Textverarbeitung. Ich brauche die PyEnchant-Bibliothek, um zu überprüfen, ob ein bestimmtes Wort im Text ein gültiges englisches Wort ist. Es ist jedoch nur für die 32-Bit-Installation von Python verfügbar. Ich benötige das 64-Bit-Pyth...
21.12.2012, 20:55
7
Antworten

sed, wie die ersten 17 Zeilen und die letzten 8 Zeilen in einer Datei gelöscht werden

Ich habe eine große Datei 150GB CSV-Datei und ich möchte die ersten 17 Zeilen und die letzten 8 Zeilen entfernen. Ich habe folgendes versucht, scheint aber nicht richtig zu funktionieren %Vor% und %Vor% Ich frage mich, ob jemand mit sed...
07.02.2013, 13:32
7
Antworten

Konvertieren einer Unicode-Zeichenkette in ASCII

Nachdem ich alles über iconv und Encoding gelesen habe, bin ich immer noch verwirrt. Ich kratze die Quelle eines Webseite Ich habe eine Zeichenfolge, die folgendermaßen aussieht: 'pretty\u003D\u003Ebig' (wird in der R-Konsole als...
20.07.2013, 11:39
2
Antworten

Zusammenfassung der Textverdichtung - BLEU vs ROUGE

Mit den Ergebnissen von zwei verschiedenen Zusammenfassungssystemen (sys1 und sys2) und den gleichen Referenzzusammenfassungen habe ich sie sowohl mit BLEU als auch mit ROUGE ausgewertet. Das Problem ist: Alle ROUGE-Werte von sys1 waren höher al...
27.06.2016, 03:02
4
Antworten

Importieren von schlecht formatierten Daten in einer Textdatei in R

Download eines Datenstapels von einer hasserfüllten lokalen Regierungsseite. Es gibt 77.000 Einträge von Elementen, die in einer einfachen Textdatei genau wie folgt aussehen. Ich muss diesen Dunghaufen als Datenrahmen in R importieren: %Vor%...
09.03.2016, 19:35
2
Antworten

Löschen der letzten Zeile einer Datei mit Java

Ich habe eine .txt Datei, die ich in Java verarbeiten möchte. Ich möchte die letzte Zeile löschen. Ich brauche Ideen, wie ich das erreichen kann, ohne den gesamten Inhalt in eine andere Datei kopieren und die letzte Zeile ignorieren zu müs...
05.02.2012, 13:32
2
Antworten

Wie verbessert man die Textverarbeitungsleistung in Clojure?

Ich schreibe eine einfache Desktop-Suchmaschine in Clojure, um mehr über die Sprache zu erfahren. Bis jetzt ist die Leistung während der Textverarbeitungsphase meines Programms wirklich schlecht. Während der Textverarbeitung muss ich: Ber...
27.04.2013, 21:23
5
Antworten

Text mehrmals zwischen zwei Strings extrahieren? (awk? sed?)

Ich habe eine Datei namens 'plainlinks', die so aussieht: %Vor% Ich muss eine Ausgabe erzeugen, die wie folgt aussieht: %Vor%     
14.11.2012, 19:40
7
Antworten

Wie wähle ich mehrere Zeilen aus einer Datei oder aus einer Pipe in einem Skript?

Ich hätte gerne ein Skript namens lines.sh , an das ich Daten weiterleiten kann, um eine Reihe von Zeilen auszuwählen. Zum Beispiel, wenn ich folgende Datei hätte: test.txt %Vor% Dann könnte ich rennen: %Vor% und es würde ausg...
16.12.2014, 16:58