Wie erzeuge ich N-Gramm in Scala?

7

Ich versuche den dissoziierten Druckalgorithmus basierend auf N-Gramm in scala zu kodieren. So generieren Sie ein N-Gramm für große Dateien: Zum Beispiel für die Datei, die "die Biene ist die Biene der Bienen" enthält.

  1. Zuerst muss es ein zufälliges N-Gramm auswählen. Zum Beispiel die Biene.
  2. Dann muss es nach N-Grammen suchen, beginnend mit (n-1) Worten. Zum Beispiel, Biene von.
  3. es druckt das letzte Wort dieses N-Gramms. Dann wiederholt sich.

Können Sie mir bitte ein paar Tipps geben, wie es geht? Entschuldigen Sie die Unannehmlichkeiten.

    
user1002579 24.11.2011, 14:55
quelle

3 Antworten

13

Ihre Fragen könnten etwas genauer sein, aber hier ist mein Versuch.

%Vor%     
peri4n 24.11.2011 15:08
quelle
4

Sie können dies mit einem Parameter von n

versuchen %Vor%     
tuxdna 24.05.2013 09:58
quelle
2

Hier ist ein Stream-basierter Ansatz. Dies erfordert nicht zu viel Speicher beim Berechnen von N-Grammen.

%Vor%

AUSGABE:

%Vor%     
tuxdna 17.12.2013 12:48
quelle

Tags und Links