word-count

Die Wortzahl ist die Anzahl der Wörter in einem Dokument oder einer Textpassage.
4
Antworten

Sortierte Wortzählung mit Hadoop MapReduce

Ich bin sehr neu in MapReduce und habe ein Hadoop-Wortzählbeispiel abgeschlossen. In diesem Beispiel wird eine unsortierte Datei (mit Schlüssel / Wert-Paaren) der Wortanzahl erstellt. Also ist es möglich, es nach der Anzahl der Wortvorkommen...
31.03.2010, 05:54
2
Antworten

So erstellen Sie eine saubere Wortwolke mit pytagcloud ohne ein überfülltes Bild - Python

In einer vorherigen Frage, Ich fragte die Gemeinde, wie man die Häufigkeit der jeweils zwei aufeinander folgenden Wörter in einem Satz zählt, und ich bekam eine großartige Antwort! jetzt versuche ich, aus den Ergebnissen eine Wortwolke mit dem...
24.09.2013, 06:28
2
Antworten

Ausnahme im Thread "main" java.lang.ClassNotFoundException: WordCount

Ich möchte derzeit einen einzelnen Instanzknoten von Hadoop erstellen. Also folge ich diesem Tutorial . Ich habe den folgenden Befehl im Terminal ausgeführt: %Vor% Die Dinge liefen gut, bis ich auf diesen Fehler stieß: %Vor% Ich versuch...
13.09.2013, 22:55
4
Antworten

___ answer26097064 ___

Sie benutzen das Zeug richtig.

Link Während Sie Ihren aktuellen Code ausführen, ist die Ausgabe wie

%Vor%

Warum ist das so, weil

?

Sie geben zwei Schlüssel / Wert-Paare aus.

Erstes Schlüssel / Wert-Paar ist Wert und das zweite Schlüssel-Wert-Paar ist Schlüsseltaste

was ist die richtige? Wert ist 10 und der Schlüssel ist 1

%Vor%     
Verwenden Sie KeyValueTextInputFormat ___ answer23907054 ___

Das Trennzeichen kann unter dem Attributnamen %code% angegeben werden. Das Standardtrennzeichen ist das Registerzeichen %code% . Ändern Sie also in Ihrem Fall die Zeile %code%
zu

%Vor%

und das sollte den Trick machen

    
___ tag123hadoop ___ Hadoop ist ein Apache-Open-Source-Projekt, das Software für zuverlässiges und skalierbares verteiltes Computing bereitstellt. Das Projekt selbst enthält eine Vielzahl anderer ergänzender Ergänzungen. ___ tag123java ___ Java (nicht zu verwechseln mit JavaScript oder JScript oder JS) ist eine universelle objektorientierte Programmiersprache, die für die Verwendung in Verbindung mit der Java Virtual Machine (JVM) entwickelt wurde. "Java-Plattform" ist der Name für ein Computersystem, auf dem Tools zum Entwickeln und Ausführen von Java-Programmen installiert sind. Verwenden Sie dieses Tag für Fragen, die sich auf die Java-Programmiersprache oder Java-Plattform-Tools beziehen. ___ answer21348898 ___

Ich habe gerade versucht, dass %code% Schlüssel und Werte genommen wird, wenn sie eine Registerkarte zwischen ihnen haben, sonst wird es die komplette Zeile als Schlüssel nehmen, und es wird nichts im Wert sein.

Also müssen wir %code% anstelle von %code%

verwenden     
___ tag123mapreduce ___ MapReduce ist ein Algorithmus zur Verarbeitung großer Datasets zu bestimmten Arten von verteilbaren Problemen unter Verwendung einer großen Anzahl von Knoten ___ answer12564836 ___

Die Eingabedatei wird in Schlüsselwertpaare konvertiert und die Kartenfunktion wird für alle diese Paare aufgerufen. Im Falle Ihres Beispiels ist die Eingabe für die Zuordnung ein Schlüssel (der wahrscheinlich 1 ist, da es die Zeilennummer in der Datei ist) und am wichtigsten ist Ihr Wert 1,10 10.

Nun können Sie alles aus Ihrem Mapper ausgeben, das erst nach dem Tauschen und Sortieren aller Ausgaben aus dem Mapper zur Reducer-Klasse der Reducer-Klasse geht.

Wenn Sie also context.write (value) von Ihrem Mapper und von Ihrem Reducer ausgeben, erhalten Sie eindeutige Zeilen aus all Ihren Dateien.

Ich glaube nicht, dass ich erklärt habe, was Sie wollen, aber das ist die grundlegende Sache, die in Hadoop Map-Reduce passiert.

    
___ tag123wordcount ___ Die Wortzahl ist die Anzahl der Wörter in einem Dokument oder einer Textpassage. ___ qstntxt ___

Ich benutze hadoop 1.0.1, um ein Projekt zu machen und ich möchte meine Eingabe .txt-Datei zum "Schlüssel" machen und "Wert" den ich brauche, wie:

Wenn ich eine %code% Datei habe und der Dateiinhalt ist

  

1, 10 10

Ich denke, ich kann "KeyValueTextInputFormat" verwenden und mache "," das Trennungssymbol. Nach der Eingabe ist der Schlüssel "1" und der value ist "10 10" .

Aber das Ergebnis, das ich bekommen habe, ist die ganze Information ist der Schlüssel, der Wert ist leer. Ich weiß nicht, wo das Problem ist.

Bitte geben Sie mir Hilfe, danke!

Dies ist der Beispielcode:

%Vor%     
___

Ich benutze hadoop 1.0.1, um ein Projekt zu machen und ich möchte meine Eingabe .txt-Datei zum "Schlüssel" machen und "Wert" den ich brauche, wie: Wenn ich eine test.txt Datei habe und der Dateiinhalt ist    1, 10 10 Ich denke, ich...
22.09.2012, 02:12
8
Antworten

Wie können wir ein Array dynamisch zuweisen und erweitern?

Ich arbeite an einem Projekt, aber ich kann keine vorhandenen Java-Datenstrukturen (zB ArrayList, Bäume, usw.) verwenden Ich kann nur Arrays verwenden. Daher muss ich ein Array dynamisch mit neuem Speicher aktualisieren. Ich lese aus einer...
12.02.2013, 16:29