machine-learning

___ tag123machineelearning ___ Implementierungsfragen zu Algorithmen des maschinellen Lernens. Allgemeine Fragen zum maschinellen Lernen sollten in ihren jeweiligen Communities veröffentlicht werden. ___ qstnhdr ___ Ein mehrschichtiges Perzeptron-Netzwerk verstehen ___ tag123neuralnetwork ___ Netzwerkstruktur inspiriert von vereinfachten Modellen biologischer Neuronen (Gehirnzellen). Neuronale Netze werden trainiert, um durch überwachte und unbeaufsichtigte Techniken zu "lernen" und können verwendet werden, um Optimierungsprobleme, Approximationsprobleme, Klassifikationsmuster und Kombinationen davon zu lösen. ___ qstntxt ___

Ich versuche zu verstehen, wie man einen Multilayer trainiert; Ich habe jedoch einige Schwierigkeiten herauszufinden, wie man eine geeignete Netzwerkarchitektur - d. h. die Anzahl der Knoten / Neuronen in jeder Schicht des Netzwerks - ermittelt.

Für eine bestimmte Aufgabe habe ich vier Eingabequellen, die jeweils einen von drei Zuständen eingeben können. Ich denke, das würde bedeuten, dass vier Input-Neuronen entweder 0, 1 oder 2 feuern würden, aber so weit ich es gesagt habe, sollte die Eingabe binär gehalten werden?

Außerdem habe ich Probleme bei der Auswahl der Neuronenmenge in der versteckten Schicht. Alle Kommentare wären großartig.

Danke.

    
___ answer2708040 ___

Die Bestimmung einer akzeptablen Netzwerkstruktur für ein mehrschichtiges Perzeptron ist eigentlich unkompliziert.

  1. Eingabeebene : Wie viele Features / Dimensionen sind enthalten? Ihre Daten - dh wie viele Spalten in jede Datenzeile. Fügen Sie einen hinzu (für der Bias - Knoten) und das ist die Anzahl der Knoten für die erste (Eingabe Ebene).

  2. Ausgabeschicht : Wird Ihr MLP in 'Maschine' ausgeführt? Modus oder Regressionsmodus ('Regression' hier in der maschinelles Lernen statt statistischer Sinn) - dh tut mein MLP Gibt eine Klassenbezeichnung oder eine vorhergesagte zurück Wert? Wenn letzteres, dann dein Die Ausgabeschicht hat einen einzelnen Knoten. Ob Erstere, dann Ihre Ausgabeschicht hat die gleiche Anzahl von Knoten wie Klassenlabels. Zum Beispiel, wenn der Ergebnis, das Sie wollen, ist jedes zu beschriften Instanz als entweder "Betrug" oder "nicht Betrug ", das sind zwei Klassenlabels, Daher zwei Knoten in Ihrer Ausgabe Ebene.

  3. Ausgeblendete Ebene (n) : Zwischen diesen beiden (Eingabe und Output) sind offensichtlich die versteckten Lagen. Beginnen Sie immer mit einem einzigen versteckte Ebene. Also wie viele Knoten? Hier ist eine Faustregel: Legen Sie die (ursprüngliche) Größe der ausgeblendeten Ebene auf eine bestimmte Anzahl von Knoten fest, die nur geringfügig größer als die Anzahl der Knoten in der Eingabeebene ist. Verglichen mit weniger Knoten als der Eingabeschicht hilft diese Überkapazität, Ihre numerische Optimierungsroutine (z. B. Gradientenabstieg) zu konvergieren.

Beginnen Sie zusammen mit drei Schichten für Ihre Netzwerkarchitektur; Die Größen der ersten (Eingabe) und letzten (Ausgabe werden durch Ihre Daten bzw. durch Ihren Modellentwurf festgelegt. Eine verborgene Ebene, die gerade etwas größer als die Eingabeebene ist, ist fast immer ein gutes Design, um zu beginnen.

In Ihrem Fall wäre eine geeignete Netzwerkstruktur:

Eingabeschicht : 5 Knoten - & gt; versteckte Ebene : 7 Knoten - & gt; Ausgabeschicht : 3 Knoten

    
___ answer2747813 ___

Ich stimme Dougs Antwort oben in einigen Punkten nicht zu.

Sie haben 4 diskrete (3-Wege kategoriale) Eingänge. Sie sollten (sofern Sie keinen starken Grund dafür haben) dies als 12 Binäreingänge darstellen, die eine 1-aus-3-Codierung für jeden Ihrer vier konzeptionellen Eingänge verwenden. Wenn Sie also [2,0,1,1] eingeben, sollte Ihr Netzwerk Folgendes erhalten: 0 0 1 1 0 0 0 1 0 0 1 0 Wenn Ihre Netzwerkimplementierung einen manuellen Bias erfordert, sollten Sie ein weiteres Always-On-Bit für den Bias hinzufügen, aber die meisten sinnvollen neuronalen Netzimplementierungen erfordern dies nicht.

Probiere ein paar verschiedene Zahlen von versteckten Einheiten aus. Sie müssen sich nicht auf eine versteckte Layer-Größe beschränken, die kleiner ist als die Eingabe-Layer-Größe, aber wenn Sie es größer machen, sollten Sie darauf achten, dass Sie Ihre Gewichtungen normalisieren, vielleicht mit L2- oder L1-Gewicht-Verfall und vielleicht sogar früher Stopps im Training (stoppe das Training, wenn dein Fehler in einem ausgehaltenen Validierungssatz aufhört sich zu verbessern).

    
___ tag123deeplearning ___ Deep Learning ist ein Bereich des maschinellen Lernens, dessen Ziel es ist, komplexe Funktionen mit speziellen neuronalen Netzwerkarchitekturen zu erlernen, die "tief" sind (aus vielen Schichten bestehen). Dieses Tag sollte für Fragen zur Implementierung von Deep-Learning-Architekturen verwendet werden. Allgemeine Fragen zum maschinellen Lernen sollten mit "maschinelles Lernen" gekennzeichnet werden. Eine Markierung für die relevante Softwarebibliothek (z. B. "keras" oder "tensorflow") ist hilfreich. ___
2
Antworten

Einzelne Instanz in Weka klassifizieren

Ich trainierte und kreierte ein J48 Modell mit WEKA gui. Ich habe die Modelldatei auf meinem Computer gespeichert und möchte sie jetzt dazu verwenden, eine einzelne Instanz in meinem Java-Code zu klassifizieren. Ich möchte eine Vorhersage für da...
23.10.2012, 11:07
1
Antwort

Beispiel für die Implementierung von Baum-Welch

Ich versuche, etwas über den Baum-Welch-Algorithmus zu lernen (mit einem versteckten Markov-Modell). Ich verstehe die grundlegende Theorie von Vorwärts-Rückwärts-Modellen, aber es wäre schön, wenn jemand mit etwas Code dazu beitragen würde, es z...
31.10.2011, 19:35
2
Antworten

Kann jemand Künstliche Neuronale Netze erklären? [geschlossen]

Laut Wikipedia (was eine schlechte Quelle ist, weiß ich) Ein neuronales Netzwerk besteht aus Eine Eingabeschicht von A-Neuronen Mehrere (B) verborgene Schichten, die jeweils aus C-Neuronen bestehen. Eine Ausgabeschicht von "D" Neu...
04.03.2012, 20:09
3
Antworten

Wie werden sowohl binäre als auch kontinuierliche Features im k-Nearest-Neighbor-Algorithmus verwendet?

Mein Feature-Vektor hat sowohl kontinuierliche (oder weit reichende) als auch binäre Komponenten. Wenn ich einfach die euklidische Distanz verwende, haben die kontinuierlichen Komponenten eine viel größere Auswirkung: Symmetrisch gegenüber as...
30.11.2010, 14:38
2
Antworten

Ist das POS-Tagging deterministisch?

Ich habe versucht, meinen Kopf darum zu drehen, warum das passiert, aber ich hoffe, dass jemand etwas Licht in diese Sache bringen kann. Ich versuche, den folgenden Text zu markieren: %Vor% mit dem folgenden Code: %Vor% und bekomme folge...
30.06.2011, 21:11
1
Antwort

Clustering und Matlab

Ich versuche einige Daten zu sammeln, die ich aus dem KDD 1999 Cup-Datensatz habe Die Ausgabe aus der Datei sieht folgendermaßen aus: %Vor% mit 48 tausend verschiedenen Datensätzen in diesem Format. Ich habe die Daten aufgeräumt und den T...
10.10.2011, 16:34
1
Antwort

Trainieren Sie den Klassifikator für mehrere Klassen in Keras

Ich habe ein Tutorial verfolgt, um einen Klassifikator mit Keras zu trainieren. Ссылка Aus dem zweiten Skript des Autors wollte ich das Skript in ein Skript umwandeln, das trainiert werden kann Mehrklassen-Klassifikator (war eine Binär...
24.01.2017, 08:12
2
Antworten

Fehler in do_one (nmeth): NA / NaN / Inf beim Aufruf einer fremden Funktion (arg 1)

Ich habe eine Datentabelle ("norm"), die numerisch enthält - zumindest was ich sehen kann - normalisierte Werte der folgenden Form: Wenn ich ausführe %Vor% Ich erhalte den folgenden Fehler: %Vor% Können Sie mir helfen? Danke!    ...
07.04.2016, 07:40
1
Antwort

TensorFlow: Lädt tf.train.batch automatisch den nächsten Stapel, wenn der Stapel das Training beendet hat?

Zum Beispiel, nachdem ich meine Operationen erstellt, die Batch-Daten durch die Operation gefüttert und die Operation ausgeführt habe, fügt tf.train.batch automatisch einen weiteren Batch von Daten in die Session ein? Ich frage das, weil tf.t...
16.01.2017, 10:09
4
Antworten

Scikit: Berechnung der Präzision und des Recalls mit der Funktion cross_val_score

Ich benutze Scikit, um eine logistische Regression auf Spam / Ham-Daten durchzuführen. X_train ist meine Trainingsdaten und y_train die Etiketten ('spam' oder 'ham') und ich habe meine LogisticRegression so trainiert: %Vor% Wenn ich die Gena...
08.12.2014, 11:34