Ich trainiere SVM mit meinen Traindata. (e1071 Paket in R). Im Folgenden finden Sie Informationen zu meinen Daten.
%Vor%Ich trainiere es wie folgt.
%Vor%Kein Problem hier. Aber wenn ich vorhersage als:
%Vor%Ich erhalte den folgenden Fehler:
%Vor%Ich habe auch versucht, den Ticket-Prädiktor sowohl von den Zug- als auch von den Testdaten zu entfernen. Aber immer noch der selbe Fehler. Was ist das Problem?
Es kann einen Unterschied in der Anzahl der Ebenen in einem der Faktoren in 'test' geben.
Führen Sie str (test) aus und überprüfen Sie, ob die Faktorvariablen die gleichen Werte wie die entsprechenden Variablen im Datensatz 'train' haben.
dh das Beispiel unten zeigt mein.test $ foo hat nur 4 Ebenen .....
%Vor%Das sind die richtigen Zugdaten, die 2 Leerzeichen enthalten. Aus diesem Grund gibt es einen zusätzlichen kategorischen Wert für Leerzeichen und Sie erhalten diesen Fehler
$ Eingebettet: Faktor mit 4 Stufen "", "C", "Q", "S": 4 2 4 4 4 3 4 4 4 2 ...
Der erste ist leer
Ich habe auch mit diesem Datensatz gespielt. Ich weiß, dass dies schon lange her ist, aber eines der Dinge, die Sie tun können, ist, explizit nur die Spalten einzubeziehen, die Sie dem Modell hinzufügen möchten, wie zum Beispiel:
%Vor%Das hat das Problem für mich beseitigt, indem Spalten eliminiert wurden, die nichts beitragen (wie Ticketnummer), die keine relevanten Daten haben.