Fehler erhalten "(tiefgestellt) logischer Index zu lang" beim Training von SVM aus E1071 Paket in R

8

Ich trainiere SVM mit meinen Traindata. (e1071 Paket in R). Im Folgenden finden Sie Informationen zu meinen Daten.

%Vor%

Ich trainiere es wie folgt.

%Vor%

Kein Problem hier. Aber wenn ich vorhersage als:

%Vor%

Ich erhalte den folgenden Fehler:

%Vor%

Ich habe auch versucht, den Ticket-Prädiktor sowohl von den Zug- als auch von den Testdaten zu entfernen. Aber immer noch der selbe Fehler. Was ist das Problem?

    
Ayush Raj Singh 14.06.2013, 13:07
quelle

3 Antworten

14

Es kann einen Unterschied in der Anzahl der Ebenen in einem der Faktoren in 'test' geben.

Führen Sie str (test) aus und überprüfen Sie, ob die Faktorvariablen die gleichen Werte wie die entsprechenden Variablen im Datensatz 'train' haben.

dh das Beispiel unten zeigt mein.test $ foo hat nur 4 Ebenen .....

%Vor%     
DataMania 27.06.2013 02:35
quelle
2

Das sind die richtigen Zugdaten, die 2 Leerzeichen enthalten. Aus diesem Grund gibt es einen zusätzlichen kategorischen Wert für Leerzeichen und Sie erhalten diesen Fehler

$ Eingebettet: Faktor mit 4 Stufen "", "C", "Q", "S": 4 2 4 4 4 3 4 4 4 2 ...

Der erste ist leer

    
user2378089 07.07.2013 18:57
quelle
0

Ich habe auch mit diesem Datensatz gespielt. Ich weiß, dass dies schon lange her ist, aber eines der Dinge, die Sie tun können, ist, explizit nur die Spalten einzubeziehen, die Sie dem Modell hinzufügen möchten, wie zum Beispiel:

%Vor%

Das hat das Problem für mich beseitigt, indem Spalten eliminiert wurden, die nichts beitragen (wie Ticketnummer), die keine relevanten Daten haben.

    
sconfluentus 30.10.2016 04:37
quelle

Tags und Links