konvertiere python xgboost dMatrix in numpy ndarray oder pandas DataFrame

8

Ich folge einem xgboost-Beispiel auf ihrem Hauptgit at - Ссылка

In diesem Beispiel lesen sie Dateien direkt in dMatrix -

%Vor%

Ich habe auf dMatrix code geschaut, es scheint, dass es keinen Weg gibt, kurz zu untersuchen, wie die Daten strukturiert sind - wie wir es normalerweise bei Pandas mit pandas.DataFrame.head()

tun

in xgboost Dokumentation erwähnt, dass wir numpy.ndarray in xgboost.dMatrix konvertieren können - können wir es irgendwie zurück konvertieren - von xgboost.dMatrix nach numpy.ndarray , oder vielleicht pandas dataFrame? Ich sehe keinen möglichen Weg aus ihrem Code - aber vielleicht kennt jemand einen Weg?

Oder gibt es eine Möglichkeit, kurz zu sehen, wie Daten in xgboost.dMatrix aussehen?

Vielen Dank im Voraus, Howard

    
howard 18.05.2016, 20:03
quelle

2 Antworten

1

Howard,

Ich glaube, dass die xgb.DMatrix das LIBSVM Datenformat übernimmt. Sie können diese Daten in eine spärliche CSR-Matrix scikit der load_svmlight_file erhalten: Ссылка .

Sie können dann die Antwortvariable und die Eigenschaften Partition mit dem Beispiel am unteren Rand der Seite.

    
jcaine 01.06.2016 16:36
quelle
1

Um die Antwort von @ jcaines genauer zu erläutern, können Sie sklearn verwenden, um die Dateien zu laden und sie dann in normale numplige Arrays umzuwandeln:

%Vor%

Ich habe noch keinen Weg gefunden, direkt von dMatrix in numplige Arrays zu konvertieren.

    
Peter 04.11.2016 19:20
quelle

Tags und Links