konvertiere python xgboost dMatrix in numpy ndarray oder pandas DataFrame

Question

konvertiere python xgboost dMatrix in numpy ndarray oder pandas DataFrame

8

Ich folge einem xgboost-Beispiel auf ihrem Hauptgit at - Ссылка

In diesem Beispiel lesen sie Dateien direkt in dMatrix -

%Vor%

Ich habe auf dMatrix code geschaut, es scheint, dass es keinen Weg gibt, kurz zu untersuchen, wie die Daten strukturiert sind - wie wir es normalerweise bei Pandas mit pandas.DataFrame.head()

tun

in xgboost Dokumentation erwähnt, dass wir numpy.ndarray in xgboost.dMatrix konvertieren können - können wir es irgendwie zurück konvertieren - von xgboost.dMatrix nach numpy.ndarray , oder vielleicht pandas dataFrame? Ich sehe keinen möglichen Weg aus ihrem Code - aber vielleicht kennt jemand einen Weg?

Oder gibt es eine Möglichkeit, kurz zu sehen, wie Daten in xgboost.dMatrix aussehen?

Vielen Dank im Voraus, Howard

python numpy pandas xgboost

howard 18.05.2016, 20:03

quelle

2 Antworten

Tags und Links python numpy pandas xgboost

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Verwendung von Angular 2 mit VS2015 Update 2 - Fehler bei npm - nicht installiert

score 1 · Answer 1

Howard,

Ich glaube, dass die xgb.DMatrix das LIBSVM Datenformat übernimmt. Sie können diese Daten in eine spärliche CSR-Matrix scikit der load_svmlight_file erhalten: Ссылка .

Sie können dann die Antwortvariable und die Eigenschaften Partition mit dem Beispiel am unteren Rand der Seite.

score 1 · Answer 2

1

Um die Antwort von @ jcaines genauer zu erläutern, können Sie sklearn verwenden, um die Dateien zu laden und sie dann in normale numplige Arrays umzuwandeln:

%Vor%

Ich habe noch keinen Weg gefunden, direkt von dMatrix in numplige Arrays zu konvertieren.

Peter 04.11.2016 19:20

quelle