Pytables verwenden, was effizienter ist: scipy.sparse oder numpy dichte Matrix?

9

Wenn pytables verwendet wird, gibt es keine Unterstützung (soweit ich das beurteilen kann) für die scipy.sparse -Matrixformate. Um also eine Matrix zu speichern, muss ich etwas konvertieren, z. B.

%Vor%

Das Problem ist, dass die get_sparse -Funktion einige Zeit braucht (vom Datenträger gelesen), und wenn ich es richtig verstehe, müssen auch die Daten in den Speicher passen.

Die einzige andere Option scheint die Matrix in ein dichtes Format zu konvertieren ( numpy array ) und dann pytables normal zu verwenden. Dies scheint jedoch ziemlich ineffizient zu sein, obwohl ich denke, dass pytables sich mit der Komprimierung selbst beschäftigen wird?

    
tdc 17.01.2012, 13:07
quelle

1 Antwort

2

Entlehnung von Speicherung von numpy spärlich Matrix in HDF5 (PyTables) Sie können ein scipy.sparse -Array mit den Attributen data , indicies und indptr , die drei reguläre numpy.ndarray -Objekte sind, in ein pytables-Format marshalieren.

    
IanSR 23.01.2014 20:54
quelle