Wie skalierbar sind automatische Sekundärindizes in Cassandra 0.7?

8

Soweit ich weiß, werden für die lokalen Daten der Knoten automatische Sekundärindizes generiert.

In diesem Fall beinhalten die Abfragen nach sekundärem Index alle Knoten, die einen Teil der Spaltenfamilie speichern, um Ergebnisse (?) zu erhalten. Wenn also die Daten über 50 Knoten verteilt sind, dann sind 50 Knoten an einer einzelnen Abfrage beteiligt?

Wie weit kann das skalieren? Ist dies skalierbarer als manuelle Sekundärindizes (invertierte Indexspaltenfamilie)? Wenige Knoten oder hundert Knoten?

    
jlmfao 21.02.2011, 16:10
quelle

2 Antworten

5

Siehe Stus Antwort von der ml Ссылка

    
Schildmeijer 23.02.2011, 10:31
quelle
1

Ja, wenn Sie alle indizierten Zeilen abrufen müssen, beziehen sich die Indexabfragen auf alle Knoten. Aber das ist tatsächlich effizienter, als einen eigenen Index zu erstellen! Details hier.

Wenn Sie jedoch nur ein paar Zeilen suchen und jeder Indexeintrag sehr vielen Zeilen zugeordnet ist, ist es wahrscheinlich, dass der erste Knoten Ihre Frage beantworten kann. Ihre Abfrage umfasst dann nur einen Knoten. Aus der Apache-Mailingliste:

  

Der erste Knoten kann die Frage so lange beantworten, wie Sie es angefordert haben   weniger Zeilen als der erste Knoten darauf hat. Daher die "niedrige Kardinalität"   zeigen Sie in dem, was Sie zitiert haben.

(von Jonathan Ellis, hier .)

(Ich habe auch eine Frage auf der Mailingliste gestellt, eine Nachfolgefrage zu Ihrer Frage, Inquisitor , weil ich die Antwort auf Ihre Frage nicht wirklich verstanden habe (verlinkt in Schildmeijers Antwort). )

    
KajMagnus 06.09.2011 09:52
quelle