Google Cloud Bigtable Haltbarkeit / Verfügbarkeit Garantien

8

Ich möchte, dass jemand von Google einige Richtlinien zu den Haltbarkeits- und Verfügbarkeitsgarantien des Cloud Bigtable -Diensts bereitstellt .

Hier ist mein bisheriges Verständnis:

  • Die Tatsache, dass der minimale Cluster 3 Knoten erfordert, legt nahe, dass die Daten zumindest innerhalb einer Zone sehr dauerhaft sind und auf 3 Knoten repliziert werden.

  • Allerdings diese Antwort Von einem Google-Mitarbeiter heißt es, dass "Cloud Bigtable keine Daten repliziert". Dies widerspricht direkt dem Zitat auf der Cloud Bigtable-Startseite behauptet, dass es "mit einer replizierten Speicherstrategie gebaut wurde". Also was ist es? Ist es repliziert oder nicht? Und wenn ja, wie viele Kopien werden aufbewahrt?

  • Die Tatsache, dass Cluster nur innerhalb einer bestimmten Zone eingerichtet werden können, legt nahe, dass die Verfügbarkeit eines Clusters direkt mit der Verfügbarkeit dieser Zone verknüpft ist. Wenn ich also einen hoch verfügbaren Bigtable-basierten Datenspeicher haben möchte, wäre es die beste Vorgehensweise, unabhängige Cluster über mehrere Zonen hinweg einzurichten und die Synchronisation von Schreibvorgängen über die Cluster hinweg selbst durchzuführen?

Es gibt keine Informationen darüber, ob Bigtable-Cluster über Zonen unabhängig sind oder nicht. Wenn ich Cluster über mehrere Zonen aufstellen würde und eine Zone ausfällt, könnten wir erwarten, dass die Cluster in anderen Zonen weiter funktionieren? Oder gibt es einen zugrunde liegenden Single Point of Failure, der Cluster auch über Zonengrenzen hinweg beeinflussen könnte?

Verglichen mit dem App Engine-Datenspeicher, der sehr spezifisch in Bezug auf diese Details ist, fehlt die Cloud Bigtable-Dokumentation - oder zumindest habe ich keine Seite gefunden, die auf diese Aspekte eingeht.

>

Die Cloud Bigtable-Dokumente sind in Bezug auf andere Aspekte ähnlich vage, z. In Bezug auf Größenbeschränkungen für Werte gibt die Dokumentation an, dass einzelne Werte unter "~" bleiben sollten 10 MB pro Zelle ". Was in aller Welt bedeutet "~ 10 MB" ?! Kann ich ein Limit von genau 10 MB fest codieren und erwarte, dass es immer funktioniert oder wird sich das von Tag zu Tag ändern, abhängig von unbekannten Faktoren?

Wie auch immer, Entschuldigung, wenn ich aufgeregt rufe. Ich würde wirklich gerne den Bigtable-Service nutzen. Aber ich, wie vermutlich viele andere, muss die Aspekte der Dauerhaftigkeit / Verfügbarkeit verstehen, bevor ich in sie investieren kann. Danke.

    
Tav 10.06.2015, 13:18
quelle

1 Antwort

9

Bei der Replikation: Die Antwort, auf die Sie verwiesen haben, bezieht sich auf die Replikation von Daten über Bigtable Cluster, die derzeit nicht unterstützt wird. (Zum Beispiel ein Bigtable-Cluster in den Vereinigten Staaten, der seine Schreibvorgänge in einem zweiten Cluster in Europa repliziert)

Dieses Konzept unterscheidet sich von der Replikation von Daten innerhalb eines Bigtable-Clusters, die analog zur Replikation in HDFS ist, was das Produkt heute absolut tut.

Nach Verfügbarkeit: Ja, die Verfügbarkeit eines Bigtable-Clusters ist an die Verfügbarkeit einer Google Cloud Zone gebunden.

Bei Unabhängigkeit: Ja, Cloud Bigtable-Cluster sind über Zonen hinweg unabhängig. Ein Ausfall in einer Zone sollte die Verfügbarkeit anderer Zonen nicht beeinträchtigen.

Daten pro Zelle: Wir lehnen keine Schreibvorgänge & gt; 10 MB pro Zelle ab, wir haben dies als Richtlinie für eine optimale Leistung festgelegt.

    
Max 10.06.2015, 16:25
quelle