Amazon sagt folgendes über Redshift Billing "Die Nutzungsstunden der Knoten werden für jede Stunde in Rechnung gestellt, in der Ihr Data Warehouse-Cluster in einem Verfügbarkeitsstatus ausgeführt wird. Wenn Sie Ihren Data Warehouse-Cluster nicht mehr belasten möchten, müssen Sie ihn beenden, damit keine zusätzlichen Knotenstunden in Rechnung gestellt werden." Das heißt, wenn ich nur einen Cluster erstelle und ihn nutze oder nicht, werde ich rund um die Uhr abgerechnet, weil der Cluster keinen Zustand wie "Suspend" hat. Gibt es eine Möglichkeit, den gesamten Redshift-Server herunterzufahren, wenn er nicht benutzt wird, so dass mir nur die Stunden in Rechnung gestellt werden, wenn ich die Cluster verwenden möchte?
Edit: Mit der Antwort von Tomasz klingt es, als ob ich den Cluster am Wochenende herunterfahren möchte, als würde ich die gesamte Datenbank am Freitagabend sichern und am Sonntagabend wiederherstellen. Das klingt nicht gut. Was bedeutet Amazon wirklich, wenn sie sagen "ZAHLEN SIE NUR FÜR DIE STUNDEN, DIE SIE VERWENDEN"?
Können Sie mir sagen, wie lange es dauert, ein Data Warehouse mit einer Größe von etwa 100 GB zu sichern / wiederherzustellen? Kann ich dem Cluster nach der Wiederherstellung aus dem Java-Code automatisch Sicherheitsgruppen zuordnen?
Sie können einen manuellen Snapshot eines Clusters erstellen, wenn Sie habe die Arbeit beendet und dann den Cluster entfernt.
Sie werden für S3-Speicher bezahlen, aber das ist viel weniger als beim Ausführen von Redshift-Cluster.
Am nächsten Tag wird der Cluster vom letzten Snapshot wiederhergestellt. Sie müssen dem neuen Cluster Sicherheitsgruppen hinzufügen, wahrscheinlich mit JAVA API :
Der neue Cluster wird nur mit der Standardsicherheit verknüpft und Parametergruppen. Wenn der ursprüngliche Cluster einem beliebigen zugeordnet wurde Andere Sicherheit oder Parametergruppe müssen Sie manuell zuordnen diese Gruppen mit dem neuen Cluster.
Die einfachste Methode zum Erstellen eines Snapshots ist die Konsole . aber Sie werden es wahrscheinlich automatisch mit cli oder machen wollen Java SDK .
Das Erstellen eines Snapshots eines 3-Knoten-Clusters, der zu 80% gefüllt war, hat ungefähr 5 Minuten gedauert (es ist so schnell, weil Snapshots inkrementell sind). 100GB ist viel weniger als mein Setup, also sollte es noch schneller sein. Auch die Wiederherstellung sollte nicht lange dauern.
Was bedeutet Amazon wirklich, wenn sie sagen: "ZAHLEN SIE NUR FÜR DIE STUNDEN, DIE SIE VERWENDEN"?
Sie zahlen für die ganze angefangene Stundenstunde.
Können Sie mir sagen, wie lange es dauert, ein Data Warehouse mit einer Größe von etwa 100 GB zu sichern / wiederherzustellen?
Snapshots sind inkrementell und das macht sie schnell (wie Tomasz bereits erwähnt hat). Es ist ziemlich schnell, einen Cluster etwa eine halbe Stunde herunterzufahren. Die Wiederherstellung von einem Snapshot ist jedoch sehr langsam Ich würde ungefähr 3 Stunden für die Wiederherstellung von 100 GB empfehlen.
Wenn Sie wirklich in der Lage sein möchten, einen Datenbank-Cluster schnell hoch- oder runterzufahren, können Sie besser eine andere analytische DB (z. B. Greenplum oder Vertica kostenlose Editionen) mit den auf EBS-Volumes gespeicherten Daten verwenden. Es wäre jedoch viel mehr Arbeit zu bewältigen, das ist der Kompromiss.
Tags und Links amazon-redshift