AppFabric Cache scheint instabil zu sein

8

Wir versuchen, den verteilten AppFabric-Cache zu verwenden. Nach viel Hin und Her mit Nicht-Domänen-Servern haben wir sie schließlich in eine Domäne gebracht und die Installation / Einrichtung war etwas einfacher. Wir haben es auf den Weg gebracht, nachdem wir uns durch eine Menge Fehler gekämpft haben, von denen die meisten trivial sind, wenn sie in AppFabric einen Test oder eine beschreibende Fehlermeldung enthalten. "Temporärer Fehler" erklärt nicht viel ...

Aber es gibt immer noch Probleme.

Wir haben 3 Server eingerichtet, von denen einer "Lead" ist. Wir haben den Cache endlich funktionstüchtig gemacht, und wir haben dies bestätigt, indem wir einen Netzwerklastenausgleich auf jeweils einen Server gelenkt haben, um zu bestätigen, dass wir den Cache auf einem Server einrichten und ihn auf einem anderen Server abrufen können.

Dann habe ich den AppFabric Caching-Dienst auf allen Servern neu gestartet und plötzlich funktioniert es nicht mehr. Get-CacheHost sagt, sie sind auf, aber wir bekommen Ausnahmen wie:

%Vor%

Warum sollte dieser Fehler auftreten, indem Sie einfach die Dienste neu starten?
Ist AppFabric Cache wirklich produktionsbereit?
Was passiert, wenn ein Server offline geht? Lange Timeouts?
Sind wir davon abhängig, dass der "Lead" -Server aktiv ist?

Ich vermute, dass es nach 5-10 Minuten R & amp; R wieder hochfahren wird. Es scheint manchmal von alleine zurückzukommen.

Update: Es ist nach ein paar Minuten gekommen. Wir haben nun getestet, indem wir einen Server aus dem Cluster entfernt haben, was zu einem langen Timeout und schließlich zu einer Ausnahme geführt hat.

    
Tedd Hansen 20.01.2011, 11:32
quelle

1 Antwort

7

Wir haben das schon seit einiger Zeit getestet und ich teile das, was wir bisher gefunden haben.

  • Die Benutzerkontensteuerung unter Windows 2008 blockiert den Zugriff auf den lokalen Computer, sodass Befehle für den lokalen Computer fehlschlagen. Starten Sie PowerShell als Administrator oder deaktivieren Sie die Benutzerkontensteuerung vollständig, um sie zu umgehen.
  • Das manuelle Ändern der Konfigurationsdatei funktioniert nicht. Sie müssen Export- und Importbefehle verwenden.
  • Firewalls sind ein großes Problem, da das Installationsprogramm den Bereich der 222 * -Ports öffnet, die PowerShell-Tools jedoch andere Windows-Dienste verwenden. Durch das Deaktivieren der Firewall auf allen Servern ( nicht empfohlen ) wurde das Problem behoben.
  • Wenn ein Server aus dem Cluster entfernt wird, gibt es eine anfängliche Zeitüberschreitung, bevor der Cluster wieder arbeiten kann.
  • Nach dem Neustart benötigt der Cluster 2-5 Minuten, um wieder hochzufahren.
  • Wenn der Neustart und ein Server nicht erreichbar ist, erhöht sich die Startzeit.
  • Wenn der Server mit der freigegebenen Dateifreigabe für die Konfiguration nicht erreichbar ist, werden die Dienste nicht gestartet. Wir haben versucht, dies zu lösen, indem wir jedem Server einen privaten Anteil geben.
Tedd Hansen 27.01.2011, 09:14
quelle

Tags und Links