Unsere Datenschutzrichtlinie wird in Kürze aktualisiert. Bitte sehen Sie sich die Vorschau an.

Apache Cassandra Grundkurs

Replikationsstrategien

Testen Sie unsere 2016 Kurse

10 Tage kostenlos!

Jetzt testen Alle Abonnements anzeigen
Erfahren Sie, welche Replikationsstrategien Cassandra im Repertoire hat, um eine maximale Verfügbarkeit der Daten – trotz Verteilung über mehrere Datenzentren hinweg – sicherzustellen.
03:15

Transkript

Ein wichtiger Aspekt bei Cassandra, ist die Sicherstellung einer hohen Verfügbarkeit, also dass für gestellte Anfragen stets eine zeitnahe Antwort gefunden werden kann. Der Ausfall von Datenbankinstanzen, Probleme mit dem Netzwerk, oder Fehlverhalten sonstiger Art sind in einem verteilten System nicht unüblich. Derartige Ausfälle müssen beim Design solcher Systeme aktiv betrachtet werden, und entsprechende Notfallpläne erstellt werden. Sehen Sie in diesem Video, wie Cassandra die Daten strukturiert, und diverse Replikations- strategien implementiert, damit der Ausfall einzelner Nodes keine verheerenden Auswirkungen hat. Die logische Strukturierung von Daten beginnt mit dem Keyspace. Eine Replikationsstrategie, also die Art und Weise, wie Daten redundant gespeichert werden, wird für den gesamten Keyspace festgelegt. Der Keyspace ist ein Behälter, beziehungsweise eine Gruppierung für verschiedene Tabellen, die konzeptuell zusammengehören. Weiterhin lässt sich der Inhalt einer Tabelle in Partitionen und Datensätze oder Zeilen einteilen. Partitionen werden anhand des Primärschlüssels von Datensätzen gebildet. Eine Partition besteht immer aus mindestens einem Datensatz und darf nicht aufgeteilt werden und auf verschiedene Nodes abgelegt werden. Betrachten wir nun die verschiedenen Replikationsstrategien. Es liegt ein Cluster mit einem Datacenter und verschiedenen Racs vor. Die SimpleStrategy ist eine Replikationsstrategie, die die Topologie des Clusters nicht berücksichtigt. Man definiert bei Erstellung des Clusters einen Replikationsfaktor. Dieser legt fest, wie oft, beziehungsweise auf wie vielen Nodes jeder Datensatz im Keyspace vorgehalten werden soll. Bei der Verteilung der Daten wird aber die Topologie des Netzwerks nicht berücksichtigt. Daher ist diese Strategie im Normalfall nicht für produktive Deployments, sondern eher zum Testen geeignet. Betrachten wir nun ein Cluster mit den Datacentern DC1, DC2 und DC3. Hier setzen wir die NetworkTopologyStrategy ein. Sie sehen, wir können bei der Erstellung eines Keyspaces nicht nur einen Replikationsfaktor definieren, sondern für jedes Datacenter, das wir nutzen wollen. Wir definieren dreifache Replikationen für DC1 und einfache Replikationen für DC3. Wenn wir nun einen Datensatz einfügen, wird er genau nach diesem eben definierten Schema im Cluster repliziert. Bitte beachten Sie, dass nicht nur auf die Datacenter übergreifende Verteilung geachtet wird, sondern auch auf eine möglichst gleichmäßige Verteilung innerhalb eines Datacenters. Das erkennen Sie daran, dass die Datensätze in DC1 jeweils auf unterschiedliche Racs gelegt werden. Das Rac modelliert Nodes, die sich auf Servern in unmittelbarer Nähe zueinander befinden. Diese unmittelbare Nähe erhöht die gemeinsame Ausfallwahrscheinlichkeit aufgrund von Hartware Versagen, wie zum Beispiel Probleme mit der Stromversorgung oder Kühlung. Zusätzlich wird der Datensatz wie gewünscht auch in DC3 repliziert. In diesem Video haben Sie die verschiedenen Replikationsstrategien von Cassandra kennengelernt, und wissen nun, welche Sie wann einsetzen sollten. Sie haben außerdem erfahren, wie Daten in Cassandra strukturiert sind, und dass Replikation auf Ebene des Keyspaces festgelegt wird.

Apache Cassandra Grundkurs

Lernen Sie, wie Sie Apache Cassandra als hoch verfügbare und skalierbare Datenbank einsetzen können.

2 Std. 11 min (26 Videos)
Derzeit sind keine Feedbacks vorhanden...
 
Exklusiv für Abo-Kunden
Erscheinungsdatum:24.02.2017

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!