Backup gegen Raid

Backup gegen Raid
Backups sind ein entscheidender Bestandteil unseres digitalen Lebens. Jeder Computer von riesigen Datenbanken zu einem einzelnen PC oder Mobilgerät benötigt eine Sicherung. Ein Ort, an dem die relevantesten Benutzerdaten für lange Zeit gespeichert und auch so gespeichert werden können, dass sie in der Notwendigkeit wiederhergestellt werden können. Wir können eine Unterscheidung zwischen den Daten zu unserem aktuell laufenden System machen, nennen wir es Lebensdaten, und das Gesichert Daten. Letzteres wird vom aktuellen System, das die Live -Daten verwendet.

RAID, betrifft sich mit den Live -Daten, es ist ein Mechanismus, mit dem ein laufendes System mehrere Festplatten zu einer einzelnen Speichereinheit kombiniert. Die Daten werden dann auf alle Festplatten so verbreitet, dass sie das Versagen von mindestens einem (oder mehr) der physischen Scheiben überleben kann. Die einfachste Art von RAID -Array ist RAID1 oder Spiegelung. Hier kopieren (oder spiegeln Sie) die gleichen Daten über zwei oder mehr Datenträger, so dass die Daten immer noch überleben können und weiterhin aktiv verwendet werden können. Es gibt auch andere RAID -Konfigurationen, und wir werden diese im Laufe der Zeit besprechen.

Über Raid

RAID oder redundante Reihe kostengünstiger Festplatten sind ein Mechanismus, um Daten über Festplatten hinweg zu speichern. Es gibt ein breites „Array“ von RAID -Setup, mit dem Sie zusammenarbeiten können, aber die beiden grundlegenden Mechanismen, auf denen sie alle basieren, sind die folgenden:

1. Spiegelung:

Die Spiegelung impliziert, dass Ihre Datenblöcke über mehrere Scheiben hinweg kopiert, gespiegelt werden. Wenn Sie Ihre Daten über drei Festplatten hinweg widerspiegeln, können Sie bis zu zwei Scheiben zu einem bestimmten Zeitpunkt überleben, die fehlgeschlagenen Scheiben können dann ohne viel Ärger durch neue ersetzt werden. In ähnlicher Weise, wenn Sie Daten über kopieren N+1 Festplatten, Sie können bis zu N Scheiben scheitern. Der Nachteil davon ist, dass Sie nur die Speicherkapazität der kleinsten Festplatte in Ihrem RAID -Array erhalten.

2. Parität:

Bei einem zweiten Ansatz besteht darin. Die drei Blöcke sind alle gleich groß und sind auf verschiedene Geräte verteilt. Es sind mindestens drei Geräte erforderlich, damit diese Konfiguration funktioniert. Wenn eine der Festplatten fehlschlägt, können Sie die in dieser Festplatte gespeicherten Blöcke mit den beiden anderen Blöcken neu erstellen. Wenn beispielsweise der zweite Benutzerblock verloren geht, kann der erste Block und der Paritätsblock verwendet werden, um den zweiten Benutzerblock zu berechnen. Wenn Sie daran interessiert sind, wie dies funktioniert.

Diese Methode kann weiter verbessert werden, um 2 oder sogar 3 Paritätsblöcke zu haben. Aber mehr als 3 Paritätsblöcke sind in der Branche nicht so oft zu sehen. Wenn Sie einen Paritätsblock haben, können Sie einen Scheibenversagen überleben. Zwei Paritätsblockade bedeuten.

Es ist effizienter in Bezug auf die Speicherauslastung als Spiegelung. Wenn Sie einen Paritätsblock haben, benötigen Sie nur 50% mehr physischen Speicher pro tatsächlichen Benutzerdaten, die Sie speichern. Dies bedeutet, 1 GB Daten zu speichern. Sie benötigen 1.5 GB Speicher (plus es gibt einen kleinen Overhead für die Metadaten). Dies ist viel effizienter als selbst das effizienteste Spiegelschema, bei dem Sie mindestens 2 GB Speicher benötigen, um 1 GB Daten zwischen zwei Scheiben zu spiegeln.

Der Nachteil ist, dass zufällige Schreibvorgänge dank der zusätzlichen Berechnung und Schreibvor Operationen, die mit dem Parity -Block zugeordnet ist, verlangsamt werden. Auch die Zuverlässigkeit ist nicht so gut wie die eines N+1 Spiegelte Festplatten, bei denen Sie sich auf eine willkürliche Anzahl von Scheiben vorbereiten können.

RAID -Konfigurationen können so komplex oder so einfach sein, wie Sie es möchten. Es gibt widmete RAID -Controller, mit denen Sie Ihre physischen Festplatten verbinden, und das Betriebssystem sieht dann eine einzelne logische Festplatte, wie vom Controller gezeigt. LSI ist ein solcher Anbieter von RAID -Controllern. Sie können auch RAID in der Software OpenZFS durchführen, ist wahrscheinlich die beste Wette, die Sie in dieser Hinsicht haben.

Eine letzte Art von Überfall, die eine lobende Erwähnung erhält, ist Raid 0. Technisch gesehen ist es kein RAID -Schema, da hier keine Redundanz beteiligt ist. Die Idee hinter RAID 0 besteht darin, Ihre Daten einfach auf mehrere Speichergeräte ohne zu verbreiten beliebig Resilienz gegen Scheibenversagen. Der Vorteil ist, dass Sie dadurch Leistungsverbesserungen erhalten. Wenn Sie 1 GB Daten auf eine einzelne Festplatte schreiben, ist der Prozess langsam. Die Festplatte kann nur eine begrenzte Anzahl von Schreibvorgängen pro Sekunde durchführen, und Ihr Betriebssystem muss darauf warten, dass sie diesen Vorgang beendet, bevor neue Daten gesendet werden. Wenn Sie die gleichen 1 -GB Daten auf zwei solcher Festplatten verbreiten, können Sie gleichzeitig von beiden schreiben (und lesen) und eine große Leistungsverbesserung erzielen.

Backups

Das Konzept der Backups ist wichtiger als das von RAID. Eine Sicherung im Kontext der Speicherverwaltung ist eine bekannte gute Kopie von Daten von einem bestimmten Zeitpunkt, aus dem Sie Dateien bei Bedarf wieder in Ihr Hauptsystem wiederherstellen können. In Bezug auf die Implementierung gibt es viele Cloud -gehostete Lösungen und viele Offline -Lösungen, die verwendet werden können.

Tarsnap und Backblaze sind mein bevorzugter verwalteter Backup -Dienste für private und geschäftliche Anwendungsfälle. Sie können auch Google Drive, iCloud oder Dropbox in diese Definition von a einbeziehen Backup Lösung, aber sie richten sich mehr auf den Verbrauchermarkt als auf das Unternehmen. Das zugrunde liegende Prinzip ist jedoch immer noch das gleiche. Wenn Sie sich bei einem neuen iPhone oder iPad anmelden, werden alle Daten, Ihre Kontakte, Fotos, Medienbibliothek usw. nahtlos von Ihrem iCloud -Konto synchronisiert. Wenn Sie Ihr Gerät weiterhin verwenden, werden die neueren Daten stillschweigend in die Cloud eingeschaltet und Sie nicht. Ich muss mich darüber Sorgen machen.

Ihre Sicherungslösung kann so einfach sein wie das Kopieren von Daten auf eine externe Festplatte oder die Verwendung von RSYNC (oder ZFS -Senden, wenn Sie OpenZFS verwenden), um regelmäßig eine Kopie aller relevanten Informationen zu generieren. Dies kann Ihren Dokumenteordner, Ihre Datenbank, Ihr Quell -Repository oder sogar Ihr gesamter Root -Dateisystem in einen flachen Reißverschluss oder einen Tarball enthalten. Die wichtigen Kriterien, die eine gute Sicherungslösung erfüllen sollte, sind Folgendes:

  1. Backups sollten häufig auftreten - wenn Sie Daten jeden Monat, anstatt jede Woche, zu sichern, riskieren Sie, bis zu einem Monatsdaten zu verlieren, wenn eine Katastrophe schlägt.
  2. Ihre Backups sollten in die Zeit zurückgehen - der Sicherungsspeicher ist endlich. Manchmal muss man ältere Backups wegwerfen. Je mehr Speicherplatz Sie haben, desto besser können Ihre Backups sein. Angenommen, Sie sichern Ihre Daten wöchentlich, werfen jedoch Backups älter als 2 Wochen weg. Wenn eine Datei versehentlich gelöscht wird und dies zwei Wochen lang unbemerkt bleibt, haben Sie keine Möglichkeit, sie zurückzubringen.
  3. Ihre Dateien sollten tatsächlich wiederhergestellt sein. Wenn Sie noch nie versucht haben, Ihre Daten aus der Sicherung wiederherzustellen, haben Sie keine Sicherung. Sie sollten nicht lernen, wie Sie Daten wiederherstellen können, zum kritischen Zeitpunkt, als Sie einen Datenverlust erlitten haben. Planen Sie voraus und wissen Sie, wie Sie das System aus dem letzten bekannten guten Backup wiederherstellen können.
  4. Ihre Sicherung sollte vom laufenden System getrennt werden - wenn Katastrophenschläge und alle Ihre Dateien auf dem Produktionsserver verschlüsselt, gelöscht oder beschädigt werden, müssen Sie sicherstellen, dass dies nicht Ihrer Sicherung passiert. Eine gute Möglichkeit, dies sicherzustellen, besteht darin, sicherzustellen, dass Ihr Sicherungsgerät nicht mit Ihrer Produktionsumgebung verbunden ist.E, ziehen Sie Ihre USB -Festplatte aus, entlasten Sie Ihr NFS -Dateisystem, wenn Sie fertig sind. Mindestens das Produktionssystem geben Sie nicht das Privileg, Ihre Sicherungsdaten zu überschreiben oder zu ändern. Machen Sie es schreibgeschützt.

Jetzt, da wir ein wenig über RAID und Backup wissen, lasst uns einige Unterschiede zwischen ihnen hervorheben.

Dateien und Blöcke

RAID befasst sich immer mit Datenblöcken, nicht wie das Dateisystem diese Daten dem Benutzer vorlegt. Sowohl Software- als auch Hardware -RAID -Abschlüsse mit Daten als Informationsblöcke. Die Größe der Blöcke kann von 128 KIB bis 1 MIB variieren.

Backups hingegen sind viel flexibler. Sie werden normalerweise auf der Dateisystemebene durchgeführt, obwohl es keine harte und schnelle Regel dafür gibt, dass dies der Fall ist. Sie sind auch körniger. Sie können eine einzelne Datei aus Ihrer Sicherung wiederherstellen, wenn Ihre Lösung flexibel genug ist. RAID -Arrays sind keine Backups, sondern nur eine Möglichkeit, Daten über mehrere Scheiben hinweg zu verbreiten. Wenn eine Datei gelöscht wird, werden alle ihre gespiegelten Blöcke und Paritätsblöcke befreit. Ende der Geschichte.

Anwendungsfälle

Backups sind für alle. Der Ansatz und der Umfang können vom persönlichen Anwendungsfall zu Enterprise variieren, aber jeder, der ein digitales Leben hat. RAID ist eher eine geschäfts-/unternehmensspezifische Funktion. Sie sehen RAID -Arrays in Servern, Speichergeräten wie NAS und Sans, Cloud -Hypervisors usw. So ziemlich jeder Ort, an dem lebende kritische Daten gespeichert sind. Sogar die Server, die Ihre Cloud -gehosteten Backups ausführen, verwenden wahrscheinlich RAID -Arrays. Dies sind keine gegenseitig ausschließlichen Technologien.

Dies bedeutet nicht. Ein Teil des Grundes dafür ist, dass in der Unternehmen die Festplatten rund um die Uhr mit IO -Operationen geschlagen werden. In der Produktionsumgebung, wie bei der Speicherung eines Datenbank- oder Video -Streaming -Dienstes oder eines Cloud -Hypervisors, wird das Speichergerät Ihres Server. Unter diesen Bedingungen scheitern Ihre Laufwerke viel wahrscheinlicher. Eine RAID -Konfiguration bedeutet, wenn ein Laufwerk fehlschlägt. Die meisten Server können auch nach einem Festplattenversagen weiter funktionieren, sodass Sie nicht in jeder Sekunde neue Informationen und Anfragen verlieren.

Ein durchschnittlicher Desktop -Computer kann kaum den gleichen stressigen Zustand nachbilden, selbst wenn die Festplatte stirbt, wenn Sie eine Sicherungslösung wie Backblaze verwenden, können Sie die meisten Ihrer verlorenen Daten abrufen und ein paar Stunden Arbeiten für Arbeiten zu verlieren, ist wahrscheinlich das Schlimmste, was das Schlimmste ist kann passieren. Auch dies wird zu einer Seltenheit dank Cloud -gehosteten Lösungen wie Adobe Creative Cloud, Office 365 usw.

RAID ist kein Ersatz für Backups

Wenn es eine einzige Einstellung gibt, die Sie von diesem Artikel wollen, sollte dies sein. RAID ist kein Ersatz für Backups. Rücken Sie Ihre Daten immer wieder auf! Es gibt viele Leute da draußen, die denken, wenn Sie RAID haben, bedeutet dies, dass die Daten in mehreren Festplätzen sicher sind und daher nicht erforderlich sind, sie zu sichern. Nichts ist weiter von der Wahrheit entfernt. RAID soll sich mit einem einzigen spezifischen Problem befassen - die Scheiben, die fehlschlagen oder fehlerhafte Daten zurückgeben. RAID wird Sie nicht vor einer Million anderen Bedrohungen wie folgt schützen:

  1. Benutzerfehler und versehentliche Löschungen
  2. Anwendungs- oder Betriebssystemfehler, die weit verbreitete Datenbeschädigung verursachen
  3. Ransomware oder andere Malware -Verschlüsselung, Löschen oder Verhinderung Ihrer Daten
  4. Scheitern von Raid -Controllern selbst

Die Daten in Ihrem RAID -Array sind live. Wenn das Betriebssystem, eine Anwendung (oder ein Benutzer) hier und da einige Dateien löscht, wird die Datei in Ihrem RAID -Array gelöscht. Eine separate Kopie Ihrer Daten, eine Sicherung, ist die einzige Möglichkeit, sich jemals vor dieser Art von Szenario zu schützen.

Abschluss

Wenn Sie sich Sorgen um Ihre Daten machen, sollte Ihr erstes Problem die Sicherungslösung sein. Die meisten Desktop -Benutzer, mit Ausnahme von Power -Nutzern, sollten mehr in ein zuverlässiges Backup investieren, anstatt mit RAID1, RAID5 oder RAIDZ zu fummeln. Wenn Sie Ihren eigenen Backup -Server erstellen möchten, müssen Sie sich eine anständige Sicherungsrichtlinie und eine zuverlässige Speicher -Backend vorstellen. Dieser Artikel ist vielleicht ein guter Ausgangspunkt. Sie können RSYNC oder ZFS senden, um die Kopie Ihrer Daten in dieses Backend zu übernehmen.

Wenn Sie sich in der Unternehmen befinden und eine RAID -Lösung in Betracht ziehen, um alle Ihre Live -Daten zu speichern. Erwägen Sie, OpenZFs zu verwenden, sondern eine sehr flexible Lösung, von N-Disk-Spiegelung über Raidz1 mit einem Paritätsblock bis hin zu Raidz2 und Raidz3 mit 2 und 3 Paritätsblöcken. Sie müssen viel über die Anforderungen Ihrer Bewerbung nachdenken, bevor Sie eine Entscheidung treffen. Es gibt Kompromisse zwischen Ihren Leseschreiber-Leistungen, der Belastbarkeit und der Speicherungseffizienz. Ich würde jedoch empfehlen, dass Sie nur an RAID denken sollten, nachdem Sie sich für eine Backup -Lösung entschieden haben.