.

Newsletter Archiv

Tech?Update!: RAID-Systeme

Beim Einsatz von RAID-Systemen steht die Sicherheit von auf Festplatten gespeicherten Daten im Vordergrund. Ursprünglich - d.h. in diesem Fall vor circa 20 Jahren - ging es darum, bei der Speicherung großer Datenmengen Alternativen zum Einsatz der großen und extrem teuren 19-Zoll-Festplatten (SLED, Single Large Expensive Disk, dt. einzelne große teure Festplatte) zu finden.

Es gab zwar schon die kleineren und deutlich günstigeren 5,25-Zoll-Festplatten, doch deren Einsatz als Alternative warf verschiedene Probleme auf, beispielsweise die Frage der Datensicherheit und der Verwaltung. David Patterson, Garth Gibson und Randy Kratz, damals Doktoranden der kalifornischen Universität Berkeley, veröffentlichten im Juni 1987 die Studie "A Case of Redundant Arrays of Inexpensive Disks (RAID)". Darin schlugen sie Methoden zum ausfallgesicherten Verbund von Festplatten vor, die sie von 1 bis 5 durchnummerierten. Die Bezeichnung RAID sowie die RAID-Level 1 bis 5 werden heute noch benutzt und sind durch weitere Konfigurationen ergänzt worden. Allerdings spricht man heute nicht mehr von "Redundant Array of Inexpensive Disks" (Redundante Anordnung günstiger Festplatten) - was auf den Einsatz der billigeren kleinen Festplatten verwies - sondern von "Redundant Array of Independent Disks" (Redundante Anordnung unabhängiger Festplatten). Ein RAID-System setzt also den Verbund von mindestens zwei Festplatten voraus, wobei in der Regel Daten redundant gespeichert werden. Am besten werden gleich große Festplatten eingesetzt, denn jedes physikalische Laufwerk wird nur bis zur Kapazität der kleinsten vorhandenen Festplatte genutzt. Bei einer Kombination beispielsweise eines 400-GByte-Laufwerks mit zwei 500-GByte-Festplatten stehen nur drei mal 400 GByte für das logische Gesamtlaufwerk zur Verfügung. Um ein RAID-System zu verwalten, ist außerdem ein Festplatten-Controller (RAID-Controller) mit integrierten Management-Funktionen notwendig.

JBOD und RAID-Level
Bei RAID-Systemen handelt es sich nicht um einfach hintereinander geschaltete Festplatten im Sinne von Disk Spanning bzw. JBOD (Just a Bunch of Disks, dt. Nur ein Haufen Festplatten), die zusammen ein einziges großes logisches Laufwerk ergeben. Die Kapazitäten der einzelnen Festplatten ergänzen sich bei JBOD. Fällt jedoch eine Festplatte aus, sind die Daten des gesamten Verbunds verloren. Die Bezeichnung RAID-Level für verschiedene Verfahren, Festplatten zu hochkapazitiven und ausfallsicheren Speichersystemen zu verbinden, ist leicht irreführend. Es handelt sich nämlich keineswegs um ein stufenweise aufeinander aufbauendes Verfahren, sondern um voneinander völlig unabhängige Techniken. Anwender können aus der Nummerierung der RAID-Level nicht automatisch Rückschlüsse auf die Qualität oder Funktionalität des jeweiligen Systems ziehen. Es geht vielmehr darum, für den jeweiligen Einsatz das passende System zu wählen und die Prioritäten zwischen der Sicherheit und Verfügbarkeit der Daten, der Leistungsfähigkeit des Systems sowie den Kosten pro MByte abzuwägen.

Die gängigsten RAID-Level
Es gibt zwar heute eine große Menge verschiedener RAID-Verfahren, doch werden einige davon nur selten oder gar nicht mehr verwendet. Am weitesten verbreitet sind die RAID-Level 0, 1, 5 und 0+1.

  • RAID 0 (auch: Data Striping): Die Bezeichnung RAID für diesen Konfigurationstyp ist eigentlich irreführend, denn er bietet keine Datenredundanz und ist daher im strengen Sinne kein RAID-System. Bei RAID 0 werden mindestens zwei Festplatten zusammen gefasst und in verschiedene Blöcke gleicher Größe aufgeteilt (engl. striping, in Streifen zerlegen), d.h. viele relativ kleine Datenblöcke werden gleichmässig auf beide Festplatten verteilt. Dieses Striping wird in diesem Falle aber nicht zur redundanten Datensicherung genutzt. Deswegen heißt dieses System auch "Non-Redundant Striped Array" (dt. nicht-redundante Block-Anordnung). Aufgrund der Möglichkeit, auf allen Festplatten parallel auf die Datenblöcke zuzugreifen, erhöht sich die Datendurchsatzrate signifikant. Da die Daten jedoch nicht redundant abgespeichert werden, erhöht sich sogar die Gefahr eines Festplattenausfalls. Beispielsweise halbiert sich die MTBF (Mean Time Between Failures, dt. Mittlere Betriebsdauer zwischen Ausfällen) beim Einsatz von zwei Festplatten. Wenn eine Festplatte defekt ist, sind alle Daten verloren.
  • RAID 1 (auch: Mirroring, Duplexing) Dieses System setzt in der Regel zwei Festplatten ein, auf denen alle Daten gleichzeitig und identisch gespeichert werden. Auf diese Weise sind die Daten bei einem Ausfall eines Laufwerks noch komplett vorhanden und es bleibt ein Zeitfenster für den Austausch der defekten Festplatte, während dessen der Betrieb des Systems ungestört weiter läuft. Je nach der Beschaffenheit der eingesetzten Hardware ist ein Festplattenaustausch bei laufendem Betrieb möglich (z. B. "Hot Swapping"), ohne dass auf die Daten verzichtet werden muss.
  • Diese effiziente Datensicherung hat ihren Preis: Die Kapazität der physikalischen Festplatten lässt sich aufgrund der Spiegelung nicht addieren, so dass faktisch nur die Hälfte der gesamten Speicherkapazität beider Festplatten genutzt wird.
  • RAID 10 (bzw. RAID 0+1, RAID 0/1) Bei RAID 10 und RAID 0+1 handelt es sich um eine Kombination der RAID-Level 0 und 1. Der interne Aufbau dieser Systeme ist zwar verschieden, doch sind die Auswirkungen die gleichen. Daher werden diese Bezeichnungen oft synonym verwendet. Für dieses System wird eine gerade Anzahl von Festplatten, in der Regel mindestens vier, eingesetzt, die paarweise gespiegelt werden. Es kombiniert das Data-Striping des RAID-Level 0 mit dem Drive Mirroring oder Duplexing von RAID-Level 1. Dabei verbinden sich auch die Vorteile beider Systeme: RAID 10 bietet sowohl eine hocheffiziente Datensicherung als auch eine hohe Datentransferrate.
  • RAID 5 (Data Striping und verteilte Paritätsinformationen) Das RAID 5-Verfahren ist technisch komplexer als die bisher beschriebenen Techniken. Ein RAID 5-System benötigt mindestens drei Festplatten und basiert auf der Striping-Technologie. Im Gegensatz zu RAID 1 wird also nicht gespiegelt, sondern wie bei RAID 0 die Data Stripe Sets gleichmäßig auf alle Festplatten verteilt. Um die Daten zu sichern, werden zusätzlich Paritätsinformationen (engl. parity information) verwendet. Dieses Verfahren basiert auf der Paritätskontrollcodierung für alle Bitfolgen, die letztendlich die Informationen enthalten. Im Falle einer fehlerhaften Übertragung oder eines Informationsverlustes ermöglichen es die Paritätsinformationen, die ursprünglichen Bitfolgen wieder herzustellen. Diese Paritätsinformationen werden bei RAID 5 ebenfalls über die Festplatten verteilt gespeichert. Insgesamt bietet ein solches System sowohl eine hohe Datensicherheit als auch eine hohe Leistungsfähigkeit beim Datentransfer.


RAID ist kein Allheilmittel
Mit Ausnahme von RAID 0 haben RAID-Systeme die Aufgabe, Daten für den Fall eines Festplattenausfalls redundant zu speichern. Doch sobald in einem RAID-System, gleich welcher Art, eine Festplatte ausfällt, geht die Datenredundanz verloren. Das defekte Laufwerk sollte dann so schnell wie möglich ausgetauscht, der Festplattenverbund wieder hergestellt und gegebenenfalls die Daten wieder rekonstruiert werden. Außerdem empfehlen sich zur Ausfallsicherheit weiter gehende Maßnahmen wie der Einsatz einer unterbrechungsfreien Stromversorgung (USV), der Schutz vor Viren etc.. Und gegen "höhere Gewalt", beispielsweise Brände oder Überspannungen in Folge eines Blitzschlags sind auch RAID-Systeme nicht sicher. Mal ganz abgesehen vom menschlichen Faktor: Wenn User wichtige Daten versehentlich löschen, sind sie trotz RAID-System verloren. Zum wirklich zuverlässigen Schutz gegen Datenverluste gehört unbedingt ein konsequentes Backup.

ISD410 mit RAID 1
Zu unserem neuen ISD400 Intelligent Spooling Device haben wir mit dem ISD410 eine Variante mit einem RAID 1 System entwickelt. Zwei identische 160 GB Festplatten halten die Gesamtkonfiguration der Appliance sowie alle Informationen, die für die Druckdienste notwendig sind (z. B. Druckertreiber, Sicherheitseinstellungen, etc.) doppelt vor. Gerade in Enterprise-Umgebungen zieht der Ausfall der Netzwerkdruckdienste nicht nur eine Menge Helpdesk-Calls nach sich, sondern er ist unter Umständen geschäftskritisch. Mit einer redundanten Datenspeicherung verfügt eine solche Umgebung beim Ausfall einer Festplatte der Druck-Appliance ISD410 ohne Unterbrechung weiter über alle Druckdienste und Daten. Zwar sollte der Austausch der defekten Festplatte bzw. der betroffenen Appliance zum Erhalt der Datenverfügbarkeit schnellstmöglich durch SEH erfolgen. Mit einer zweiten Festplatte bekommen die Anwender jedoch ein Zeitfenster für diesen Austausch, in dem die Netzwerkdruckdienste weiter verfügbar sind. Der Austausch eines Geräts und die Konfiguration via Backup, dass sich über den ISD Manager schnell und sicher aufspielen lässt, nimmt vergleichsweise wenig Zeit in Anspruch: Je nach Konfiguration der ISD-Appliance, der Netzwerkumgebung etc. dauert das Back-Up und anschließende Aufspielen auf eine Austausch-Appliance zwischen 30 und 60 Minuten. Außerdem bieten wir mit dem Serviceplus Paket für Kunden in Deutschland an, eine defekte ISD-Appliance innerhalb von 24 Stunden auszutauschen, um die Verfügbarkeit der Daten weiter zu optimieren bzw. die Ausfallzeit gering zu halten.

Weitere Informationen zu RAID finden Sie im Internet:
ARCHmatic-Glossar: RAID
TecChannel: RAID 0 bis 7
Wikipedia: RAID
ZDNet: RAID-Level im Überblick