[Support]  [Forum]  [Newsletter]       [Suche]  [Kontakt]  [Impressum]  [Datenschutz]

Stor IT Back - Ihr Speicherspezialist

  [Angebote]   [Produkte]   [Schulungen]   [Firmenprofil]   [Partner]   [Kunden]   [Information]   [Download]   [News]

LOGO Stor IT Back

Raid-Level und Hot Spare V1.13 (c) Stor IT Back 2019



RAID-Level - Verfügbarkeit und Performance für Festplatten und SSDs mit Hot Spare

Festplatten waren in den Anfangszeiten der Datenverarbeitung sehr teuer. Es gab eine Zweiklassengesellschaft für Festplatten. Die kostengünstigen waren für PCs und einfache Server vorgesehen, sie hatten jedoch einen großen Nachteil: sie fielen häufiger aus. Dies war gerade für den Großrechnerbereich und wichtige Server nicht tolerierbar, es wurden für diesen Einsatz speziell gefertigte und kontrollierte Festplatten verwendet. Diese waren sehr teuer und wurden nur von einzelnen Herstellern verwendet.
Als Lösung wurde die Idee "RAID" geboren. Das Kürzel stand in den Anfangszeiten für Redundant Array of Inexpensive Disks. Es wurden mehrere kostengünstige Platten kombiniert und zu einer logischen Festplatte verschaltet. Zwei Festplatten waren immer noch kostengünstiger als eine Großrechnerplatte und die Wahrscheinlichkeit, dass beide Festplatten ausfielen war nicht sonderlich groß.
Dieses Verfahren löste die beiden wichtigsten Nachteile der Festplatten: den Preis und die Ausfallwahrscheinlichkeit.


Was ist RAID?

Mit RAID (Redundant Array of Independent Disks) werden mehrere unabhängige Festplatten zusammen geschaltet, um ein großes logisches Laufwerk zu bilden. Auf diesem Array werden nicht nur Daten gespeichert, es werden auch "Redundanz-Informationen" hinzugefügt. Diese Redundanz-Informationen können die Daten selbst sein (Spiegeln) oder Parity-Daten, die aus mehreren Datenblöcken berechnet werden (RAID 3, 4, 5 oder 6). Neben dem RAID-Level 0 bis 6 wurden auch Kombinationen entwickelt, die so genannten "nested raids". Die sind zum Beispiel die RAID-Level 10 oder 51. Ein häufig verwendetes Beispiel ist ein RAID 50, es werden zwei RAID 5 gebildet, die dann miteinander gestriped werden. Dies erhöht die Performance ohne die Sicherheit zu beeinflussen.
Eine Weiterentwicklung ist das RAIDn, ein "virtuelles RAID", welches durch die Festlegung der maximalen Verfügbarkeit definiert werden kann.
Eine weitere Variante stammt von IBM, die eine Hot Spare Festplatte (sie springt beim Ausfall einer anderen Festplatte im RAID-Verbund ein) direkt mit ins RAID integrieren. Daraus ergibt sich der RAID-Level 5E bzw. 5EE. Beim 5E wird der Hot-Spare-Platz an das Ende einer jeden Festplatte gelegt, bei 5EE verteilt er sich auf alle Festplatten über den gesamten Bereich.
Das Betriebssystem (z.B. Windows 2016, Mac OS, Linux oder Unix) greift nun nicht mehr auf die einzelnen physikalischen Festplatten, sondern stattdessen auf das virtuelle Array zu.
Das eigentliche Ziel von RAID ist es, die Verfügbarkeit aller Daten zu erhöhen. RAID verhindert Ausfallzeiten bei einem Festplattenausfall. Aber auch die Performance wird gesteigert. Im Vergleich zu einer Einzelplatte kann bei einem RAID 5 auf 10 Festplatten von allen 10 Festplatten zur gleichen Zeit gelesen werden. Ein deutlicher Performance-Vorteil, da die einzelne Festplatte der Flaschenhals in der Datenübertragung ist. Beispiele für RAID-Systeme finden Sie in unseren Angeboten Storage- und RAID-Systeme.

Allerdings kann ein RAID-Controller keine Daten restaurieren, die von den Benutzern gelöscht oder durch ein Ereignis wie Diebstahl oder Feuer zerstört wurden. Deshalb benötigt man immer ein Backup, um das System vor diesen Ereignissen zu schützen, auch dann wenn ein RAID System installiert ist.


RAID in der Praxis

Für ein RAID in der Praxis benötigen wir nicht nur Festplatten und/oder SSDs, sondern auch einen RAID-Controller. Egal ob als PCI Express Steckkarte in einem Server, oder als externen RAID-Controller in einem Storage. Nehmen wir einmal an, wir legen ein einfaches RAID 5 mit einem PCI Express RAID Controller von Hersteller A an und nutzen es einige Zeit. Jetzt fällt der Controller des Herstellers A aus. Es ist ja ein Standard-RAID 5, können wir einfach einen RAID-Controller von Hersteller B nehmen? Für das Betriebssystem ist ein Treiber verfügbar, das ist kein Problem.
Ein einfaches Nein, in den meisten Fällen ist es nicht möglich, weil jeder Hersteller ein RAID unterschiedlich anlegt. Es unterscheiden sich die Meta-Daten des Controllers und wie diese kodiert werden. Also welche Platten sind in Verwendung, wo startet das RAID, wo liegt ein Logical Volume oder eine LUN. Das ist natürlich nicht standardisiert und jeder Hersteller macht es anders.
Es ist meist noch komplexer: Nicht einmal die unterschiedlichen Typen der Controller eines Herstellers müssen untereinander kompatibel sein, sogar innerhalb von Controller-Familien und innerhalb von Firmware-Ständen können Unterschiede auftreten.
Also sollte man immer bei einem Ausfall auf exakt den gleichen Typ mit der gleichen Firmware tauschen. Das bedeutet natürlich auch, dass die Firmware-Version unabhängig vom System hinterlegt werden sollte.

Ist denn bei einem Software-RAID alles besser? Na ja, da kann der Controller nicht kaputt gehen. Aber auch da muss man auf die Kompatibilität achten. Sollte man zum Beispiel das Betriebssystem wechseln, dann könnte das Software-RAID durchaus anders aufgebaut sein und es wird nicht gefunden. Also auch wenn Treiber und Filesystem passen sollten.


Was ist eine Hot Spare?

Eine Hot Spare ist eine leere Festplatte in einem RAID-System, die als Hot Spare konfiguriert wurde. Sollte jetzt eine Festplatte aus einem RAID-Verbund ausfallen, so kann die Hot Spare einspringen. Es werden dann die Daten der ausgefallenen Festplatten auf die Hot Spare rekonstruiert. Eine Hot Spare kann also nur für eine Festplatte oder SSD aus einem RAID einspringen, wenn die Daten noch rekonstruiert werden können.

Ist bei einem RAID 5 aber schon eine Festplatte ausgefallen, so kann für eine weitere Platte die Hot Spare nicht einspringen. Aber warum ist die Hot Spare nicht schon beim ersten Ausfall eingesprungen? Im ersten Moment total unlogisch, aber wenn man genauer drüber nachdenkt, so könnte es ja sein, das die erste Hot Spare noch nicht vollständig eingesprungen ist und es fällt eine zweite Platten aus dem gleichen RAID aus. Jetzt können die Daten nicht mehr rekonstruiert werden (bei RAID 5 darf ja nur eine Platte oder SSD ausfallen). In diesem Beispiel ist es aber viel schlimmer: Die Daten sind jetzt nicht mehr verfügbar, in diesem Fall also der vollständige Datenverlust. Da helfen also auch nicht 2 oder mehr Hot Spare Platten.

Was hilft aber in diesem Fall? Wann tritt dieser Fall auf? Je größer eine Festplatte ist, desto länger dauert es, bis eine Hot Spare komplett eingesprungen ist. Bei großen NL-SAS Platten und RAID Systemen unter großer Last kann es schon mal viele Stunden dauern, bis eine Hot Spare komplett eingesprungen ist. In dieser Zeit darf dann bei RAID 5 keine weitere Platte ausfallen. Eine einfache Lösung ist da das RAID 6, dort dürfen zwei Festplatten ausfallen. Also eine deutlich geringere Wahrscheinlichkeit von Datenverlust. Also je größer die Platten im RAID, desto besser ist ein RAID 6 oder RAID 7.

Kann jede Festplatte als Hot Spare genutzt werden? Für jeden Typ und jede Größe muss eine individuelle Hot Spare vorhanden sein, genauer gesagt, die Hot Spare muss gleich oder größer als die Nutzplatte sein. Die meisten Hersteller schreiben aber exakt die gleiche Festplatte als Hot Spare vor. Ist das RAID Storage also mit SSD, SAS und NL-SAS Platten bestückt, so müssen auch für jeden Typ die passenden Hot Spare Platten bzw. SSDs vorhanden sein.
Warum nicht einfach die größte Festplatte als universelle Hot Spare? Nehmen wir einmal an, eine SSD fällt aus. Jetzt akzeptiert der RAID Controller die große NL-SAS als Ersatz für die SSD (was nicht immer der Fall ist). Damit ist die Performance für das SSD RAID am Boden. Während der Rebuilds ist die NL-SAS ja sowieso schon unter Hochlast, kann also die eigentlichen Nutzdaten kaum noch verarbeiten. Aber auch hinterher ist die NL-SAS Platte immer die Bremse in dem RAID, weil sich alles nach der langsamsten Platte richten muss. Also keine gute Idee, auch wenn der Controller das akzeptieren würde.


RAID Level 0
Striping

Raid 0 ist eigentlich kein richtiges Raid, die Redundanz fehlt. Die einzelnen physikalischen Festplatten werden im einfachsten Fall hintereinander gehängt. So wird aus der kleinen Platte eine riesige logische Festplatte. Sollte aber eine physikalische Platte ausfallen, so sind alle Daten verloren, da die Informationen nicht redundant gespeichert wurden. Meist werden die Daten jedoch in Blöcke getrennt und dann auf den Platten verteilt. Es entsteht ein "Striping" der Daten. Dies erhöht die Performance der Zugriffe, da von vielen Festplatten quasi gleichzeitig gelesen bzw. auf sie geschrieben werden kann.

RAID Level 0

Kapazität: Anzahl der Platten mal Kapazität kleinste Einzelplatte
Geschwindigkeit: sehr hoch
Ausfallwahrscheinlichkeit: sehr hoch, bei einer Platte folgt Gesamtverlust
Kosten: sehr gering, volle Ausnutzung
Anwendung: Videoschnitt, temporärer Speicher


RAID Level 1
Drive Mirroring

Bei Raid 1 werden die Daten einfach noch einmal auf eine zweite physikalische Platte geschrieben. Dies ist der so genannte Spiegel. Fällt jetzt eine der beiden Festplatten aus, so sind die Daten immer noch auf der zweiten vollständig erhalten. Der Benutzung der logischen Platte kann normal weitergehen. Der große Nachteil sind die hohen Kosten, da für einen Nettobedarf von 72 GB zwei 72 GB Festplatten angeschafft werden müssen.

RAID Level 1

Kapazität: Halbe Anzahl der Platten mal Kapazität kleinste Einzelplatte
Geschwindigkeit: hoch
Ausfallwahrscheinlichkeit: gering, eine Platte darf ausfallen ohne Datenverlust
Kosten: hoch, nur halbe Ausnutzung
Anwendung: Datenbanken, Betriebssystem, hohe I/O-Last


RAID Level 2
Hamming System

Die Daten werden in einzelne Bytes aufgeteilt und ein ECC (Error Correction Code) nach Hamming errechnet und auf dedizierte Festplatten geschrieben. Da heute alle Festplatten interne ECC-Berechnungen durchführen, wird diese Methode zur Korrektur einzelner Bit-Fehler nicht mehr verwendet.


RAID Level 3
Byte-Striping mit dediziertem Parity-Laufwerk

Die Daten werden in einzelnen Bytes aufgeteilt und auf die Festplatten geschrieben. Die Parity-Informationen werden zu jeder Datenreihe auf die dedizierte Parity-Platte geschrieben. Dieser RAID-Level wird nur selten angewendet, da die Parity-Platte der Flaschenhals (bottle neck) ist.


RAID Level 4
Block-Striping mit dediziertem Parity-Laufwerk

Dieses Verfahren ist mit dem RAID-Level 3 vergleichbar, jedoch werden die Daten in Blöcke aufgeteilt. Ein großer Nachteil sind Schreiboperationen, da die Parity-Informationen berechnet und auf die eine dedizierte Festplatte geschrieben werden müssen. Diese Platte wird schnell zum Flaschenhals im Gesamtsystem.
Der Flaschenhals kann dadurch verhindert werden, dass die Parity-Informationen im RAID-Controller zwischengespeichert und in großen Blöcken auf die Platte geschrieben werden.
Der größte Vorteil von RAID 4 ist die Erweiterbarkeit um zusätzliche Festplatten ohne Umorganisation der Festplatteninhalte. Es wird eine Festplatte hinzugefügt, die Parity-Informationen bleiben erst einmal alle gleich, die Platte kann sofort genutzt werden.


RAID Level 5
Block Striping mit verteilter Parity

Bei diesem Raid-Level werden die Daten nicht gespiegelt, sondern es wird eine Kontrollsumme berechnet, die auf eine der vorhandenen n Festplatten geschrieben wird. n-1 Festplatten enthalten also die Nutzdaten, die Kontrollinformation (Parity) wird auf die n-te Festplatte geschrieben, allerdings nicht immer auf die gleiche. Erst wird die erste, dann die zweite, die dritte und so weiter für die Parity-Informationen genutzt. Die anderen halten jeweils die Daten. Fällt eine Festplatte aus, so werden immer die fehlenden Informationen aus den Kontrollsummen errechnet. Dieser RAID-Level wird häufig bei Fileservern eingesetzt, für Datenbanken ist er wegen den etwas langsameren Schreibzugriffen nicht so gut geeignet.

RAID Level 5

Kapazität: Anzahl der Platten minus 1 mal Kapazität kleinste Einzelplatte
Geschwindigkeit: normal
Ausfallwahrscheinlichkeit: gering
Kosten: gering, nur eine Platte Verlust
Anwendung: Fileserver, Archivierung, Backup-to-Disk, kleine HDD


Raid Level 5EE
Block Striping mit verteilter Parity und gestripter Hot Spare

Dieser RAID-Level ist eine Erweiterung zum RAID 5. Die Hot Spare Platte wird direkt in den RAID-Verbund mit herein konfiguriert. Beim Ausfall einer Platte müssen also nicht alle Daten auf die "Hot Spare" geschrieben werden, einige sind ja schon vorhanden. Der größere Vorteil ist aber, die Daten werden auf alle Platten geschrieben, es ist kein Engpass durch die eine Hot Spare-Festplatte vorhanden. Insgesamt ist der RAID-Verbund schneller wieder intakt, die Redundanz ist schneller wieder vorhanden.
Hinweis: Dieser RAID-Level ist nicht normiert oder vom Begriff her festgelegt. Ein RAID-Level 5EE könnte also auch für eine andere Technik verwendet werden. Vor dem Einsatz sollte die technischen Daten genau geprüft werden.

RAID Level 5EE

Kapazität: Anzahl der Platten minus 2 mal Kapazität kleinste Einzelplatte
Geschwindigkeit: normal
Ausfallwahrscheinlichkeit: gering, schneller Aufbau der Hot Spare
Kosten: gering, nur zwei Platte Verlust
Anwendung: Fileserver, Archivierung, Backup-to-Disk


RAID Level 6 (RAID ADG)
Block Striping mit verteilter Parity auf 2 Platten

Dies ist eine Weiterentwicklung von RAID 5. Es können 2 Festplatten aus dem Verband ausfallen und die Daten sind immer noch lesbar. Je nach Entwickler wird die Parity einfach wie bei RAID 5 berechnet und dann auf 2 Platten geschrieben, oder es wird eine neue Parity berechnet, inklusive der ersten Parity-Informationen. Von den Lesezugriffen wird eine ähnliche Geschwindigkeit wie bei RAID 5 erreicht. Wenn eine spezielle Hardware zur Berechnung der Parity-Informationen verwendet wird, ist RAID 6 im schreibenden Zugriff ähnlich schnell wie RAID 5. Dieser RAID-Level ist nicht fest und eindeutig definiert, unterschiedliche Hersteller können verschiedene Implementierung vorgenommen haben bzw. vornehmen. RAID 6 wird auch unter der Bezeichnung RAID ADG (Advanced Data Guarding) angeboten. RAID-Systeme, auch mit RAID 6, finden Sie in unseren Angeboten.

RAID Level 6

Kapazität: Anzahl der Platten minus 2 mal Kapazität kleinste Einzelplatte
Geschwindigkeit: normal
Ausfallwahrscheinlichkeit: sehr gering (2 Platten ohne Datenverlust)
Kosten: normal, zwei Platten Verlust
Anwendung: Fileserver, Archivierung, Backup-to-Disk, große HDD


RAID Level 7 (RAID TP)
Block Striping mit verteilter Parity auf 3 Platten

Dies ist eine Weiterentwicklung von RAID 5 und RAID 6. Es können 3 Festplatten aus dem Verband ausfallen und die Daten sind immer noch lesbar. Je nach Entwickler wird die Parity einfach wie bei RAID 5 berechnet und dann auf 2 Platten geschrieben, oder es wird eine neue Parity berechnet, inklusive der ersten beiden Parity-Informationen. Von den Lesezugriffen wird eine ähnliche Geschwindigkeit wie bei RAID 5 erreicht. Wenn eine spezielle Hardware zur Berechnung der Parity-Informationen verwendet wird, ist RAID 6 im schreibenden Zugriff ähnlich schnell wie RAID 5. Dieser RAID-Level ist nicht fest und eindeutig definiert, unterschiedliche Hersteller können verschiedene Implementierung vorgenommen haben bzw. vornehmen. RAID 7 wird auch unter der Bezeichnung RAID TP (Triple Parity) angeboten. RAID-Systeme, auch mit RAID 7, finden Sie in unseren Angeboten.

Kapazität: Anzahl der Platten minus 3 mal Kapazität kleinste Einzelplatte
Geschwindigkeit: geringer (Parity Berechnungen)
Ausfallwahrscheinlichkeit: sehr sehr gering (3 Platten ohne Datenverlust)
Kosten: normal, drei Platten Verlust
Anwendung: Fileserver, Archivierung, Backup-to-Disk (hohe Verfügbarkeit)


RAID Level 1+0 und 0+1
Mirrored Striped RAID

Dieser Raidlevel wurde erst später geschaffen. Er ist eine Kombination aus Raidlevel 1 und 0, also dem Spiegeln der Daten und dem Aneinanderreihen der Festplatten. Sie verbinden den Geschwindigkeitsvorteil von Raid 0 und die Sicherheit von Raid 1. Der Einsatz bietet sich speziell bei Datenbanken an.

RAID Level 10

Kapazität: Halbe Anzahl der Platten mal Kapazität kleinste Einzelplatte
Geschwindigkeit: sehr hoch
Ausfallwahrscheinlichkeit: gering, eine Platte darf ausfallen ohne Datenverlust
Kosten: hoch, nur halbe Ausnutzung
Anwendung: Datenbanken, hohe I/O-Last


RAIDn
"frei-definierbares RAID"

RAIDn ist eine Entwicklung der Inostor Corporation, einer Tochter von Tandberg. Die bisherige starre Definition von RAID wurde durchbrochen. Durch die Anzahl der Festplatten insgesamt und die Anzahl der maximal ausfallenden Platten (ohne Datenverlust) definiert sich das RAID. Dieser RAID-Level maximiert die Verfügbarkeit und minimiert den Plattenplatz-Overhead. Weiterhin wurden Lese- und Schreibgeschwindigkeit verbessert.

n = Anzahl der Festplatten insgesamt
m = Anzahl der Festplatten, die ohne Datenverlust ausfallen dürfen
n > m >= 0

Aus diesen Definitionen ergeben sich die folgenden Berechnungen für diesen RAID-Level:

Lesegeschwindigkeit = n mal Einzelplatte
Schreibgeschwindigkeit = ( n - m ) mal Einzelplatte
Kapazität = ( n - m ) mal Einzelkapazität
Einige spezielle Definitionen wurden festgelegt:
m = 1 entspricht RAID 5
m = 0 entspricht RAID 0
m = n - 1 entspricht RAID 1

Weiterhin ist eine dynamische Änderung der Konfiguration beim Hinzufügen von Festplatten integriert. Die Verfügbarkeit bleibt so erhalten.


Wie ist ein RAID aufgebaut?

Prinzipiell gibt es zwei Möglichkeiten ein RAID physikalisch aufzubauen. Die einfachste Methode ist es, komplette Festplatten zu verwenden und daraus ein RAID aufzubauen. Nimmt man jetzt zum Beispiel 8 Festplatten mit jeweils 1 TB Kapazität und generiert ein RAID 5, so erhält man ca. 7 TB Nutzkapazität. Wenn man jetzt aber für einen Server wesentlich weniger braucht, so kann man die 7 TB in Partitionen aufteilen und diese den verschiedenen Rechnern zuordnen. So würde es ein RAID-System in einem SAN machen. Möchte man aber neben einer Partition in RAID 5 auch eine Partition in RAID 10, so geht dies mit diesem Verfahren nicht.
Die zweite Möglichkeit der Aufteilung geht anders vor: Jetzt wird aus jeder der 8 Festplatten ein Teil herausgeschnitten und diese 8 Teile werden mit RAID 5 verknüpft. Daraus erhält der Controller eine virtuelle Platte in RAID 5. Jetzt ist aber auf den physikalischen Platten noch Speicherplatz vorhanden. Als nächstes werden wieder Teile aus den 8 Festplatten herausgeschnitten und zu einem RAID 10 zusammengefasst. Mit den nächsten Teilen könnte man ein RAID 6 bauen oder wieder ein RAID 5.
Nicht jeder Hersteller kann beide Methoden verarbeiten, die meisten Hersteller verwenden nur eine der beiden Verfahren. Je nach dem was Sie benötigen, wir wählen das passende System für Sie aus.


Weitere Informationen

Dieses komplexe Thema kann nicht in voller Breite beschrieben werden. Für weitere Informationen zu diesem Bereich nutzen Sie unser Kontaktformular. Wir beantworten Ihnen gerne unverbindlich spezielle und individuelle Fragen zur Gestaltung von Raid-Leveln.


Angebote der Stor IT Back zum Thema RAID

Angebot Dell EMC ME4 Serie / ME4012 ME4024 ME4084
Dell EMC ME4 Serie iSCSI, FC SAS-RAID
Single/Dual Controller, Block Storage

10 Gbit/s iSCSI, 16 Gbit/s FC, 12 Gbit/s SAS Host
SSD, SAS, NL-SAS Platten / Replikation / Tiering
ab 8.706,00 Euro
zzgl. MwSt.
Angebot Netapp E2800
NetApp E2800 Fibre Channel / iSCSI / SAS RAID
16 Gbit/s FC / 10 Gbit/S iSCSI / 12 Gbit/s SAS

mit 900 GB bis 1,8 TB SAS- und/oder 4 bis 10 TB NL-SAS-Festplatten
ab 9.308,00 Euro
zzgl. MwSt.
Angebot Infortrend ESDS 1000
Infortrend EonStor ESDS 1000 Serie
SAS/iSCSI/FC - to - SAS RAID-System

mit 12/16/24 x SAS Einschüben (Hot Swap)
Infortrend ESDS 1012R/G, 1016R/G, 1024RB/GB/G
ab 2.166,00 Euro
zzgl. MwSt.
 
Angebot Datacore SanSymphony V10
Datacore SANsymphony V10 auf Supermicro
Software Defined Storage von Datacore

24 x SATA/SAS-Festplatten (max. 24 x 1,2 TB)
Replikation / Cluster / SSD Cache / Tiering
Preis
auf Anfrage

Angebot Lenovo Thinsystem DS2200
Lenovo ThinkSystem DS2200 SAN Storage
FC / iSCSI / SAS Host, NL-SAS / SAS / SSD Festplatten

bis zu 96 Festplatten, Dual Controller
Real Time Tiering, Storage Pools, Thin Provisioning
Preis
auf Anfrage
Angebot Open-E JovianDSS
Open-E JovianDSS Komplett-System
ZFS-based Appliance, hochverfügbar, kostengünstig

8, 16 oder 24 x SAS/NL-SAS-Festplatten (max. 16 x 10 TB)
ab 6.149,00 Euro
zzgl. MwSt.
 
 
Zurück zur Übersicht
Serverraum Rechenzentrum oben
Übersicht der Angebote
Kontakt zur Stor IT Back
Suche auf der Webseite