Wissen Platzhalter

RAID

Was ist RAID überhaupt? Und vor allem: was bringt RAID für den Videoschnitt mit DV?

// 15:02 Mo, 20. Mai 2002von


Was ist RAID?

Ein RAID (Redundant Array of Independent Disks)-System besteht aus mehreren Festplatten, die dem Nutzer (und dem Betriebssystem) gegenüber als eine einzige erscheinen. Intern verteilt das RAID-System die Daten jedes Files beim Schreiben gleichmäßig über alle im Array vorhandenen Festplatten, so daß beim Lesen eines Files die Daten von allen Platten kommen. Der Vorteil besteht darin, daß im Idealfall die resultierende Lesegeschwindigkeit die Addition der Transfergeschwindigkeit aller Platten ist, also bei drei genutzten Festplatten drei mal so hoch ist wie bei einer einzelnen Platte, bei 4 Platten viermal so hoch. Die Grenze wird dann nur durch die maximale Geschwindigkeit des Übertragungssystems beschränkt, was in gängigen Systemen der PCI-Bus ist.


Die Zugriffsgeschwindigkeit aber verbessert sich nicht, nur die Transfergeschwindigkeit. Grundsätzlich gilt für parallel geschaltete Festplatten, dass sie prinzipbedingt am besten arbeiten, wenn alle Festplatten ungefähr die selbe Geschwindigkeit besitzen. Außerdem müssen alle verwandten Partitionen die gleiche Größe besitzen. Daher ist es äußerst ratsam, immer Festplatten des gleichen Typs zu verwenden. Für ein effizientes RAID-System sind immer mehrere Festplatten erforderlich. Verschiedene Partitionen auf einer Festplatte können zwar theoretisch auch ein RAID-System bilden, jedoch erzielt man hierbei keinen Geschwindigkeitsvorteil, da eine Festplatte nicht gleichzeitig auf mehrere Partitionen zugreifen kann.





RAID und DV

Allerdings können nur bestimmte Anwendungen von der besonderen Leistungsfähigkeit von RAID-Systemen profitieren: Anwendungen die wenige große Files möglichst schnell brauchen – also z.B. Videoschnittapplikationen. DV-Datenströme sind zwar nur 3,6 MB/s schnell (ein Wert den jede moderne Festplatte spielend schafft), aber wenn zahlreiche DV-Ströme gleichzeitig verwendet werden, oder mit unkomprimierten Videodaten gearbeitet wird, dann ist eine einzelne Festplatte schnell überfordert. Derartige Datenmengen können nur von SCSI-Spezialfestplatten mit 10.000 Umin oder mehr oder eben einem RAID-System bewältigt werden. Bei DV kommt es oftmals auch darauf an, wie gut die Videoschnittlösung puffert. Canopus Lösungen besitzen einen so guten guten Softwarepuffer, daß auch noch 3 DV-Ströme von einer einzigen IDE-Festplatte ohne Aussetzer abgespielt werden können, während andere Lösungen teilweise schon bei der längeren Ausgabe von zwei Strömen ins Stottern geraten. Dies hängt wiederum damit zusammen, daß die Festplatte bei zwei oder mehr Strömen dauernd zwischen den zwei Clips hin und her springen muß, was die effektive Datentransferrate stark vermindert, da der Kopf nicht sequentiell lesen kann. Eine höhere Datentransferrate in einem RAID-Array kann diesen Effekt wieder vermindern, auch wenn sich die eigentliche Zugriffszeit durch das RAID-Array nicht verbessert. Selbst wenn Videoströme nur 7,2 MB/s benötigen, kann eine verdoppelte Transferrate von 20 MB/s auf 40 MB/s helfen, dropped Frames zu vermeiden, weil jetzt der Lesekopf der Festplatte (relativ gesehen) mehr Zeit hat, sich zu positionieren.



Ein Nachteil eines RAID 0-Systems (s.u.) ist die verminderte Datensicherheit: Wenn eine der Festplatten ausfällt, sind die Daten aller anderen auch nicht mehr zu gebrauchen – das Risiko erhöht sich also mit jeder eingesetzten Festplatte. Um dieses Manko auszugleichen, gibt es verschiedene Varianten von RAID, Level, genannt, die je nach Einsatzgebiet und Ressourcen eine bestimmte Gewichtung der Faktoren Geschwindigkeit, Preis und Datensicherheit erlauben. Systeme können auch „hot-pluggable“ konfiguriert werden, d.h. bei Ausfall einer Festplatte kann diese im laufenden Betrieb ohne Datenverlust ersetzt werden.




SCSI oder EIDE-RAID?

Früher waren SCSI-Platten für RAID-Systeme die einzige Möglichkeit, und RAID wurde nur in Servern eingesetzt, heute sind RAID-Systeme auch für den Heimanwender erschwinglich und dank der fortgeschrittenen Entwicklung, der Schnelligkeit und des Preises EIDE-Platten die einzig vernünftige Wahl. Ein Vorteil von SCSI-Arrays ist das bis zu 15 Geräte an einem Kabel hängen können und die Kabellänge größer sein darf– die Platten also auch extern in einem anderen Gehäuse untergebracht werden können, während die maximale Kabellänge für EIDE-Drives bei der Unterbringung aller Platten in einem Gehäuse Probleme verursachen kann. Und: Es müssen genügend freie Kanäle vorhanden sein: optimal einer pro Festplatte, ein normales Mainboard stellt 2 Kanäle zur Verfügung, jede zusätzliche EIDE-Controllerkarte nochmal 2, billige RAID-Karten 2, besserere 4.







Software RAID

Bei Software-RAIDs übernimmt der Prozessor die Steuerung der Datenverteilung der einzelnen Festplatten, in Betriebssystemen wie Linux oder Windows NT/2000/XP sind verschiedene Versionen von RAID schon integriert (Vorteil: geringe Kosten – Nachteil: etwas Prozessorleistung wird verbraucht).





Hardware RAID

In reinen Hardwaresystemen (Vorteil: Systemunabhängig und keine Prozessorbelastung - Nachteil: höhere Kosten) übernimmt eine RAID-Karten die Steuerungsaufgaben (und eventuell auch die Rechenarbeit für die Prüfsummenerstellung), die auch noch zusätzliche Übertragungskanäle anbietet und per Treiber in verschiedene Betriebssysteme eingebunden werden kann (auch welche die selbst kein RAID beherrschen – das RAID-System erscheint als eine normale Festplatte).





Hardware-Software RAID

Leider sind die RAID-Karten bzw. Chipsätze, die billig für den Heimgebrauch angeboten werden (wie z.B. die Promise FastTrack) oder auf manchen Mainboards integriert sind, keine echten Hardware-RAID-Controller: diese Lösungen sind nur leicht modifizierte IDE-Controller (deswegen sind manche Fasttrack IDE-Controller auch mit ein paar Handgriffen und einem BIOS-Upgrade so schnell in einen eigentlich doppelt so teuren RAID-Controller umgewandelt), die z.B. die für´s Striping/RAID-0 erforderlichen Rechenaufgaben (Auf- und verteilen der Daten in Blöcke) dem Hauptprozessor des PCs überlassen (sie besitzen keinen eigenen Prozessor im Gegensatz zu teuereren Hardware RAID-Lösungen) und deswegen keine Prozessorrechenzeit sparen (die Prozessorleistung, die RAID-0/1 hierbei verbraucht, ist allerdings sehr gering) - sie sind in der Performance in etwa genausogut wie z.B. der in Windows 2000 integrierte Software-RAID. Deswegen bieten diese Lösungen auch keinen der höheren und rechenaufwendigeren RAID-Level (RAID Level >1) an. Ein Vorteil dieser billigen Software-RAID-Karten gegenüber reinen Software-Lösungen ist allerdings, dass der erforderliche Programm-Code in deren BIOS sitzt und deswegen betriebssystemübergreifend und auch fürs Booten genutzt werden kann. Außerdem stellen solche Karten ebenso wie IDE-Controller einfach zusätzliche IDE-Kanäle zur Verfügung.



Verschiedene häufig benutzte RAID-Level:




0: "Striping": hier werden die Daten gleichmäßig in Blöcken über alle Platten verteilt ohne jede Redundanz (und deswegen ist eigentlich RAID Level 0 kein „echtes“ RAID, denn das muss per Definition ja ein „Redundant Array“ sein) , was zu hoher Datentransfergeschwindigkeit führt (maximal doppelt so hoch bei 2 Festplatten): ideal für den Videoschnitt - abgesehen von dem Geschwindigkeitsvorteil bietet Striping einfach die Möglichkeit Partitionen zu schaffen, die größer als die Kapazität einer einzelnen Festplatte sind, erreichbar über einen Laufwerksbuchstaben. "Spanning" ist eine andere Möglichkeit (mehrere Festplatten/Partitionen werden zu einem Laufwerk zusammengefaßt) - aber es bietet dem "Striping" gegenüber nur Nachteile (geringe Sicherheit UND geringe Geschwindigkeit).
1: "Mirroring": hier werden die Daten doppelt auf zwei Laufwerke geschrieben: Redundante Daten, also eine hohe Datensicherheit, aber die Geschwindigkeit ist maximal die eines Einzellaufwerkes.

Es wirkt wie ein ständiges automatisches Backup aller Daten: sehr sicher, aber es steht nur noch die Kapazität einer Platte zur Verfügung.



0+1/10: hier werden beide Verfahren kombiniert: Große Geschwindigkeit und Datensicherheit ist gewährleistet - der Preis: es werden mehrere Festplatten dafür benötigt, mindestens 4 Stück: 2 Platten für einen schnellen Stripe-Array, und beide zur Sicherheit nochmal gespiegelt auf zwei weiteren Platten.

Diese beiden RAID-Level werden von verschiedenen Betriebssystemen unterstützt und auch von den billigeren RAID-Karten. Die höheren und komplexeren RAID-Level minimieren den Platz der für die Datensicherheit aufgewendet wird, indem nicht einfach Daten gespiegelt werden, sondern auf einem zusätzlichen Laufwerk nur Prüfsummen gespeichert werden - dann reicht eine Festplatte mit Prüfsummen aus um Datenverluste durch den Ausfall einer von drei Stripe-Festplatten zu verhindern.




5: Hier werden die Prüfsummendaten nicht auf ein eigenes Laufwerk geschrieben sondern auf alle verteilt. Level 5 bietet ein gute Balance zwischen Geschwindigkeit, Sicherheit und der Plattenanzahl. Software RAID 5 wird von Windows 2000 Server und Linux unterstützt. Entsprechende Hardware Controller sind noch sehr teuer - demnächst wird aber die Promise SuperTrak SX6000 für ungefähr 299 Dollar auf den Markt kommen und Hardware RAID5 erschwinglich machen.

Fragmentierung:

Einer der größten Feinde guter Festplattenperformance ist die Fragmentierung von Files. Fragmentiert werden Files im Laufe der Zeit eigentlich immer - es hängt von der Art der Nutzung ab wie stark sie in einem gewissen Zeitraum fragmentiert - man sollte sich auf jeden Fall angewöhnen regelmässig zu defragmentieren.





IDE-Kanäle:

Am schnellsten sind Festplatten, die in einem RAID-System genutzt werden, wenn jede an einem eigenen Master-Kanal hängt. Warum? Weil ein IDE-Kanal immer nur einen (Lese-Schreib) Befehl ausführen kann und die Ausführung erst bestätigen muß, bevor der nächste Befehl an die Reihe kommt, die Befehle also seriell abgearbeitet werden (im Gegensatz zu SCSI) - was der parallelen Natur von schnellen Level0-RAIDs vollkommen zuwiderläuft, wo alle Platten eines RAIDs gleichzeitig ein File lesen und übertragen können sollen ohne aufeinander zu warten.


Jeder Kanal hat eine maximale Transferrate, die sich die zwei Platten die an ihm hängen teilen müssen. Wenn jedoch jede Platte an einem eigenen Kanal hängt kann sie ihre maximale Transferrate liefern ohne durch die Bandbreite des Kanals beschränkt zu sein.





4 Platten an 2 Kanälen

Wen man gwezwungen ist, 4 Platten an zwei Kanäle zu hängen, hat man immerhin bei manchen RAID-Controllern noch die Möglichkeit, die Leistung zu verbessern, indem man die Strip-Reihenfolge (Stripe-Order, d.h. Die Reihenfolge in der die Festplatten beim Lesen/Schreiben angesprochen werden) daraufhin anpasst, und zwar 1-3-2-4 (wobei 1 die Master Festplatte des ersten Kanals bezeichnt, 2 die Slave des ersten Kanals usw).






Fazit: Brauche ich einen RAID-System?

Nochmal kurz: für den normalen Schnitt mit DV macht ein RAID meistens wenig Sinn - Profis verwenden oft statt einem RAID-Array mit sehr viel Speicherplatz lieber mehrere wechselbare Festplatten für verschiedene Projekte. Nur wenn man mit Applikationen arbeitet, bei denen das Video-Material sehr schnell geladen wird (weil mit mehreren DV Strömen oder unkomprimiertem Material gearbeitet wird) empfiehlt sich RAID-0 - wenn das Material sehr sicher sein soll empfiehlt sich RAID-1 (weil hier alle Daten ständig doppelt auf zwei Platten existieren), wenn Schnelligkeit und Sicherheit wichtig ist: RAID 10/0+1 oder RAID 5.



(Danke an Rudi für seine Mithilfe beim Text)



Kommentare oder Anmerkungen bitte an marfak@slashcam.de


Ähnliche Artikel //
Umfrage
    Welche Streaming-Dienste nutzt Du?













    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash