Forum: PC Hard- und Software Hdd Smart Fehler verschwunden


von Uto der Sabbernde (Gast)


Lesenswert?

Hallo Leute
Gerade mal wieder in meinen Qnap Nas eingeloggt und da war ich etwas 
verwundert.
Ich hatte seit monaten eine Festplatte mit einer Warnung current pending 
sector waren glaub ich 13. Ich hatte das ignoriert weil die in einem 
Raid verbund steckt und es regelmäßig Backups gibt. Heute zeigt er mir 
keine Warnung mehr an Plattenzustand ist Gut. 0 current pending sector.

Kann das tatsächlich sein das die nach Monaten die Sektoren dann doch 
wieder ok sind?

von Planlos (Gast)


Lesenswert?

die "pending sectors" sind Sektoren, die sich nicht mehr 100%ig lesen 
lassen (checksum error).

Sobald diese (logischen) Sektoren einmal beschrieben worden sind, weiß 
die Platten-Firmware, dass die Daten darauf nicht mehr gebraucht werden, 
und kann die Sektoren verwerfen & ggfs. reserve-sektoren stattessen an 
die Stelle mappen.


Deshalb: nach einem raid-scrub oder vielen Schreib-Aktionen ist es 
normal, dass die "pending sectors" verschwinden. Stattessen sinkt evtl. 
die Anzahl der verfügbaren Reserve-Sektoren.

von oszi40 (Gast)


Lesenswert?

Uto der Sabbernde schrieb:
> Kann das tatsächlich sein das die nach Monaten die Sektoren dann doch
> wieder ok sind?

Hast Du die Kiste zufällig neu eingeschaltet od. gebootet? Bei der 
Gelegenheit könnte manchmal der fehlerhafte Sektor ausgelagert worden 
sein. uptime =?  Trotzdem würde ich mißtauisch bleiben bei dieser HD und 
über einen rechtzeitigen Austausch nachdenken, falls Du wertvolle Daten 
hast.

von Uto der Sabbernde (Gast)


Lesenswert?

Ja tatsächlich hatte ich den wegen usv Wartung einmal runter gefahren. 
Vermutlich deswegen Current pending.
Die Platte hat eine Uptime von 30080H bei nur 8 Power Off. Also die 
platte ist sogut wie neu ;)
Mal ernsthaft ich lass die laufen bis sie nicht mehr mag. Das ist ein 
Raid 5 aus 8 Platten mit Backup auf Lto. Bislang ist noch immer alles 
gut gegangen.

von oszi40 (Gast)


Lesenswert?

Uto der Sabbernde schrieb:
> Raid 5 aus 8

Raid5 ist sicher wie eine Weihnachtsbaumbeleuchtung 2 HDs kaputt und 
finster wars. Es kommt aber ganz darauf an, wie wertvoll die Daten sind. 
Wegen einem TV-Film wäre ich auch nicht traurig, bei DB-Fehlern schon.

von Uto der Sabbernde (Gast)


Lesenswert?

Naja aber wie groß ist die Wahrscheinlichkeit das zwei Platten 
zeitgleich sterben? Und dann hab ich immer noch die Sicherungen auf 
Band.

Bin ich echt der einzige der seine Platten nicht nach x Stunden auf 
verdacht tauscht?

von oszi40 (Gast)


Lesenswert?

Uto der Sabbernde schrieb:
> die Wahrscheinlichkeit das zwei Platten zeitgleich sterben?

Kommt je nach Serienfehler schon mal vor. Vor Jahren starben mal die 
Samsung wie die Fliegen innerhalb von 3 Tagen.

von Jan H. (j_hansen)


Lesenswert?

Uto der Sabbernde schrieb:
> Naja aber wie groß ist die Wahrscheinlichkeit das zwei Platten
> zeitgleich sterben?

Beim anstrengenden Rebuild gar nicht so gering. Bei so vielen Platten 
ist RAID5 nicht mehr die sicherste Variante.

von Uto der Sabbernde (Gast)


Lesenswert?

Wehre R10 da besser?

von Dominik S. (zerobrain)


Lesenswert?

Hast Du Platten mit TLER (z.B. WD "red") usw verbaut? Ein Raid stirbt 
schneller als man denkt.

von Rolf M. (rmagnus)


Lesenswert?

oszi40 schrieb:
> Uto der Sabbernde schrieb:
>> Raid 5 aus 8
>
> Raid5 ist sicher wie eine Weihnachtsbaumbeleuchtung 2 HDs kaputt und
> finster wars. Es kommt aber ganz darauf an, wie wertvoll die Daten sind.
> Wegen einem TV-Film wäre ich auch nicht traurig, bei DB-Fehlern schon.

RAID ist nicht für die Datensicherheit da, sondern für die 
Verfügbarkeit.

Jan H. schrieb:
> Uto der Sabbernde schrieb:
>> Naja aber wie groß ist die Wahrscheinlichkeit das zwei Platten
>> zeitgleich sterben?
>
> Beim anstrengenden Rebuild gar nicht so gering.

Ist ja auch eigentlich eine ungeschickte Konstellation, wenn man lauter 
gleiche Platten hat, eine davon an Altersschwäche zugrunde geht und 
direkt im Anschluss dann die anderen, genauso alten Platten erstmal mit 
etlichen Stunden Dauerlast gestresst werden.

von oszi40 (Gast)


Lesenswert?

Rolf M. schrieb:
> direkt im Anschluss dann die anderen, genauso alten Platten erstmal mit
> etlichen Stunden Dauerlast gestresst werden.

Neben Plattenstress, Systemauslastung wäre auch die lange Rebuildzeit 
einer vollen Platte von bis zu mehreren Taaagen zu bedenken.

von Rolf M. (rmagnus)


Lesenswert?

oszi40 schrieb:
> Rolf M. schrieb:
>> direkt im Anschluss dann die anderen, genauso alten Platten erstmal mit
>> etlichen Stunden Dauerlast gestresst werden.
>
> Neben Plattenstress, Systemauslastung wäre auch die lange Rebuildzeit
> einer vollen Platte von bis zu mehreren Taaagen zu bedenken.

Das sind die "etlichen Stunden Dauerlast", von denen ich sprach.

von Dominik S. (zerobrain)


Lesenswert?

@TO:

Kurzes Video. Beispiele für SMART Fehlermeldungen und ein bisserl 
Gesülze über RAID und TLER....

https://www.youtube.com/watch?v=n9NmEhz6b14

von (prx) A. K. (prx)


Lesenswert?

Jan H. schrieb:
> Beim anstrengenden Rebuild gar nicht so gering. Bei so vielen Platten
> ist RAID5 nicht mehr die sicherste Variante.

Wobei es weniger um die Chance geht, dass im Rebuild eine zweite Disk 
verreckt. Entscheidend ist vielmehr, dass zumindest auf Basis der von 
den Herstellern spezifizierten Zuverlässigkeit von SATA Disks die 
Wahrscheinlichkeit nicht mehr vernachlässigbar ist, dass beim Rebuild 
auf den anderen Disks irgendwelche Sektoren nicht fehlerfrei lesbar 
sind.

Die Wahrscheinlichkeit pro Bit blieb über all die Jahre unverändert. Die 
Kapazität aber nicht, die hat nun die Wahrscheinlichkeit eingeholt. Den 
garantierten(*) Zahlen nach kann man bei heutigen SATA Disks nicht mehr 
sicher damit rechnen, sie komplett fehlerfrei lesen zu können. 2,5er SAS 
Disks liegen 2 Zehnerpotenzen besser, da ist das noch weniger kritisch.

*: Das ist ein Spiel mit spezifizierten Zahlen. Realistische Werte aus 
der Praxis habe ich nicht. Zumal auch die Interpretation dieses 
Zuverlässigkeitswertes nicht völlig klar ist.

Uto der Sabbernde schrieb:
> Wehre R10 da besser?

Bei grösseren RAID Gruppen verwendet man heute 2 Redundanz-Disks. Also 
sowas wie RAID6 oder RAID-DP. Damit ist das oben erwähnte Problem 
abgehakt, denn kein Lesefehler wird auf 2 Disks an der genau dem 
gleichen Inhalt zugeordneten Stelle auftreten.

Gegen Serien- oder Firmwarefehler, bei denen innert weniger Tage das 
ganze Platteninventar verreckt, hat Redundanz freilich kaum eine Chance. 
Der Tipp, deswegen verschiedene Hersteller oder zumindest 
Herstellungschargen zu wählen, ist bei einer grösseren Anzahl Disks 
unrealistisch.

Ein weiteres Problem ist "bit rot", also unerkannte Fehler. Dagegen 
hilft auf RAID-Ebene routinemässiger Integritätscheck (scrubbing) und in 
neueren Filesysteme findet man deshalb einen Schutz mindestens der 
Metadaten durch Prüfsummen.

: Bearbeitet durch User
von A. H. (ah8)


Lesenswert?

Uto der Sabbernde schrieb:
> Naja aber wie groß ist die Wahrscheinlichkeit das zwei Platten
> zeitgleich sterben? Und dann hab ich immer noch die Sicherungen auf
> Band.

Die größte Ausfallwahrscheinlichkeit haben mechanische Platten 
unmittelbar nach dem Einschalten und Platten in einem RAID werden 
typischerweise gemeinsam aus- und wieder eingeschaltet. Wenn Du also 
noch eine zweite Platte im Verbund hast, die sich dem Ende ihre 
Lebenszeit nährt, ist die Wahrscheinlichkeit nicht unerheblich, dass 
nach der nächsten Downtime beide zusammen den Geist aufgeben werden.

Die erhebliche Last beim Rebuild nach Ausfall einer Platte wurde ja 
schon mehrfach erwähnt.

: Bearbeitet durch User
von (prx) A. K. (prx)


Lesenswert?

A. H. schrieb:
> Die erhebliche Last beim Rebuild nach Ausfall einer Platte wurde ja
> schon mehrfach erwähnt.

Die Last beim Rebuild entspricht ungefähr der beim Scrubbing. Und beide 
beschäftigen zwar die Leseelektronik, belasten aber die 
Kopfpositionierung dank des stark sequentiellen Charakters nicht 
übermässig. Vorausgesetzt es ist nicht sowieso grad viel los.

Man könnte natürlich auch zur Schonung der Disks auf Backups verzichten. 
Ein Vollbackup stresst nämlich ähnlich. ;-)

: Bearbeitet durch User
von A. H. (ah8)


Lesenswert?

A. K. schrieb:
> Man könnte natürlich auch zur Schonung der Disks auf Backups verzichten.
> Ein Vollbackup stresst nämlich ähnlich. ;-)

Guter Punkt.

von (prx) A. K. (prx)


Lesenswert?

Mal was aus der Praxis. Zwei nicht sehr alte Systeme der gehobenen 
Klasse vom gleichen Hersteller. Ein Sekundärsystem mit vielleicht 100 
3,5er SATA Disks und ein Primärsystem mit um die 200 2,5er SAS Disks. 
Beim Primärsystem gibts statistisch vielleicht einen Ausfall auf 1-2 
Monate, beim Sekundärsystem weniger als einen pro Jahr.

Die Ausfallrate der 2,5er SAS Disks liegt auch weit oberhalb der alten 
3,5er SAS Disks eines ehemaligen Primärsystems, das als Testsystem 
weiter betrieben wird. Reparaturen durch Scrubbing treten auch beim 
Sekundärsystem so gut wie nicht auf.

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.