Forum: Mikrocontroller und Digitale Elektronik Ausfallwahrscheinlichkeiten


von AF Overlay (Gast)


Lesenswert?

Hallo, wie war das nochmal?:

Wenn ich 3 voneinander abhängige Komponenten habe, werde die 
Ausfallwahrscheinlichkeiten dann addiert oder multipliziert?

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

Die Nicht-Ausfall-Wahrscheinlichkeiten werden multipliziert.

von AF Overlay (Gast)


Lesenswert?

Also der Kehrwert der MTBF jeder einzelnen Komponente?

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

MTBF ist eine Zeit.

Wahrscheinlichkeiten sind relativ (bzw. Prozente).

von Wolfgang R. (Firma: www.wolfgangrobel.de) (mikemcbike)


Lesenswert?

Die FIT-Werte werden addiert.

von AF Overlay (Gast)


Lesenswert?

Hier geht es um Festplatten.
FIT Werte sind mir da noch nicht untergekommen.
Wohl aber MTBF was Meantime BETWEEN Failures bedeutet und nicht before!

Aus Erfahrung ist es durchaus realistisch, das sich eine drehende 
Festplatte
nach 5 Jahren verabschiedet (Ja, ich sehe auch Platten die laufen 10 
jahre einwandfrei).

Annahme 5 solcher Festplatten im RAID 0 /Striping) bei Betrachtung über 
5 Jahre.
Dann hätte ich innerhalb eines Jahres einen sicheren Ausfall des 
Gesamtsystems.

P.S.: Nein, das ist keine Hausaufgabe;-)

von Wolfgang (Gast)


Lesenswert?

AF Overlay schrieb:
> Dann hätte ich innerhalb eines Jahres einen sicheren Ausfall des
> Gesamtsystems.

Nein, es handelt sich um statistische Größe. Insbesondere bei kleinen 
Wahrscheinlichkeiten kannst du daraus für ein Einzelsystem keine 
konkrete Aussage treffen. Anders sieht das aus, wenn du ein paartausend 
von den Dingern laufen hast.

von Horst Hoden (Gast)


Lesenswert?

AF Overlay schrieb:
> Annahme 5 solcher Festplatten im RAID 0 /Striping) bei Betrachtung über
> 5 Jahre.
> Dann hätte ich innerhalb eines Jahres einen sicheren Ausfall des
> Gesamtsystems.

Nur wenn defekte Teile nicht gewechselt werden ...

Die Erhöhung der Zuverlässigkeit durch Redundanz besteht ja darin, das 
die Kiste weiterläuft auch wenn eine Komponente die Hufe hochreisst. Das 
verschafft dann die Chance diesen Teildefekt zu beheben, bevor die 
redundante Komponente ebenfalls abraucht. Das erhöht aber nicht die 
Gesamtlebenszeit der einzelnen Komponente oder des Systems ohne Wartung. 
Das Prinzip der Einsatzdauer verlängernden Wartung scheint aber immer 
größeren Bevölkerungsanteilen unbekannt zu sein, da wird auf Verschleiß 
gefahren und nach den großen Knall über hinterfotzig eingeplante 
Obsoleszenz schwadroniert.

von LostInMusic (Gast)


Lesenswert?

>Annahme 5 solcher Festplatten im RAID 0 /Striping) bei Betrachtung über 5 Jahre.
>Dann hätte ich innerhalb eines Jahres einen sicheren Ausfall des  Gesamtsystems.

Leider eines der Standard-Falschverständnisse zum Thema 
Wahrscheinlichkeiten. Übertragen auf das gute alte Würfeln: "Wenn man 
sechsmal hintereinander würfelt, dann erhält man mit Sicherheit einmal 
die Augenzahl 6". Das stimmt natürlich NICHT. Die korrekte Wsk, bei 
einem sechsmaligen Würfeln (wenigstens einmal) die Augenzahl 6 zu 
bekommen, beträgt nicht 1, sondern

1 - (1 - 1/6)^6 = 0.6651

Auch bei 20-maligem Würfeln kann von Sicherheit keine Rede sein:

1 - (1 - 1/6)^20 = 0.9739

Die richtige Rechnung zu Deiner Fragestellung findest Du z. B. hier 
(Abschnitt "MTBF zusammengesetzter Systeme"):

https://de.wikipedia.org/wiki/Mean_Time_Between_Failures

von Stefan F. (Gast)


Lesenswert?

AF Overlay schrieb:
> Dann hätte ich innerhalb eines Jahres einen sicheren Ausfall des
> Gesamtsystems.

Nein. Du hättest wahrscheinlich einen Ausfall pro Jahr - nicht sicher.

Aber mit großer Streuung. Es könnten durchaus auch mal 10 Ausfälle in 
einem Jahr sein und dann in den nächsten 10 Jahren kein Ausfall mehr.

von Stefan F. (Gast)


Lesenswert?

Horst Hoden schrieb:
> Die Erhöhung der Zuverlässigkeit durch Redundanz besteht ja darin, das
> die Kiste weiterläuft auch wenn eine Komponente die Hufe hochreisst.

Nicht bei RAID-0, das bietet keine Redundanz.

von Statistiker (Gast)


Lesenswert?

Es gibt eine Formel, mit der du basierend auf der MTBF-Zahl errechnen 
kannst mit welcher Warscheinlichkeit dein Gerät eine bestimmte Zeit 
fehlerfrei übersteht.

Bedenke: Die Festplatten können auch 100 Jahre halten. Allerdings ist 
die Wahrscheinlichkeit entsprechend klein.

Die Formel für die Reliability (Warscheinlichkeit das es nach der Zeit t 
noch geht) lautet:

R = e^(-Lambda*t)

Lambda = 1/MTBF

von Mirko W. (Gast)


Lesenswert?

Statistiker schrieb:
> Die Formel für die Reliability (Warscheinlichkeit das es nach der Zeit t
> noch geht) lautet:
>
> R = e^(-Lambda*t)
>
> Lambda = 1/MTBF

Diese Stelle sollte nochmal hervorgehoben werden.

Wenn du schnell und einfach ein paar Wahrscheinlichkeiten durchrechnen 
willst, empfehle ich:

https://www.servethehome.com/raid-calculator/raid-reliability-calculator-simple-mttdl-model/

von Karl (Gast)


Lesenswert?

AF Overlay schrieb:
> Annahme 5 solcher Festplatten im RAID 0 /Striping) bei Betrachtung über
> 5 Jahre.

Nein, wenn du es zeitlich haben willst, musst du die Zeit auch mit in 
die Berechnung nehmen. Es gibt dafür eine Verteilungsfunktion, Name 
fällt mir jetzt nicht ein. Jedenfalls wird mit jedem tag die 
Wahrscheinlichkeit größer, dass das ding Versagt du musst dann die Werte 
für fünf Jahre der (Nicht-)Ausfallwahrscheinlichkeiten multiplizieren. 
Angenommen von 100 Festplatten fallen 30 nach 5 Jahren aus, dann ist die 
Wahrscheinlichkeit, dass es 5 Jahre funktioniert 0,7⁵ = 16,8 %

von Horst Hoden (Gast)


Lesenswert?

Karl schrieb:
> Angenommen von 100 Festplatten fallen 30 nach 5 Jahren aus, dann ist die
> Wahrscheinlichkeit, dass es 5 Jahre funktioniert 0,7⁵ = 16,8 %

Nein, nicht wenn die festplatten im RAID arbeiten, dann ist das system 
erst ausgefallen wenn alle Platten während der 5 Jahren abkacken und 
nicht ersetzt werden. Und die Wahrscheinlichkeit dafür ist nach deinen 
Vorgaben 0,00243.  (1-(1-0.7)⁵)

von Horst Hoden (Gast)


Lesenswert?

Ergänzung: RAID-1

von Horst Hoden (Gast)


Lesenswert?

Stefan ⛄ F. schrieb:
> Horst Hoden schrieb:
>> Die Erhöhung der Zuverlässigkeit durch Redundanz besteht ja darin, das
>> die Kiste weiterläuft auch wenn eine Komponente die Hufe hochreisst.
>
> Nicht bei RAID-0, das bietet keine Redundanz.

Njein, keine redundanz im sinne von datensicherheit, aber denoch 
redundanz um Sinne von funtkionaller Sicherheit. Angenommen das 
RAID-System wird zur Aufzeichnung/Überwachung (schreibend) benutzt, dann 
kann es das auch bei Ausfall einer Platte tun,indem dann nur noch auf 
die verbliebene Restkapazität geschrieben wird.

Dagegen ist bei Verwendung einer einzelnen Platte höherer Kapazität dann 
schon Schluss.

Im Lesefall kann man das ähnlich sehen, wenn zumindest eine Teilmenge 
als essentieller Datensatzes (bspw. OS-Komponenten) als (Schatten)-Kopie 
vorgehalten wird.

Ähnliche Betrachtungen kann zu der Anzahl von Triebwerken von 
(Passagier-)flugzeugen stellen. Da fällt bei Ausfall eines einzelnen 
Triebwerks auch nicht gleich der Vogel vom Himmel, auch wenn er nicht 
mehr die gleichen Flugparameter (reichweite, Höchstgeschwindigkeit) 
erreicht. Siehe bspw. die Lockheed Super Constellation, das beste 
dreimotorige Flugzeug der Fünfziger Jahre ;-).

von Marc V. (Firma: Vescomp) (logarithmus)


Lesenswert?

Horst Hoden schrieb:
> Ähnliche Betrachtungen kann zu der Anzahl von Triebwerken von
> (Passagier-)flugzeugen stellen.

AF Overlay schrieb:
> Wenn ich 3 voneinander abhängige Komponenten habe, werde die
> Ausfallwahrscheinlichkeiten dann addiert oder multipliziert?

 Im schlimmsten Fall addiert.
 Wenn alle 3 Komponenten jeweils 1 Ausfall pro 100000 Stunden haben,
 dann hast du in Idealfall mit 3 Komponenten 3 Ausfälle in der
 Zeit und wenn es nur 1 Komponente ist, hast du auch nur 1 Ausfall.

 Da weder die Anzahl der Ausfälle noch die Störungsfreie Betriebs-
 zeit garantiert wird, ist das ganze ungefähr so genau wie eine
 Milchmädchenrechnung.

von Arno (Gast)


Lesenswert?

Horst Hoden schrieb:
> Stefan ⛄ F. schrieb:
>> Nicht bei RAID-0, das bietet keine Redundanz.
>
> Njein, keine redundanz im sinne von datensicherheit, aber denoch
> redundanz um Sinne von funtkionaller Sicherheit. Angenommen das
> RAID-System wird zur Aufzeichnung/Überwachung (schreibend) benutzt, dann
> kann es das auch bei Ausfall einer Platte tun,indem dann nur noch auf
> die verbliebene Restkapazität geschrieben wird.

Das ist schöne Theorie, in der Praxis kenne ich zumindest kein RAID-0, 
das das tut. Entweder es wird die eine Hälfte auf Platte 1 und die 
andere Hälfte Platte 2 geschrieben, um doppelte Datenrate zu erreichen, 
oder die Platten hängen hintereinander und Platte 2 wird erst 
beschrieben, wenn Platte 1 voll ist.

Marc V. schrieb:
> Da weder die Anzahl der Ausfälle noch die Störungsfreie Betriebs-
>  zeit garantiert wird, ist das ganze ungefähr so genau wie eine
>  Milchmädchenrechnung.

...zumal die Ausfälle im Allgemeinen nicht gleichverteilt über die 
Betriebsstunden auftreten.

MfG, Arno

von Wolfgang (Gast)


Lesenswert?

Horst Hoden schrieb:
> Im Lesefall kann man das ähnlich sehen, wenn zumindest eine Teilmenge
> als essentieller Datensatzes (bspw. OS-Komponenten) als (Schatten)-Kopie
> vorgehalten wird.

Dann ist es aber kein reines RAID-0 System mehr, sondern hat einen 
anwendungsbezogenen Überbau.

Abwohl RAID für redundant array of independent disks steht, gibt es 
bei RAID-0 laut Definition keine Redundanz.

von Gerald B. (gerald_b)


Lesenswert?

Arno schrieb:
> ...zumal die Ausfälle im Allgemeinen nicht gleichverteilt über die
> Betriebsstunden auftreten.

Es soll schon vorgekommen sein, das die 2. Platte eines RAID5 beim 
Rebuild abgekackt ist.
Die Ausfallwahrscheinlichkeit heißt nicht umsonst, wegen ihrer Form 
"Badewannenkurve"

von georg (Gast)


Lesenswert?

Karl schrieb:
> Jedenfalls wird mit jedem tag die
> Wahrscheinlichkeit größer, dass das ding Versagt

Ja klar - wenn man lange keine 6 gewürfelt hat, wird die 
Wahrscheinlichkeit ja auch von Wurf zu Wurf grösser, das weiss ja jeder 
der was von Statistik versteht.

Georg

von Karl (Gast)


Lesenswert?

georg schrieb:
> Ja klar - wenn man lange keine 6 gewürfelt hat, wird die
> Wahrscheinlichkeit ja auch von Wurf zu Wurf grösser, das weiss ja jeder
> der was von Statistik versteht.

So nicht ganz Korrekt. Die Wahrscheinlichkeit beim nächsten Wurf eine 
Sechs zu bekommen beträgt immer 1:6, egal was vorher war.
Sie wahrscheinlichkeit, dass eine Festplatte zwischen der Betriebsstunde 
10 und 11 ausfällt liegt bei 1:1.000.000.000. Dass sie zwischen 76.650 
und 76.651 ausfällt bei 1:1.000.000.
Es geht aber auch nicht um die Frage was als nächstes kommt, sondern 
darum wie oft man Würfeln kann, ohne dass eine 6 kommt.

von Karl (Gast)


Lesenswert?

Horst Hoden schrieb:
> Ergänzung: RAID-1

AF Overlay schrieb:
> 3 voneinander abhängige Komponenten

Ich würde sagen, dass schließt sich aus.

von Arno (Gast)


Lesenswert?

Gerald B. schrieb:
> Arno schrieb:
>> ...zumal die Ausfälle im Allgemeinen nicht gleichverteilt über die
>> Betriebsstunden auftreten.
>
> Es soll schon vorgekommen sein, das die 2. Platte eines RAID5 beim
> Rebuild abgekackt ist.
> Die Ausfallwahrscheinlichkeit heißt nicht umsonst, wegen ihrer Form
> "Badewannenkurve"

Und beim Rebuild werden die anderen ebenso alten Platten im Allgemeinen 
auch noch hoch belastet, tendenziell höher als im Betrieb.

Was nimmt der TE daraus jetzt mit? "So einfach ist das alles nicht".

MfG, Arno

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.