Hallo zusammen, da ich selbst einen kleinen SmartHome "Server" unter Debian Linux betreibe, habe ich mich gefragt wie sich am sinnvollsten die Festplatte und ggfs externe Backup Festplatten überwachen lassen. Mir ist klar, dass man den Zustand mit den smartmon tools / smartctl abfragen kann, aber wie genau lasst ihr euch über den Zustand informieren? Ab wann und wie eine Warnung per E-Mail schicken? Viele Grüße Holger
Letztendlich fallen Festplatten und SSD meistens plötzlich unerwartet aus. So ein Monitoring nützt daher in der Praxis wenig.
Das mit den generell plötzlichen ausfällen kann ich nicht Unterschreiben. Meine erfahrung sagt, dass etwa 60% der Hdds in SMART auffällig werden vor dem Ausfall. Eine Datensicherung sollte es immer geben aber ein Monitoring kann helfen um Wartungen zu planen.
Steve van de Grens schrieb: > Letztendlich fallen Festplatten und SSD meistens plötzlich unerwartet > aus. So ein Monitoring nützt daher in der Praxis wenig. Es gibt beides. Spontanausfälle und vorher angekündigte.
Steve van de Grens schrieb: > So ein Monitoring nützt daher in der Praxis wenig. Doch, damit du weisst, dass du jetzt schnell in deinem RAID eine Platte tauschen musst. Weil ohne Monitoring merkst du erst etwas, wenn das ganze RAID tot ist.
Ich lasse Webmin mit entsprechenden Alarmen laufen. Hat mir auch schon mal den ausfallenden CPU Lüfter signalisiert. Der kann auch Server wie Apache, Samba und netatalk überwachen, sowie Temperaturen und eben SMART Events. Verschickt dann EMails. https://github.com/webmin/webmin
:
Bearbeitet durch User
Christoph Z. schrieb: > Weil ohne Monitoring merkst du erst etwas, wenn das ganze RAID tot ist. Quark. Also mir ist noch RAID Lösung untergekommen wo der Raid Controller nicht den Verlust einer Platte bemängelt. Sollten tatsächlich 2 Platten ausfallen, grenzt dies wirklich schon an enormen Zufall. (Ich weiß, RAID0 - aber das lasse ich mal einfach weg...) (Btw... mein Controller hat ne LED am Gehäuse vorne. Grün - alles okay. Die blinkt dann immer erst lustig orange bei einem "vorstehenden Ausfall" und blinkt dann rot wenn die Platte tot ist.)
:
Bearbeitet durch User
Rene K. schrieb: > Also mir ist noch RAID Lösung untergekommen wo der Raid > Controller nicht den Verlust einer Platte bemängelt. Mit dem Wissen wächst der Zweifel. Es gibt auch kranke Raidcontroller. Dann sind alle Daten betroffen. Außerdem gab es bei Festplatten auch Serienfehler. Dann sterben ALLE fast zur gleichen Zeit oder öfter dann, wenn ein Rebuild einsetzt und die restlichen Platten dadurch mehr Stress bekommen. Deswegen sind funktionierende Backups (im Schrank) hilfreich.
Rene K. schrieb: > Also mir ist noch RAID Lösung untergekommen wo der Raid > Controller nicht den Verlust einer Platte bemängelt. Mir schon. Mylex DAC960, toller Dreikanal-SCSI-Raidcontroller, kostete ein Schweinegeld, sah keinerlei Schnittstelle vor, um im laufenden Betriebssystem irgendwas über den Zustand des Raids zu erfahren, ja, hatte noch nicht mal 'ne LED oder 'nen Signalpieper dafür. Man musste den Rechner booten, ins Bios-Setup des Controllers gehen, und da konnte man dann den Zustand des Raids bewundern. Geile Kiste. Gut, war vor einem Vierteljahrhundert, aber trotzdem.
Unter Linux ist sicher mdadm die Wahl für ein RAID Array. Das läuft ohne spezielle Controller und mit Standard Filesystemen.
Harald K. schrieb: > Mir schon. Mylex DAC960, toller Dreikanal-SCSI-Raidcontroller, kostete > ein Schweinegeld Nunja, echte Hardware-RAID-Controller gibt es heute ja wohl praktisch garnicht mehr. Also: Wohl wahr, aber heute eher vollkommen irrelevante Anmerkung.
Steve van de Grens schrieb: > Letztendlich fallen Festplatten und SSD meistens plötzlich unerwartet > aus. So ein Monitoring nützt daher in der Praxis wenig. Ja, bei mir vor einer Woche eine 1TB HDD. Mitten drin plötzlich "klack, klack, klack"... lesekopf der ersten oberen datenscheibe auf der Unterseite abgerissen. Altersbedingter Verschleiß, die Platte war von 22012. SMART Werte waren aber alle im grünen Bereich bevor das passiert ist.
:
Bearbeitet durch User
Erfahrung mit einem in Richtung 10 Jahre gehenden Storage Systems mit über 100 2,5" HDDs: Disk wird aufgrund Datenfehlern vom System durch eine Spare ersetzt und getestet. Ergebnis vom Test ist OK, also kommt sie auf die Ersatzbank und wird bei ähnlicher Gelegenheit wieder eingewechselt. Das geht ein paar Mal, bis das System einsieht, dass mit der kein Blumentopf mehr zu gewinnen ist. Hatte ich in den letzten Jahren öfters erlebt, gehört zu den häufigeren Szenarien dieses Systems. Totalausfall und nicht ansprechbar gibt's natürlich auch.
:
Bearbeitet durch User
Ob S. schrieb: > Nunja, echte Hardware-RAID-Controller gibt es heute ja wohl praktisch > garnicht mehr. Nur, weil Du sie nicht kennst, heißt es nicht, daß es sie nicht gibt. Was ist Deiner geschätzten Meinung nach z.B. das hier: https://www.broadcom.com/products/storage/raid-controllers/megaraid-9670w-16i > Also: Wohl wahr, aber heute eher vollkommen irrelevante > Anmerkung. Damit kennst Du Dich jedenfalls besser aus als ich, dagegen kann ich nicht anstinken.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.