[Eisfair] Problem mit Softraid oder ist es ein HW Problem?

Marcus Roeckrath marcus.roeckrath at gmx.de
Fr Jun 2 14:55:26 CEST 2017


Hallo Thomas,

Thomas Zweifel wrote:

>> An den SMART-Daten weiterhin nichts Auffälliges.
>> 
>> Der letzte Selbsttest ist korrekt durchgelaufen, die hängenden und von
>> Dir abgebrochenen werden korrekt als "Aborted by host" gemeldet.
>> 
>> Die Platten scheinen in Ordnung.
> 
> Da bin ich doch noch etwas skeptisch, ob man den Platten nun trauen
> kann. Schliesslich haben sie kurz zuvor einen Patzer abgeliefert...

Ich habe nun auch etwas Stress mit einer Platte im RAID1 meines
Schulservers.

Mir fielen zunächst lange leere Werte in eisgraph auf und dachte zunächst an
Stromausfall oder so - war aber nicht.

Irgendwie war ein collect von eisgraph nicht fertig geworden und fcron
verhindert, dass ein noch laufender Job nicht nochmal gestartet wird.

Bei Durchsicht der messages kommen ata-Meldungen zutage, die auch im
Plattenlog sind (z. B. READ DMA, WRITE DMA, WRITE FPDMA QUEUED ohne
Sektorangaben).

Das geht ein paar Stunden (nachts) so, eisgraph hat sich irgendwann auch
beruhigt und loggt brav weiter und auch keine sonstigen Ausfälle. Keine
Warnmail von smartd, ..., also fast Zufall, dass ich überhaupt aufmerksam
wurde.

smartctl zeigt "fast" jungfräuliche Werte, short und long test immer
fehlerfrei (auch aktuell).

Nach Reboot heute nacht noch 3 weitere Errors von obigem Typ, danach bislang
Ruhe, auch unter der Last des täglichen Betriebs.

Denke, die Platte kommt raus, mir ist das zu heikel.

-- 
Gruss Marcus


Mehr Informationen über die Mailingliste Eisfair