[Eisfair] Problem mit Softraid oder ist es ein HW Problem?

Kay Martinen kay at martinen.de
Mi Nov 22 15:17:40 CET 2017


Am 22.11.2017 um 00:10 schrieb Marcus Roeckrath:
> Hallo Kay,
> 
> Kay Martinen wrote:
> 
>>> Hat das Board eventuell mehrere SATA-Controller und hängen sdd und sde an
>>> einem anderen als sdb und sdc?
>>>
>>> Da ist der erste Controller (ata1/2):
>>>
>>> ata_piix 0000:00:1f.2: version 2.13
>>> ata_piix 0000:00:1f.2: MAP [ P0 P2 P1 P3 ]
>>> ata1: SATA max UDMA/133 cmd 0x1f0 ctl 0x3f6 bmdma 0x1c10 irq 14
>>> ata2: SATA max UDMA/133 cmd 0x170 ctl 0x376 bmdma 0x1c18 irq 15
>>>
>>> Hier der zweite (ata3/4), welches genau sdd und sde sind, die aussteigen:
>>>
>>> ata_piix 0000:00:1f.5: MAP [ P0 -- P1 -- ]
>>> ata3: SATA max UDMA/133 cmd 0x1c68 ctl 0x1c5c bmdma 0x1c30 irq 17
>>> ata4: SATA max UDMA/133 cmd 0x1c60 ctl 0x1c58 bmdma 0x1c38 irq 17
>>
>> Hier fällt mir auf das es doch eigentlich 4 Controller sein dürften von
>> denen vermutlich jeder zwei Ports bedient. Die letzten Beiden teilen
>> sich aber einen IRQ. Die anderen beiden haben jeweils eigene. Da ich
>> vorher was von lost interrupt las könnte das eine Spur sein.
> 
> Ich glaube, die starre Einteilung von IDE (pro Port zwei Geräte) können wir
> bei den modernen Chipsätzen vergessen.

Warum eigentlich. Bei USB-Controllern hast du doch im Allg. auch nur 2 
Ports pro RootHub. Beim P-ATA/IDE-Ersatz S-ATA das gleiche Schema zu 
verwenden macht die Sache nur kompatibler. Alte PC hatten keinen 
Standard für einen 3. IDE Controller. Von weiteren ganz zu schweigen.


> Es sind hier scheinbar wirklich 2 Controller (anhand der unterschiedlichen
> PCI-Anschlüsse) mit scheinbar unterschiedlichen vielen physikalischen
> Sata-Anschlüssen.

Du meinst also die Angaben in Eckigen Klammern [P0 -- P1 --] geben die 
Gerätebelegung nicht korrekt wieder? Für mich sah das so aus als wären 4 
Geräte an zwei Controllern mit 2 IRQs und 2 Geräte an 2 Controllern mit 
einem Shared IRQ.


> Für genaueres bräuchte man nun die genaue Boardbezeichnung.

Da stimme ich dir zu.


> Interupts könne auch shared werden; ich nehme an, Helmut hat das im Bios
> alles auf Standard (Default) stehen.

Auch ne Vermutung. Ob es unter linux bei Geräten auf Shared IRQ und 
höherer Last zu verlorenen Ints kommt und in folge zu Zugriffsfehlern 
weißt du nicht zufällig?

> 
>>> Das hängt jeweils dran:
>>>
>>> ata4.00: ATA-9: WDC WD20EFRX-68EUZN0, 82.00A82, max UDMA/133
>>> ata3.00: ATA-8: ST2000DM001-9YN164, CC4B, max UDMA/133
>>
>> Was heißt hier eigentlich CC4B und warum steht es überall nur nicht bei
>> der WD?
> 
> Sieht mir nach Firmwareversion aus; da brät jeder Hersteller sein eigenes
> "Nummerierungsschema".

Ich dachte erst an 48 Bit LBA bis ich merkte das es 4B heißt...

> 
>> Kurze suche ergibt das die Seagate zwar eine Barracuda ist, aber ein
>> Desktop-Modell. Die WD dagegen sehe ich als WD RED und die ist für
>> Dauerbetrieb gedacht.
>>
>> Witzig daran auch: In einem Datenblatt finde ich zu der Seagate die Angabe
>>
>> Power On Hours: 2400
> 
> Es steigen aber eine Seagate und die WD gleichzeitig aus.
> 

War nur ne idee ob das Unterschiedliche Timeout-verhalten in einem Raid 
5 das erklären könnte. Oder Dabei ein tiefer liegendes Problem zutage 
tritt. Vielleicht ist richtig neu formatieren eine gute idee.

Kay


Mehr Informationen über die Mailingliste Eisfair