[Fli4l_dev] kernel-Bugmeldung im log FLI 3.6.2

Kay Martinen kay at martinen.de
Do Okt 10 17:03:34 CEST 2013


Moin Friedrich

Am 10.10.2013 12:20, schrieb Friedrich Bartel:
> Am 10.10.2013 11:38, schrieb Kay Martinen:
>>
>>> 09.10.2013    00:04:11    router    Notfall    kernel: ------------[
>>> 09.10.2013    00:04:11    router    Kritisch    kernel: Kernel BUG at
>>> 09.10.2013    00:04:11    router    Notfall    kernel: invalid

Und hierzu kein Kommentar?

>>
>>> 09.10.2013    02:35:51    router    Warnung    kernel: eth0: Too much
>>> work at interrupt, status 0x41
> 
> Ist eth0 eine Realteck Karte?

Kann schon sein. Ich benutze jedenfalls den ne2k-pci treiber und es sind
noch zwei smc-ultra combo karten drin. Und da die smc eine 10Mbit ISA
ist muss die eine WAN und die andere DMZ-Seitig sein. Bleibt die Realtek
(Oder Clone) fürs Lan, also eth0. hw-info sagt:

0000:00:14.0 	Ethernet controller 	KTI 	ET32P2

> Die Netzwerkkarte hat sich entweder einen Interrupt eingefangen bevor
> sie mit dem letzten fertig war, oder ein im Treiber eingebauter
> Schwellwert für die Dauer im Interrupt wurde überschritten...

Oder hängt es damit zusammen das zwei Stunden vorher dieser Bug Report
im log steht? Der Router läuft weiter ohne merkbare probleme!
Aber, kann es sein das der Bug da was zum stolpern brachte (ich les da
was von kswapd???)

Ist dir aufgefallen das zwischen bug und too much work 2 stunden liegen
in denen keine warnungen im log standen - außer den üblichen vom pppd.

Korrigiere mich wenn ich irre, aber wenn ein zweiter interrupt ein
trifft wenn die CPU ihn schon bearbeitet müsste sie eine Exception
auslösen. Zumindest bei gleichem interrupt.

> 
> Im Prinzip ist das nur eine Überlastwarnung und ein Schutzmechanismus,
> damit der Treiber nicht den Rechner komplett lahmlegt, wenn die Karte
> ausgelastet ist...

Was würde in dem fall als nächstes passieren? Würde der kernel den
treiber aus dem ram werfen, ihn neu laden und weiter machen?

> 
> Das kann mehrere Gründe haben. Der naheliegenste ist, dass die
> Netzwerkkarte einfach zu müde ist. Oder die Kiste hat zu wenig RAM, zu
> lahmer Prozessor.

Also ich hab auch rrdtool laufen hier. Und in dem Zeitraum um 0 uhr und
um 2 uhr sehe ich beim traffic um 0 uhr nur eine kleine spitze. Der hat
schon weit mehr übertragen ohne das mir solche meldungen aufgefallen
sind. Ist auch *nur* DSL-Lite.

Aber load und cpu bleiben generell bei ca. 0.4 und um 30% ohne
ausreißer. Nur die zahl der verbindungen war leicht erhöht, so 30-100.
Allerdings sind auch die 100 ein peak um 1 uhr weil ich da per cronjob
die zwangstrennung hin legte.

Gut, das RAM ist recht voll, es sind lt. rrdtool nur ca. 1.6 MB frei -
das aber fast immer.
> 
> Tausche die mal gegen eine 3Com aus und weise der Karte einen Interrupt
> zu, also kein Interrupt sharing.
> 

Der Compaq hat nur einen PCI-Slot und kein Setup Im ROM. Ich glaube
nicht das der da was teilt.

ABER, ich habe im server eine 3com die auch einmal auf merkwürdige weise
aussetzte und es danach klaglos wieder tut.
UND, ich bin sowieso auf dem wege mir einen anderen PC für einen neuen
FLI zusammen zu stöpseln.

Ich würde halt nur gern eine erklärung für diese bug meldung im log
finden. Also: Zu wenig RAM oder was mag es wohl sein?

Kay




Mehr Informationen über die Mailingliste Fli4l_dev