[Fli4l_dev] Aktueller Tarball fli4l-3.9.0-rev27929-testing

Matthias Prager linux at matthiasprager.de
Sa Jun 29 21:17:17 CEST 2013


Hallo Christoph,

erst einmal ein Dankeschön, für die Hilfe bei der
Ursachensuche.

Am 29.06.2013 10:23, schrieb Christoph Schulz:
> Hallo!
> 
> Matthias Prager schrieb:
> 
>> Am 23.06.2013 21:22, schrieb Matthias Prager:
>>> Hallo zusammen,
>>>
>>> r27929 läuft hier soweit ok. Ich probiere den Kernel 3.9.6,
>>> vielleicht läuft dieser ja ohne Abstürze mit dem e1000e
>>> (im Gegensatz zu 3.9.4). r27888 lief mit Kernel 3.2.46
>>> soweit stabil.
>> Dem ist leider nicht so. Das e1000e Modul hängt sich im 3.9.6
>> Kernel immer noch auf. Habe wieder auf den 3.2er geswitcht.
> 
> Kannst du bitte prüfen, ob es das leidige ASPM-Problem ist? Zu Details siehe 
> [1]. Einfach
> 
> lspci -vv | grep ASPM

'ASPM L0s L1 Enabled' bei beiden Netzwerkkarten.

> 
> ausführen und schauen, ob überall "ASPM Disabled" steht. Wenn nicht, 
> könntest du den Workaround in [1] ausprobieren (also nach dem Booten
> 
> setpci -s 02:00.0 CAP_EXP+10.b=40

Habe ich ausgeführt für beide Karten, danke für setpci. ASPM jetzt
aus auf beiden Karten. Feedback kann allerdings durchaus wieder
eine Woche dauern (Problembedingt).

> 
> ausführen, wobei "02:00.0" durch die PCI-Adresse deines e1000e-Adapters 
> ersetzt werden muss, siehe erste Spalte von "lspci | grep 82574L") und 
> schauen, ob damit das System stabil läuft. setpci ist momentan leider nicht 
> im fli4l-Lieferumfang, du findest es aber auf meinem Server unter [2].
> 
> Wenn das alles nicht hilft, hilft evtl. der Patch von [3]. Dann müsste ich 
> mal einen Testkernel für dich bauen...
> 
> Ach ja: Könntest du auch bitte ein aktuelles Kernel-Fehler-Protokoll zur 
> Verfügung stellen?

Ich habe es leider versäumt das letzte zu speichern. Aber ich habe
eines vom 15.06. mit Kernel 3.9.5 zu bieten:

------------[ cut here ]------------
WARNING: at net/sched/sch_generic.c:255 dev_watchdog+0xce/0x122()
Hardware name:
NETDEV WATCHDOG: eth1 (e1000e): transmit queue 0 timed out
Modules linked in: evdev xt_IMQ imq cls_fw sch_sfq sch_htb nf_nat_ftp nf_conntrack_ftp pppoe pppox ppp_generic slhc 8021q mrp garp stp llc e1000e ptp pps_core button rtc_cmos nls_iso8859_1 ums_usbat ums_sddr55 ums_sddr09 ums_realtek ums_onetouch ums_karma ums_jumpshot ums_isd200 ums_freecom ums_eneub6250 ums_datafab ums_cypress ums_alauda usb_storage ahci libahci ata_piix ata_generic sr_mod cdrom sd_mod isofs ext4 jbd2 mbcache crc16 hid_generic usbhid hid ehci_pci uhci_hcd ohci_hcd ehci_hcd xhci_hcd usbcore usb_common libata scsi_mod pcspkr
Pid: 0, comm: swapper/0 Not tainted 3.9.5 #1
Call Trace:
 [<c1024c01>] warn_slowpath_common+0x77/0x8e
 [<c11c25c7>] ? dev_watchdog+0xce/0x122
 [<c11c25c7>] ? dev_watchdog+0xce/0x122
 [<c1024c94>] warn_slowpath_fmt+0x2e/0x30
 [<c11c25c7>] dev_watchdog+0xce/0x122
 [<c11c24f9>] ? netif_tx_unlock+0x3e/0x3e
 [<c102dd7e>] call_timer_fn.isra.34+0x19/0x70
 [<c1048183>] ? ktime_get+0x3d/0x69
 [<c101a00c>] ? apic_write+0xf/0x11
 [<c102def2>] run_timer_softirq+0x11d/0x14f
 [<c1029efd>] __do_softirq+0x8d/0x141
 [<c102a063>] irq_exit+0x36/0x6f
 [<c101a5c9>] smp_apic_timer_interrupt+0x64/0x71
 [<c104e778>] ? __tick_nohz_idle_enter+0x134/0x36a
 [<c128a6ed>] apic_timer_interrupt+0x2d/0x40
 [<c100819b>] ? default_idle+0x1e/0x2e
 [<c100871d>] cpu_idle+0x50/0x6a
 [<c1279d90>] rest_init+0x58/0x5a
 [<c13b08e7>] start_kernel+0x2b7/0x2bd
 [<c13b046d>] ? repair_env_string+0x51/0x51
 [<c13b02af>] i386_start_kernel+0x79/0x7d
---[ end trace 2f824ab818e01993 ]---
e1000e 0000:01:00.0 eth1: Reset adapter unexpectedly
e1000e 0000:01:00.0 eth1: Timesync Tx Control register not set as expected


eth1 ist im übrigen das DSL/Provider-Seitige Interface.

Viele Grüße
Matthias


Mehr Informationen über die Mailingliste Fli4l_dev