[Fli4l_dev] Problem mit Netzwerkkartentreiber (Mellanox)

Alexander Dahl lespocky at web.de
Di Aug 11 12:22:03 CEST 2020


Moin,

B. Sprenger schrieb Dienstag, 11. August 2020, 10:52 (CEST):
> Hallo Alexander,
>> ich habe gestern nochmal in die Quellen von dem Treiber geschaut, s.u.
>> 
>
>> 
>> Darüber hinaus scheint man in diesem Treiber noch erweiterte
>> Log-Ausgaben über Optionen beim Laden anschalten zu können.
> ok, aber das ist nichts wozu ich in der Lage wäre.

Moduloptionen für die Netzwerktreiber kann man doch in der base.txt
angeben? Genaue Syntax habe ich aber gerade nicht im Kopf. O:-)

Im Code sieht das so aus:
https://elixir.bootlin.com/linux/v5.4.55/source/drivers/net/ethernet/mellanox/mlx4/main.c#L64

Ich weiß jetzt nicht ob wir CONFIG_MLX4_DEBUG gesetzt haben, aber wenn,
dann müsste die Option etwa so aussehen:
  
  debug_level=1

>>>> Oder mal recherchiert, ob diese Karten vielleicht eine Firmware benötigen?
>>> Also in Proxmox hat das auf Anhieb (ohne mein Zutun, bzw. PnP) funktioniert.
>>> Ist auch ein 5.4er Kernel, daher war ich der Meinung das sollte so
>>> funktionieren.
>> 
>> Ja da gibt es vermutlich auch udev und wer weiß was noch. fli4l lädt die
>> Treiber ja quasi manuell.
> Ich war der Meinung (bzw. Hoffnung) das würde hier ähnlich leicht 
> funktionieren.

Sollte es eigentlich auch.

>>>> Und noch eine Frage: Ist ein Netzwerkkabel angeschlossen (vorzugsweise
>>>> mit einem Switch am anderen Ende)?
>>> Ja, die Karte hat ein SFP-Modul drin
>>> Oh, jetzt fällt es mir ein, ich glaube ich habe da ein 1GB- SPF-Modul
>>> reingesteckt.
> Das habe ich überprüft.
> Von der Verbindungsseite müsste es gehen.
> Allerdings sind die Status LEDs am Switch aus, also ohne Link.

Mglw. setzt erst der Treiber den Link State auf UP?

>> Kannst Du bitte auch folgendes prüfen? Trage mal als Treiber bitte
>> 'mlx4_en' ein. Dieses Modul liegt direkt neben dem 'mlx4_core' und so
>> wie ich die Kernel-Config verstehe, kann es gut sein, dass beide geladen
>> sein müssen. (Und evtl. zeigt lspci dann trotzdem nur mlx4_core an,
>> obwohl eigentlich mlx4_en nötig ist?)
>
> Dann meckert der Build-Prozess, da geht also nicht so einfach

Was meckert er denn genau?

> Hm, scheint alles schwieriger als erwartet.Ich habe jetzt in China noch 
> zwei andere Karten bestellt, eine Karte mit BCM57810 Chip und eine Karte 
> mit einem IntelChip.
> Vielleicht funktioniert das besser.
> Ansonsten bin ich für weitere Schüsse ins blaue offen.

Die Ausgaben von oben wären gut. Und dann wenn es geht noch folgendes:

1. Kannst Du bitte mal in Deinen anderen nicht-fli4l Kisten mit dem mlx4
Treiber ein `lsmod | grep mlx` machen? Ich würde gern sehen ob dort
mlx4_en geladen ist, oder nicht. 

(Hintergrund: ich habe auf meiner Debian-Kiste hier mal `modprobe
mlx4_core` gemacht und mal `modprobe mlx4_en` und bei ersterem wird nur
der core Treiber geladen, bei zweiterem beide.)

2. die Ausgabe von `lspci -nn` auf dem fli4l wäre interessant, damit wir
mal die PCI-IDs sehen. Dann können wir prüfen ob Deine Karte vom Treiber
überhaupt erkannt werden müsste.

(Siehe:
- https://elixir.bootlin.com/linux/v5.4.55/source/drivers/net/ethernet/mellanox/mlx4/main.c#L4233
- https://elixir.bootlin.com/linux/v5.4.55/source/include/linux/pci_ids.h#L2300
)

Grüße
Alex

-- 
***** http://blog.antiblau.de/ *****************************
GnuPG-FP: C28E E6B9 0263 95CF 8FAF  08FA 34AD CD00 7221 5CC6


Mehr Informationen über die Mailingliste Fli4l_dev