Welcome, Guest. Please login or register.
Did you miss your activation email?

Author Topic: [DE] nvidia Versionskonflikt nach dist-upgrade  (Read 2390 times)

Offline CyrusQ

  • User
  • Posts: 5
[DE] nvidia Versionskonflikt nach dist-upgrade
« on: 2023/08/29, 23:00:49 »
Hallo zusammen,

nach einem dist-upgrade hat der Start mit dem neuen Kernel folgendes gemeldet und konnte nicht geladen werden:
Code: [Select]
Failed to start nvidia-persistenced.service - NVIDIA Perstistance Daemon.
See 'systemctl status nvidia-persistenced.service' for details.

Ich habe dann mit dem alten Kernel gestartet. Der Befehl hat jedoch keine Ausgabe erzeugt.

Daher: journalctl -b | grep nvidia
Code: [Select]
Aug 29 08:15:35 robert-pc kernel: nvidia: loading out-of-tree module taints kernel.
Aug 29 08:15:35 robert-pc kernel: nvidia: module license 'NVIDIA' taints kernel.
Aug 29 08:15:35 robert-pc kernel: nvidia-nvlink: Nvlink Core is being initialized, major device number 241
Aug 29 08:15:35 robert-pc kernel: nvidia 0000:05:00.0: vgaarb: changed VGA decodes: olddecodes=io+mem,decodes=none:owns=io+mem
Aug 29 08:15:35 robert-pc kernel: nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms  510.108.03  Thu Oct 20 05:00:22 UTC 2022
Aug 29 08:15:35 robert-pc kernel: [drm] [nvidia-drm] [GPU ID 0x00000500] Loading driver
Aug 29 08:15:35 robert-pc kernel: [drm] Initialized nvidia-drm 0.0.0 20160202 for 0000:05:00.0 on minor 0
Aug 29 08:15:35 robert-pc systemd-modules-load[467]: Inserted module 'nvidia_drm'
Aug 29 08:15:36 robert-pc systemd[1]: Starting nvidia-persistenced.service - NVIDIA Persistence Daemon...
Aug 29 08:15:36 robert-pc nvidia-persistenced[827]: Started (827)
Aug 29 08:15:36 robert-pc nvidia-persistenced[827]: Failed to query NVIDIA devices. Please ensure that the NVIDIA device files (/dev/nvidia*) exist, and that user 123 has read and write permissions for those files.
Aug 29 08:15:36 robert-pc nvidia-persistenced[827]: Shutdown (827)
Aug 29 08:15:36 robert-pc nvidia-persistenced[823]: nvidia-persistenced failed to initialize. Check syslog for more details.
Aug 29 08:15:36 robert-pc systemd[1]: nvidia-persistenced.service: Control process exited, code=exited, status=1/FAILURE
Aug 29 08:15:36 robert-pc systemd[1]: nvidia-persistenced.service: Failed with result 'exit-code'.
Aug 29 08:15:36 robert-pc systemd[1]: Failed to start nvidia-persistenced.service - NVIDIA Persistence Daemon.

nvidia-smi
Code: [Select]
Failed to initialize NVML: Driver/library version mismatch
nvidia-detect
Code: [Select]
Detected NVIDIA GPUs:
05:00.0 VGA compatible controller [0300]: NVIDIA Corporation GA106 [GeForce RTX 3060 Lite Hash Rate] [10de:2504] (rev a1)

Checking card:  NVIDIA Corporation GA106 [GeForce RTX 3060 Lite Hash Rate] (rev a1)
Uh oh. Failed to identify your Debian suite.

dkms status
Code: [Select]
nvidia-current/510.108.03, 6.1.1-5-siduction-amd64, x86_64: installed
nvidia-current/510.108.03, 6.1.3-1-siduction-amd64, x86_64: installed

apt-get -f install
https://paste.siduction.org/?3992a3a1024b9ef7#G1c1nkPgDcWxwKsxni6KyQaxL8VDtz1Ztswrsu8xoieC

Es wird scheinbar versucht den Kernel mit nvidia-kernel-dkms 510.108.03 zu erstellen (was auch installiert ist) obwohl 525.125.06 erwartet wird. das alte nvidia-kernel-dkms, was nicht zu den anderen neuen nvidia paketen passt, lässt sich aber nicht  deinstallieren.

apt --fix-broken install nvidia-kernel-dkms
Code: [Select]
Paketlisten werden gelesen… Fertig
Abhängigkeitsbaum wird aufgebaut… Fertig
Statusinformationen werden eingelesen… Fertig
Probieren Sie »apt --fix-broken install«, um dies zu korrigieren.
Die folgenden Pakete haben unerfüllte Abhängigkeiten:
 nvidia-kernel-dkms : Hängt ab von: firmware-nvidia-gsp (= 525.125.06) oder
                                     firmware-nvidia-gsp-525.125.06 ist aber nicht installierbar

Aufgrund der ungelösten Abhängigkeiten kann ich auch nicht "apt-get purge nvidia*" ausführen, sondern könnte nur nvidia-driver löschen lassen.

Wie kann ich weiter fortfahren, um den Konflikt zu lösen oder nähere Erkenntnisse zu liefern?
« Last Edit: 2023/08/29, 23:09:02 by CyrusQ »

Offline ro_sid

  • User
  • Posts: 223
Re: nvidia Versionskonflikt nach dist-upgrade
« Reply #1 on: 2023/08/30, 16:24:51 »
Hallo,

"firmware-nvidia-gsp (= 525.125.06)" ist verfügbar! Und wohl schon seit geraumer Zeit, denn sonst hätte ich dasselbe Problem.

Vermutlich fehlt in der Debian sources.list (in /etc/apt{/sources.list.d}) der Eintrag "non-free-firmware" - neben "main" und wahrscheinlich "contrib" und eventuell "non-free".
Diese Änderung geschah mit Debian 12 alias "bookworm", falls ich mich richtig erinnere. Also den Eintrag hinzufügen, dann müßte es gehen.

Viel Glück.