[gelöst] Out of SW-IOMMU space ...

Started by oduffo, 2013/02/25, 00:10:12

Previous topic - Next topic

oduffo

Hallo,

seit einem D-U gestern, bei dem ich auch den Kernel 3.8-0 gezogen habe, friert mein Rechner in unregelmäßigen Abständen ein. Es hilft nur noch ein Hardreset.
Leider habe ich nach dem D-U auch noch erstmalig skype (multiarch) installiert, so dass ich nicht weiss, ob der neue Kernel ursächlich für das Problem ist.

Auszug aus kern.log
Feb 24 23:21:43 kronos kernel: [31627.522483] DMA: Out of SW-IOMMU space for 4096 bytes at device 0000:04:00.0
Feb 24 23:21:43 kronos kernel: [31627.532303] DMA: Out of SW-IOMMU space for 4096 bytes at device 0000:04:00.0
Feb 24 23:21:53 kronos kernel: [31637.500695] DMA: Out of SW-IOMMU space for 2964 bytes at device 0000:04:00.0
Feb 24 23:21:53 kronos kernel: [31637.501502] DMA: Out of SW-IOMMU space for 4096 bytes at device 0000:04:00.0
Feb 24 23:22:13 kronos kernel: [31657.492686] DMA: Out of SW-IOMMU space for 4096 bytes at device 0000:04:00.0
Feb 24 23:22:13 kronos kernel: [31657.820668] DMA: Out of SW-IOMMU space for 3452 bytes at device 0000:04:00.0
Feb 24 23:22:13 kronos kernel: [31657.848047] DMA: Out of SW-IOMMU space for 3452 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.886703] DMA: Out of SW-IOMMU space for 3204 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.902377] DMA: Out of SW-IOMMU space for 3204 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.920438] DMA: Out of SW-IOMMU space for 3584 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.923184] DMA: Out of SW-IOMMU space for 2176 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.938335] DMA: Out of SW-IOMMU space for 2896 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.941915] DMA: Out of SW-IOMMU space for 2476 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.944854] DMA: Out of SW-IOMMU space for 2264 bytes at device 0000:04:00.0
Feb 24 23:22:22 kronos kernel: [31666.948205] DMA: Out of SW-IOMMU space for 2896 bytes at device 0000:04:00.0

Device 04 ist meine Ethernet Karte.

Infos zum System:inxi -v3
System:    Host: kronos Kernel: 3.8-0.towo-siduction-amd64 x86_64 (64 bit, gcc: 4.7.2)
          Desktop: KDE 4.8.4 (Qt 4.8.2) Distro: siduction 12.1.1 Desperado Reloaded - kde - (201206241901)
Machine:   System: Gigabyte product: N/A
          Mobo: Gigabyte model: Z77-D3H version: x.x Bios: American Megatrends version: F12 date: 04/25/2012
CPU:       Quad core Intel Core i5-3570K CPU (-MCP-) cache: 6144 KB flags: (lm nx sse sse2 sse3 sse4_1 sse4_2 ssse3 vmx) bmips: 27441
          Clock Speeds: 1: 1600.00 MHz 2: 1600.00 MHz 3: 1600.00 MHz 4: 1600.00 MHz
Graphics:  Card: Intel Xeon E3-1200 v2/3rd Gen Core processor Graphics Controller bus-ID: 00:02.0
          X.Org: 1.12.4 drivers: intel (unloaded: fbdev,vesa) Resolution: 1280x1024@60.0hz
          GLX Renderer: Mesa DRI Intel Ivybridge Desktop GLX Version: 3.0 Mesa 8.0.5 Direct Rendering: Yes
Network:   Card: Atheros AR8151 v2.0 Gigabit Ethernet driver: atl1c ver: 1.0.1.1-NAPI port: e000 bus-ID: 04:00.0
          IF: eth0 state: up speed: 100 Mbps duplex: full mac: 90:2b:34:37:e8:f8
Drives:    HDD Total Size: 2128.4GB (21.3% used) 1: model: SAMSUNG_SSD_830
          2: model: WDC_WD10EZRX 3: model: WDC_WD10EZRX
Info:      Processes: 173 Uptime: 32 min Memory: 583.9/15950.7MB Runlevel: 5 Gcc sys: 4.7.2
          Client: Shell (bash 4.2.37) inxi: 1.8.38


Googeln zeigt zwar, dass dieser Fehler offenbar häufig auftritt, aber leider kann ich mit den Aussagen nicht viel anfangen.

Zusatzinfo
dmesg | grep IOMMU
[    4.494284] vboxpci: IOMMU not found (not registered)


Was kann ich tun? Wo muss ich drehen?

Gruß
oduffo

devil

zgrep INTEL_IOMMU /boot/config-3.8-0.towo-siduction-amd64

evtl. kernel anpassen. Der Fehler könnte von dieser Zeile herrühren:
# CONFIG_INTEL_IOMMU_DEFAULT_ON is not set
Sollte aber nicht ursächlich fürs Frieren sein.
skype eigentlich auch nicht, hab ich täglich im Einsatz.

greetz
devil

towo

Versuch mal, ob mit intel_iommu=off als Bootcheat das Problem weg ist.
Ich gehe nicht zum Karneval, ich verleihe nur manchmal mein Gesicht.

oduffo

@devilzgrep INTEL_IOMMU /boot/config-3.8-0.towo-siduction-amd64
CONFIG_INTEL_IOMMU=y
# CONFIG_INTEL_IOMMU_DEFAULT_ON is not set
CONFIG_INTEL_IOMMU_FLOPPY_WA=y
@towo
Werde ich versuchen. Melde mich sofort, falls es wieder auftritt, oder später, wenn es damit erledigt ist.

Einstweilen vielen Dank Euch beiden.

Gruß
oduffo

towo

Nach Allem, was ich jetzt so recherchiert habe, wurde der Bug wohl wieder eingeschleppt in 3.8.0. Eine wirkliche Lösung hab ich jetzt noch nicht gesehen. Das Problem bei Dir könnten die 16 GB Ram sein.
Ich gehe nicht zum Karneval, ich verleihe nur manchmal mein Gesicht.

oduffo

Jetzt wollte ich gerade schreiben, dass das Problem sich nach dem Cheatcode zumindest in den letzten drei Stunden nicht gezeigt hat.
Es gibt jedoch bereits wieder einen Eintrag im kern.logFeb 25 14:50:50 kronos kernel: [ 8411.667165] DMA: Out of SW-IOMMU space for 14000 bytes at device 0000:04:00.0Davon habe ich allerdings nichts gemerkt und diesmal ist es nur eine Zeile und nicht hunderte.

Ich bin sicher nicht der Einzige mit 16 GB RAM, deshalb wird der Fehler wohl bald häufiger gemeldet werden.
Hoffentlich gibt es eine endgültige Lösung.

Gruß
oduffo

towo

Ich bleibe dran und lese die entsprächenden Einträge im Bugtracker.
Sobald ich einen Patch sehe, werde ich ihn einsetzen.
Ich gehe nicht zum Karneval, ich verleihe nur manchmal mein Gesicht.

oduffo

Prima, danke.

Hatte mich nämlich zu früh gefreut. Kurz nachdem ich den letzten Post verfasst hatte, gab es wieder einen "Volltreffer", obwohl IOMMU disabled war. Restart nur über die Steckerleiste möglich.

Ich gehe jetzt zunächst auf einen 3.7 Kernel zurück.

Gruß
oduffo

bluelupo

@oduffo: ich habe hier auch 16GB RAM, aber keine "Out of SW-IOMMU space" Meldungen in der kern.log. Ich werde das mal verfolgen, die nächsten Tage.

towo

DU hast aber sicher nicht die gleiche Nic, sprich Du benutzt einen anderen Treiber.
Ich gehe nicht zum Karneval, ich verleihe nur manchmal mein Gesicht.

bluelupo

Quote from: "towo"DU hast aber sicher nicht die gleiche Nic, sprich Du benutzt einen anderen Treiber.
...das ist richtig ;-)

oduffo

Mit Kernel 3.8.4 scheint (zumindest bei mir) das Problem gelöst. Mit diesem Kernel läuft mein Rechner seit einigen Tagen problemlos.

Hoffentlich war ich jetzt nicht zu voreilig mit der Erfolgsmeldung.

Gruß
oduffo