Forum: PC Hard- und Software Rechner stürzt gelegentlich ab--> dmesg info


von R. F. (rfr)


Angehängte Dateien:

Lesenswert?

Hallo allerseits,

mein neuer Rechner stürzt gelegentlich ab, einfach so.
Eine aktuelle dmesg-kopie hängt an. Verstehen tu ich das nicht 
vollständig, könnte jemand hier villeicht zu den Ursachen der Abstürze 
eine Erklärung abgeben?

Danke.

von Olaf D. (Firma: O.D.I.S.) (dreyero)


Lesenswert?

Hi,

ich würde mal von einer Boot-CD starten und memcheck ausführen.
Ich hatte mal ein ähnliches Problem, welches durch einen defekten 
Speicherriegel verursacht worden war.

Leider hatte ich damit gewartet, bis die Abtstürze mein ReiserFS 
zerschossen hatten.

Gruß
Olaf

BTW: Installiere mal einen zeitgemäßen Kernel!

von MaWin (Gast)


Lesenswert?

In dem log ist kein Absturz zu sehen.

von MaWin (Gast)


Lesenswert?

Olaf D. schrieb:
> Leider hatte ich damit gewartet, bis die Abtstürze mein ReiserFS
> zerschossen hatten.

Sieh es als Chance jetzt auf ein modernes und zuverlässiges FS 
umzusteigen.

von Olaf D. (Firma: O.D.I.S.) (dreyero)


Lesenswert?

Habe ich danach gemacht. :-D

von 516133 (Gast)


Lesenswert?

sortiere mal etwas aus,

journalctl [-b1] -p err -x

von Dieter D. (Firma: Hobbytheoretiker) (dieter_1234)


Lesenswert?


von 516133 (Gast)


Lesenswert?

516133 schrieb:
> sortiere mal etwas aus,
>
> journalctl [-b1] -p err -x

dmesg-output kann man mittlerweile auch filtern

dmesg --level=err,warn

von Oliver S. (phetty)


Lesenswert?

Das scheint ein dmesg nach dem Neustart zu sein, die Absturzursache ist 
da nicht mehr mit drin.
Evtl. wird noch was in /var/log gespeichert. messages, syslog.

von R. F. (rfr)


Lesenswert?

Soweit sogut,

Ich verstehe, dass Fehlermeldungen Informationen zum Problem enthalten 
sollten.
was muss ich tun, um bessere Fehlermeldungen zu bekommen?
Gruss

Robert

von Andreas B. (bitverdreher)


Lesenswert?

Oliver S. schrieb:
> Das scheint ein dmesg nach dem Neustart zu sein,
dmesg sind immer nur die Startmeldungen.

Oliver S. schrieb:
> Evtl. wird noch was in /var/log gespeichert. messages, syslog.
Genau da: syslog. Die wollen wir sehen.

von R. F. (rfr)


Angehängte Dateien:

Lesenswert?

Die hier? oder was anderes?

Ich glsube, ich brauche einen memorychecker.
Kann jemand einen geeeigneten empfehlen?

Robert

von 516133 (Gast)


Lesenswert?

R. F. schrieb:

> was muss ich tun, um bessere Fehlermeldungen zu bekommen?


Gegebenen Hinweisen folgen?

SystemD führt ein Journal u. verteilt dem Kram
zusätzlich in die bekannten logfiles

beispiel
journalctl [-b1 o. -1..-n] -p err -x



manpage:



-b [ID][±offset], --boot=[ID][±offset]

Show messages from a specific boot. This will add a match for 
"_BOOT_ID=". The argument may be empty, in which case
logs for the current boot will be shown.


-p, --priority="emerg" (0), "alert" (1), "crit" (2), "err" (3), 
"warning" (4), "notice" (5), "info" (6), "debug" (7)


-x add explanatory help texts to log messages in the output where
   this is available


> Evtl. wird noch was in /var/log gespeichert. messages, syslog.
> Genau da: syslog. Die wollen wir sehen.



Wie kommen die unter SystemD abgesehen von Anwendungen die direkt 
schreiben dorthin, journald.


---
man journalctl
man journald.conf





journalctl --list-boots

wenn da nichts kommt einfach ein Verz. anlegen
dann werden die Journale archiviert.

mkdir /var/log/journal

von Metpooli (Gast)


Lesenswert?

Erst einmal!

Welcher Rechner, aha deiner! Sagt nichts aus!

Welches Bezriebssystem?

von R. F. (rfr)



Lesenswert?

Weitere Informationen.

von Metpooli (Gast)


Lesenswert?

R. F. schrieb:
> Weitere Informationen.

Aha!

von Olaf D. (Firma: O.D.I.S.) (dreyero)


Lesenswert?


von John Doe (Gast)


Lesenswert?

R. F. schrieb:
> Weitere Informationen.

In den Logs sieht man die typischen AMD-Fehler.
Da Dein Mainboard-BIOS uralt ist (aktuell ist die 3603, Du hast die 
2802), solltest Du das erstmal auf den aktuellen Stand bringen.
Bei den meisten hat das geholfen.

von 516133 (Gast)


Lesenswert?

R. F. schrieb:
> Weitere Informationen.

 das Bedarf wohl weiteren Ausführungen :]


journalctl - Query the systemd journal


journalctl [OPTIONS...] [MATCHES...]



journalctl ist da um das zu filtern,
damit man sich nicht mit 40MB und mehr herumschlagen muss.

Optionen z.B.
-p err     sagt ihm bspw. zeig nur Fehler

info, debug zeigen praktisch alles, was viel zuviel ist


Beispiel;

oben Tool dmesg,
Kernelmeldung direkt aus dem Ringbuffer, was halt noch nicht 
überschrieben wurde.



journalctl _TRANSPORT=kernel

zeigt das gleiche wie dmesg


journalctl -p err _TRANSPORT=kernel

zeigt die Meldungen gefiltert, nur Fehler.





Matches/Suchbegriff

siehe auch man systemd.journal-fields



>> was muss ich tun, um bessere Fehlermeldungen zu bekommen?



------
Erstmal verstehen wie das unter einem aktuellen Linux funktioniert.


bei dir und den meisten anderen auch läuft
systemd-journald plus oft ein oder mehrere logger
wie klogd, syslogd, syslog-ng, rsyslogd, ...



https://unix.stackexchange.com/a/294206

runter zu
log management with systemd







lade später eines Werke mal runter ;)

von Dr. MCU (Gast)


Lesenswert?

516133 schrieb:
> R. F. schrieb:
>> Weitere Informationen.
>
>  das Bedarf wohl weiteren Ausführungen :]

Das sehe (nicht nur) ich anders.
Mit Linux-Erfahrung sind die journald-logs doch schnell durchgesehen und 
die Fehler erkannt. Außerdem hat man so auch entscheidende 
Zusatzinformationen.

Und wenn der Poster kein Linux-Experte ist, dann fehlt nachher noch 
Wichtiges. In diesem Fall also: alles richtig gemacht.

Eine Bitte an Dich:
Schmeiß nicht so mit Zeilenumbrüchen um Dich, das macht Deinen Post fast 
unleserlich!

von 516133 (Gast)


Lesenswert?

> die Fehler erkannt. Außerdem hat man so auch entscheidende
> Zusatzinformationen.
>

Bildformate?

Nächste Stufe die TB Platte unter
mikrocontroller.net/forum/pc-hardware-software mounten.



> Das sehe (nicht nur) ich anders.

und?

von Drago S. (mratix)


Lesenswert?

R. F. schrieb:
> mein neuer Rechner stürzt gelegentlich ab, einfach so.
[    0.648169] smpboot: CPU0: AMD Ryzen 9 5900X 12-Core Processor 
(family: 0x19, model: 0x21, stepping: 0x0)
[    0.698610] smp: Brought up 1 node, 24 CPUs
[    0.735855] pci 0000:07:00.0: 63.012 Gb/s available PCIe bandwidth, 
limited by 16.0 GT/s PCIe x4 link at 0000:00:01.2 (capable of 252.048 
Gb/s with 16.0 GT/s PCIe x16 link)
Bei 24 Kernen machst du ein läppisches Ubuntu drauf? Das ist kein 
Rechner sondern Hardware für ein Raumschiff.
Als Peripherie ist alles möglich angestöpselt und bestimmt kein Stecker 
mehr frei. Hänge mal alles ab und schrittweise dran. Von einem Absturz 
oder Kernel-Panic sehe ich hier nichts. Das kommt wo anders her, syslog 
heranziehen.

Ich hole mal ein paar Sachen aus der dmesg raus, welche mir aufgefallen 
sind:
[    0.898111] platform eisa.0: EISA: Cannot allocate resource for 
mainboard
[    0.898363] platform eisa.0: Cannot allocate resource for EISA slot 
1,2,3,4,5,6,7,8
Ist das nur ein failed check (aktivierte Schnittstelle ohne Karten) oder 
doch ein Problem?

[    4.260533] systemd[1]: /lib/systemd/system/dbus.service:12
[    4.279470] systemd[1]: 
/lib/systemd/system/plymouth-start.service:17: Unit configured to use 
KillMode=none. This is unsafe, as it disables systemd's process 
lifecycle management for the service. Please update your service to use 
a safer KillMode=, such as 'mixed' or 'control-group'. Support for 
KillMode=none is deprecated and will eventually be removed.

[    4.536013] ccp 0000:0e:00.1: enabling device (0000 -> 0002)
[    4.536373] ccp 0000:0e:00.1: ccp: unable to access the device: you 
might be running a broken BIOS.
[    4.554126] Intel(R) Wireless WiFi driver for Linux
[    4.554182] iwlwifi 0000:04:00.0: enabling device (0000 -> 0002)
[    4.558227] iwlwifi 0000:04:00.0: Direct firmware load for 
iwlwifi-cc-a0-56.ucode failed with error -2
[    4.559693] iwlwifi 0000:04:00.0: api flags index 2 larger than 
supported by driver
[    4.559703] iwlwifi 0000:04:00.0: TLV_FW_FSEQ_VERSION: FSEQ Version: 
89.3.35.22
[    4.559705] iwlwifi 0000:04:00.0: Found debug destination: 
EXTERNAL_DRAM
[    4.559706] iwlwifi 0000:04:00.0: Found debug configuration: 0
[    4.559870] iwlwifi 0000:04:00.0: loaded firmware version 
55.d9698065.0 cc-a0-55.ucode op_mode iwlmvm
[    4.559975] iwlwifi 0000:04:00.0: Direct firmware load for 
iwl-debug-yoyo.bin failed with error -2
[    4.578003] iwlwifi 0000:04:00.0: Detected Intel(R) Wi-Fi 6 AX200 
160MHz, REV=0x340
Die WiFi Card stresst, das passt nicht. firmware-nonfree geladen?

[    4.547829] kvm: disabled by bios
Einschalten. Er bettelt ja am laufenden Band.

[    4.754095] iwlwifi 0000:04:00.0: base HW address: dc:41:a9:d5:1d:35
[    4.768239] iwlwifi 0000:04:00.0 wlp4s0: renamed from wlan0
OK, wird dann doch noch 'irgendwie' initialisiert. Aber check mal den 
vorherigen Bereich, der passt nicht. Ein device sollte geblacklisted 
werden, damit er oben keinen Stress macht und das zweite nimmt.

[    4.766694] thermal thermal_zone0: failed to read out thermal zone 
(-61)
Thermalsensor?

[    5.496976] EDAC amd64: F19h detected (node 0).
[    5.496987] EDAC amd64: Error: F0 not found, device 0x1650 (broken 
BIOS?)
Wiederholt sich auch mehrmals. k.A. was das ist oder sagen möchte.

[    8.211727] audit: type=1400 audit(1617653293.812:25): 
apparmor="DENIED" operation="capable" profile="/usr/sbin/cups-browsed" 
pid=1253 comm="cups-browsed" capability=23  capname="sys_nice"
CUPS Browser bekommt auch mehrmals ein Nein. Konfiguration prüfen.

Mir ist oben noch ein LED controller o.ä., beim hochfahren der USB 
Schnitstelle, aufgefallen (finde es gerade nicht). Der tanzt irgendwie 
aus der Reihe, hält ggf. nicht die specs ein oder meldet sich nicht 
ordentlich zurück.

von Hmmm (Gast)


Lesenswert?

R. F. schrieb:
> Ich glsube, ich brauche einen memorychecker.
> Kann jemand einen geeeigneten empfehlen?

https://www.memtest.org/#downiso

von Drago S. (mratix)


Lesenswert?

R. F. schrieb:
> mein neuer Rechner stürzt gelegentlich ab, einfach so.

[    0.001600] total RAM covered: 3327M
Erzähl mal was zur hibernate. Eingeschaltet?
Dann sollte die swap >=3327 +1Mib sein.

[    0.000000] Linux version 5.8.0-48-generic (buildd@lgw01-amd64-052) 
(gcc (Ubuntu 10.2.0-13ubuntu1) 10.2.0, GNU ld (GNU Binutils for Ubuntu) 
2.35.1) #54-Ubuntu SMP Fri Mar 19 14:25:20 UTC 2021 (Ubuntu 
5.8.0-48.54-generic 5.8.18)
Auch ein wenig in die Jahre gekommen. Stock mal auf mind. 16.04LTS oder 
so auf. Wobei Kernel 5.x nicht gerade alt wäre.

: Bearbeitet durch User
von John Doe (Gast)


Lesenswert?

Mister A. schrieb:
> R. F. schrieb:
>> mein neuer Rechner stürzt gelegentlich ab, einfach so.
>
> [    0.001600] total RAM covered: 3327M
> Erzähl mal was zur hibernate. Eingeschaltet?
> Dann sollte die swap >=3327 +1Mib sein.
>
> [    0.000000] Linux version 5.8.0-48-generic (buildd@lgw01-amd64-052)
> (gcc (Ubuntu 10.2.0-13ubuntu1) 10.2.0, GNU ld (GNU Binutils for Ubuntu)
> 2.35.1) #54-Ubuntu SMP Fri Mar 19 14:25:20 UTC 2021 (Ubuntu
> 5.8.0-48.54-generic 5.8.18)
> Auch ein wenig in die Jahre gekommen.

Was an Ubuntu 20.10 ist denn "in die Jahre gekommen"?

> Stock mal auf mind. 16.04LTS oder
> so auf. Wobei Kernel 5.x nicht gerade alt wäre.

Du meinst wohl "Grade mal down" auf 16.04LTS. Doch was soll das bringen? 
Bei seinem AMD-Prozessor wohl eher noch mehr Schwierigkeiten.

Eines seiner größten Probleme ist das alte BIOS. Das muss als Erstes auf 
Stand gebracht werden.

von 516133 (Gast)


Lesenswert?

loglevels debug, ... ,emerg

--file [wg. download von oben]
1
journalctl -p err  --file user-1000_8e7b579f50094b37bf0b3613c4a4da24-0000000000002501-0005bee891cd8085.journal
2
-- Logs begin at Thu 2021-04-01 14:42:51 CEST, end at Thu 2021-04-01 18:29:21 CEST. --
3
Apr 01 14:51:00 rfr-mainframe sudo[45733]: pam_unix(sudo:auth): conversation failed
4
Apr 01 14:51:00 rfr-mainframe sudo[45733]: pam_unix(sudo:auth): auth could not identify password for [rfr]
5
6
7
journalctl -p crit  --file user-1000_8e7b579f50094b37bf0b3613c4a4da24-0000000000002501-0005bee891cd8085.journal
8
-- Logs begin at Thu 2021-04-01 14:42:51 CEST, end at Thu 2021-04-01 18:29:21 CEST. --
9
Apr 01 14:51:00 rfr-mainframe sudo[45733]: pam_unix(sudo:auth): auth could not identify password for [rfr]
10
11
journalctl -p emerg  --file user-1000_8e7b579f50094b37bf0b3613c4a4da24-0000000000002501-0005bee891cd8085.journal
12
-- No entries --
13
14
15
nichts wirklich kritisches.
16
 das Gleiche mit dem systemjournal,
17
18
journalctl -p emerg  --file system_cb0928eb93ab4248991ea7179d1727c1-0000000000000001-0005bee87094017a.journal 
19
-- Logs begin at Thu 2021-04-01 14:33:33 CEST, end at Fri 2021-04-02 14:54:15 CEST. --
20
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 1.55 No irq handler for vector
21
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 2.55 No irq handler for vector
22
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 3.55 No irq handler for vector
23
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 4.55 No irq handler for vector
24
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 5.55 No irq handler for vector
25
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 6.55 No irq handler for vector
26
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 7.55 No irq handler for vector
27
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 8.55 No irq handler for vector
28
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 9.55 No irq handler for vector
29
Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 10.55 No irq handler for vector
30
-- Reboot --
31
same
32
-- Reboot --
33
...

kernel: __common_interrupt: ### No irq handler for vector

Dann hat man etwas zum suchen
 Firmware/Bios laut Suchmaschine

verfügbare BIOS Version ermitteln, soll 3603 sein.

von mh (Gast)


Lesenswert?

Die "No irq handler for vector" sind harmlos und haben sicher nichts mit 
dem Problem zu tun.

von John Doe (Gast)


Lesenswert?

516133 schrieb:
> Dann hat man etwas zum suchen
>  Firmware/Bios laut Suchmaschine
>
> verfügbare BIOS Version ermitteln, soll 3603 sein.

Wie ich schon viel weiter oben geschrieben habe...
Lesen ist nicht Deine Stärke, was?

von 516133 (Gast)


Lesenswert?

John Doe schrieb:
> 516133 schrieb:
>> Dann hat man etwas zum suchen
>>  Firmware/Bios laut Suchmaschine
>>
>> verfügbare BIOS Version ermitteln, soll 3603 sein.
>
> Wie ich schon viel weiter oben geschrieben habe...
> Lesen ist nicht Deine Stärke, was?

Das war nicht der Punkt.
Mann.

von db8fs (Gast)


Lesenswert?

Das Mce-Zeug sieht wirklich nach Speicherfehler o.ä. aus, bei dem der 
Kern ne Panik kriegen kann:
https://www.thomas-krenn.com/de/wiki/Mcelog

Auch die vielen Meldungen mit dem zerbrochenen Bios (amd64 EDAC) klingen 
irgendwie doof nach zu machendem Bios-Update, sofern möglich.

von Pete K. (pete77)


Lesenswert?

Das Bios passt nicht richtig, steht doch sogar im Klartest in der dmesg 
Ausgabe:
"you might be running a broken BIOS"

Also, mach ein Bios update und dann poste Dein neues dmesg.txt.

von Drago S. (mratix)


Lesenswert?

John Doe schrieb:
>> [    0.000000] Linux version 5.8.0-48-generic (buildd@lgw01-amd64-052)
>> (gcc (Ubuntu 10.2.0-13ubuntu1) 10.2.0, GNU ld (GNU Binutils for Ubuntu)
>> 2.35.1) #54-Ubuntu SMP Fri Mar 19 14:25:20 UTC 2021 (Ubuntu
>> 5.8.0-48.54-generic 5.8.18)
>> Auch ein wenig in die Jahre gekommen.
>
> Was an Ubuntu 20.10 ist denn "in die Jahre gekommen"?
Sorry mein Fehler. Aus der Paketversion Ubuntu 10.2.0-13ubuntu1 habe ich 
irgendwie Ubuntu 10.2 abgeleitet :)

von R. F. (rfr)


Lesenswert?

Gut soweit,

ich würde jetzt geerne ein BIOS update machen, weiss aber nicht, wie ich 
<das machen soll.

Gruss

Robert

von Nop (Gast)


Lesenswert?

R. F. schrieb:

> ich würde jetzt geerne ein BIOS update machen, weiss aber nicht, wie ich
> <das machen soll.

Gehste auf die Asus-Seite und ziehst Dir das aktuelle BIOS für Dein Mobo 
- Du hast ein X570-E, wenn ich das richtig gesehen habe.

https://rog.asus.com/motherboards/rog-strix/rog-strix-x570-e-gaming-model/helpdesk_bios

Das entpackst Du, kopierst es danach auf einen USB-Stick, bootest den 
Rechner, drückst die Entf-Taste beim Booten, um ins Bios zu kommen. Da 
muß irgendwo das EZ Flash Utility oder so sein, und damit machst Du das 
Update.

Danach solltest Du sicherheitshalber das BIOS auf Werkseinstellugnen 
zurücksetzen. Dann neu booten, dann Deine Wunscheinstellungen vornehmen.

von R. F. (rfr)


Lesenswert?

Nach BIOS Update scheint es besser zu sein.

Vielen Dank allerseits.

Beitrag #6649176 wurde vom Autor gelöscht.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.