Hallo allerseits, mein neuer Rechner stürzt gelegentlich ab, einfach so. Eine aktuelle dmesg-kopie hängt an. Verstehen tu ich das nicht vollständig, könnte jemand hier villeicht zu den Ursachen der Abstürze eine Erklärung abgeben? Danke.
Hi, ich würde mal von einer Boot-CD starten und memcheck ausführen. Ich hatte mal ein ähnliches Problem, welches durch einen defekten Speicherriegel verursacht worden war. Leider hatte ich damit gewartet, bis die Abtstürze mein ReiserFS zerschossen hatten. Gruß Olaf BTW: Installiere mal einen zeitgemäßen Kernel!
Olaf D. schrieb: > Leider hatte ich damit gewartet, bis die Abtstürze mein ReiserFS > zerschossen hatten. Sieh es als Chance jetzt auf ein modernes und zuverlässiges FS umzusteigen.
516133 schrieb: > sortiere mal etwas aus, > > journalctl [-b1] -p err -x dmesg-output kann man mittlerweile auch filtern dmesg --level=err,warn
Das scheint ein dmesg nach dem Neustart zu sein, die Absturzursache ist da nicht mehr mit drin. Evtl. wird noch was in /var/log gespeichert. messages, syslog.
Soweit sogut, Ich verstehe, dass Fehlermeldungen Informationen zum Problem enthalten sollten. was muss ich tun, um bessere Fehlermeldungen zu bekommen? Gruss Robert
Oliver S. schrieb: > Das scheint ein dmesg nach dem Neustart zu sein, dmesg sind immer nur die Startmeldungen. Oliver S. schrieb: > Evtl. wird noch was in /var/log gespeichert. messages, syslog. Genau da: syslog. Die wollen wir sehen.
Die hier? oder was anderes? Ich glsube, ich brauche einen memorychecker. Kann jemand einen geeeigneten empfehlen? Robert
R. F. schrieb: > was muss ich tun, um bessere Fehlermeldungen zu bekommen? Gegebenen Hinweisen folgen? SystemD führt ein Journal u. verteilt dem Kram zusätzlich in die bekannten logfiles beispiel journalctl [-b1 o. -1..-n] -p err -x manpage: -b [ID][±offset], --boot=[ID][±offset] Show messages from a specific boot. This will add a match for "_BOOT_ID=". The argument may be empty, in which case logs for the current boot will be shown. -p, --priority="emerg" (0), "alert" (1), "crit" (2), "err" (3), "warning" (4), "notice" (5), "info" (6), "debug" (7) -x add explanatory help texts to log messages in the output where this is available > Evtl. wird noch was in /var/log gespeichert. messages, syslog. > Genau da: syslog. Die wollen wir sehen. Wie kommen die unter SystemD abgesehen von Anwendungen die direkt schreiben dorthin, journald. --- man journalctl man journald.conf journalctl --list-boots wenn da nichts kommt einfach ein Verz. anlegen dann werden die Journale archiviert. mkdir /var/log/journal
Erst einmal! Welcher Rechner, aha deiner! Sagt nichts aus! Welches Bezriebssystem?
Folge mal den Ratschlägen hier: https://de.comp.os.unix.linux.misc.narkive.com/36SEkR6j/knoppix-wie-benutzen Gruß Olaf
R. F. schrieb: > Weitere Informationen. In den Logs sieht man die typischen AMD-Fehler. Da Dein Mainboard-BIOS uralt ist (aktuell ist die 3603, Du hast die 2802), solltest Du das erstmal auf den aktuellen Stand bringen. Bei den meisten hat das geholfen.
R. F. schrieb: > Weitere Informationen. das Bedarf wohl weiteren Ausführungen :] journalctl - Query the systemd journal journalctl [OPTIONS...] [MATCHES...] journalctl ist da um das zu filtern, damit man sich nicht mit 40MB und mehr herumschlagen muss. Optionen z.B. -p err sagt ihm bspw. zeig nur Fehler info, debug zeigen praktisch alles, was viel zuviel ist Beispiel; oben Tool dmesg, Kernelmeldung direkt aus dem Ringbuffer, was halt noch nicht überschrieben wurde. journalctl _TRANSPORT=kernel zeigt das gleiche wie dmesg journalctl -p err _TRANSPORT=kernel zeigt die Meldungen gefiltert, nur Fehler. Matches/Suchbegriff siehe auch man systemd.journal-fields >> was muss ich tun, um bessere Fehlermeldungen zu bekommen? ------ Erstmal verstehen wie das unter einem aktuellen Linux funktioniert. bei dir und den meisten anderen auch läuft systemd-journald plus oft ein oder mehrere logger wie klogd, syslogd, syslog-ng, rsyslogd, ... https://unix.stackexchange.com/a/294206 runter zu log management with systemd lade später eines Werke mal runter ;)
516133 schrieb: > R. F. schrieb: >> Weitere Informationen. > > das Bedarf wohl weiteren Ausführungen :] Das sehe (nicht nur) ich anders. Mit Linux-Erfahrung sind die journald-logs doch schnell durchgesehen und die Fehler erkannt. Außerdem hat man so auch entscheidende Zusatzinformationen. Und wenn der Poster kein Linux-Experte ist, dann fehlt nachher noch Wichtiges. In diesem Fall also: alles richtig gemacht. Eine Bitte an Dich: Schmeiß nicht so mit Zeilenumbrüchen um Dich, das macht Deinen Post fast unleserlich!
> die Fehler erkannt. Außerdem hat man so auch entscheidende > Zusatzinformationen. > Bildformate? Nächste Stufe die TB Platte unter mikrocontroller.net/forum/pc-hardware-software mounten. > Das sehe (nicht nur) ich anders. und?
R. F. schrieb: > mein neuer Rechner stürzt gelegentlich ab, einfach so. [ 0.648169] smpboot: CPU0: AMD Ryzen 9 5900X 12-Core Processor (family: 0x19, model: 0x21, stepping: 0x0) [ 0.698610] smp: Brought up 1 node, 24 CPUs [ 0.735855] pci 0000:07:00.0: 63.012 Gb/s available PCIe bandwidth, limited by 16.0 GT/s PCIe x4 link at 0000:00:01.2 (capable of 252.048 Gb/s with 16.0 GT/s PCIe x16 link) Bei 24 Kernen machst du ein läppisches Ubuntu drauf? Das ist kein Rechner sondern Hardware für ein Raumschiff. Als Peripherie ist alles möglich angestöpselt und bestimmt kein Stecker mehr frei. Hänge mal alles ab und schrittweise dran. Von einem Absturz oder Kernel-Panic sehe ich hier nichts. Das kommt wo anders her, syslog heranziehen. Ich hole mal ein paar Sachen aus der dmesg raus, welche mir aufgefallen sind: [ 0.898111] platform eisa.0: EISA: Cannot allocate resource for mainboard [ 0.898363] platform eisa.0: Cannot allocate resource for EISA slot 1,2,3,4,5,6,7,8 Ist das nur ein failed check (aktivierte Schnittstelle ohne Karten) oder doch ein Problem? [ 4.260533] systemd[1]: /lib/systemd/system/dbus.service:12 [ 4.279470] systemd[1]: /lib/systemd/system/plymouth-start.service:17: Unit configured to use KillMode=none. This is unsafe, as it disables systemd's process lifecycle management for the service. Please update your service to use a safer KillMode=, such as 'mixed' or 'control-group'. Support for KillMode=none is deprecated and will eventually be removed. [ 4.536013] ccp 0000:0e:00.1: enabling device (0000 -> 0002) [ 4.536373] ccp 0000:0e:00.1: ccp: unable to access the device: you might be running a broken BIOS. [ 4.554126] Intel(R) Wireless WiFi driver for Linux [ 4.554182] iwlwifi 0000:04:00.0: enabling device (0000 -> 0002) [ 4.558227] iwlwifi 0000:04:00.0: Direct firmware load for iwlwifi-cc-a0-56.ucode failed with error -2 [ 4.559693] iwlwifi 0000:04:00.0: api flags index 2 larger than supported by driver [ 4.559703] iwlwifi 0000:04:00.0: TLV_FW_FSEQ_VERSION: FSEQ Version: 89.3.35.22 [ 4.559705] iwlwifi 0000:04:00.0: Found debug destination: EXTERNAL_DRAM [ 4.559706] iwlwifi 0000:04:00.0: Found debug configuration: 0 [ 4.559870] iwlwifi 0000:04:00.0: loaded firmware version 55.d9698065.0 cc-a0-55.ucode op_mode iwlmvm [ 4.559975] iwlwifi 0000:04:00.0: Direct firmware load for iwl-debug-yoyo.bin failed with error -2 [ 4.578003] iwlwifi 0000:04:00.0: Detected Intel(R) Wi-Fi 6 AX200 160MHz, REV=0x340 Die WiFi Card stresst, das passt nicht. firmware-nonfree geladen? [ 4.547829] kvm: disabled by bios Einschalten. Er bettelt ja am laufenden Band. [ 4.754095] iwlwifi 0000:04:00.0: base HW address: dc:41:a9:d5:1d:35 [ 4.768239] iwlwifi 0000:04:00.0 wlp4s0: renamed from wlan0 OK, wird dann doch noch 'irgendwie' initialisiert. Aber check mal den vorherigen Bereich, der passt nicht. Ein device sollte geblacklisted werden, damit er oben keinen Stress macht und das zweite nimmt. [ 4.766694] thermal thermal_zone0: failed to read out thermal zone (-61) Thermalsensor? [ 5.496976] EDAC amd64: F19h detected (node 0). [ 5.496987] EDAC amd64: Error: F0 not found, device 0x1650 (broken BIOS?) Wiederholt sich auch mehrmals. k.A. was das ist oder sagen möchte. [ 8.211727] audit: type=1400 audit(1617653293.812:25): apparmor="DENIED" operation="capable" profile="/usr/sbin/cups-browsed" pid=1253 comm="cups-browsed" capability=23 capname="sys_nice" CUPS Browser bekommt auch mehrmals ein Nein. Konfiguration prüfen. Mir ist oben noch ein LED controller o.ä., beim hochfahren der USB Schnitstelle, aufgefallen (finde es gerade nicht). Der tanzt irgendwie aus der Reihe, hält ggf. nicht die specs ein oder meldet sich nicht ordentlich zurück.
R. F. schrieb: > Ich glsube, ich brauche einen memorychecker. > Kann jemand einen geeeigneten empfehlen? https://www.memtest.org/#downiso
R. F. schrieb: > mein neuer Rechner stürzt gelegentlich ab, einfach so. [ 0.001600] total RAM covered: 3327M Erzähl mal was zur hibernate. Eingeschaltet? Dann sollte die swap >=3327 +1Mib sein. [ 0.000000] Linux version 5.8.0-48-generic (buildd@lgw01-amd64-052) (gcc (Ubuntu 10.2.0-13ubuntu1) 10.2.0, GNU ld (GNU Binutils for Ubuntu) 2.35.1) #54-Ubuntu SMP Fri Mar 19 14:25:20 UTC 2021 (Ubuntu 5.8.0-48.54-generic 5.8.18) Auch ein wenig in die Jahre gekommen. Stock mal auf mind. 16.04LTS oder so auf. Wobei Kernel 5.x nicht gerade alt wäre.
:
Bearbeitet durch User
Mister A. schrieb: > R. F. schrieb: >> mein neuer Rechner stürzt gelegentlich ab, einfach so. > > [ 0.001600] total RAM covered: 3327M > Erzähl mal was zur hibernate. Eingeschaltet? > Dann sollte die swap >=3327 +1Mib sein. > > [ 0.000000] Linux version 5.8.0-48-generic (buildd@lgw01-amd64-052) > (gcc (Ubuntu 10.2.0-13ubuntu1) 10.2.0, GNU ld (GNU Binutils for Ubuntu) > 2.35.1) #54-Ubuntu SMP Fri Mar 19 14:25:20 UTC 2021 (Ubuntu > 5.8.0-48.54-generic 5.8.18) > Auch ein wenig in die Jahre gekommen. Was an Ubuntu 20.10 ist denn "in die Jahre gekommen"? > Stock mal auf mind. 16.04LTS oder > so auf. Wobei Kernel 5.x nicht gerade alt wäre. Du meinst wohl "Grade mal down" auf 16.04LTS. Doch was soll das bringen? Bei seinem AMD-Prozessor wohl eher noch mehr Schwierigkeiten. Eines seiner größten Probleme ist das alte BIOS. Das muss als Erstes auf Stand gebracht werden.
loglevels debug, ... ,emerg --file [wg. download von oben]
1 | journalctl -p err --file user-1000_8e7b579f50094b37bf0b3613c4a4da24-0000000000002501-0005bee891cd8085.journal |
2 | -- Logs begin at Thu 2021-04-01 14:42:51 CEST, end at Thu 2021-04-01 18:29:21 CEST. -- |
3 | Apr 01 14:51:00 rfr-mainframe sudo[45733]: pam_unix(sudo:auth): conversation failed |
4 | Apr 01 14:51:00 rfr-mainframe sudo[45733]: pam_unix(sudo:auth): auth could not identify password for [rfr] |
5 | |
6 | |
7 | journalctl -p crit --file user-1000_8e7b579f50094b37bf0b3613c4a4da24-0000000000002501-0005bee891cd8085.journal |
8 | -- Logs begin at Thu 2021-04-01 14:42:51 CEST, end at Thu 2021-04-01 18:29:21 CEST. -- |
9 | Apr 01 14:51:00 rfr-mainframe sudo[45733]: pam_unix(sudo:auth): auth could not identify password for [rfr] |
10 | |
11 | journalctl -p emerg --file user-1000_8e7b579f50094b37bf0b3613c4a4da24-0000000000002501-0005bee891cd8085.journal |
12 | -- No entries -- |
13 | |
14 | |
15 | nichts wirklich kritisches. |
16 | das Gleiche mit dem systemjournal, |
17 | |
18 | journalctl -p emerg --file system_cb0928eb93ab4248991ea7179d1727c1-0000000000000001-0005bee87094017a.journal |
19 | -- Logs begin at Thu 2021-04-01 14:33:33 CEST, end at Fri 2021-04-02 14:54:15 CEST. -- |
20 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 1.55 No irq handler for vector |
21 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 2.55 No irq handler for vector |
22 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 3.55 No irq handler for vector |
23 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 4.55 No irq handler for vector |
24 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 5.55 No irq handler for vector |
25 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 6.55 No irq handler for vector |
26 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 7.55 No irq handler for vector |
27 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 8.55 No irq handler for vector |
28 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 9.55 No irq handler for vector |
29 | Apr 01 14:33:33 rfr-mainframe kernel: __common_interrupt: 10.55 No irq handler for vector |
30 | -- Reboot -- |
31 | same |
32 | -- Reboot -- |
33 | ... |
kernel: __common_interrupt: ### No irq handler for vector Dann hat man etwas zum suchen Firmware/Bios laut Suchmaschine verfügbare BIOS Version ermitteln, soll 3603 sein.
Die "No irq handler for vector" sind harmlos und haben sicher nichts mit dem Problem zu tun.
516133 schrieb: > Dann hat man etwas zum suchen > Firmware/Bios laut Suchmaschine > > verfügbare BIOS Version ermitteln, soll 3603 sein. Wie ich schon viel weiter oben geschrieben habe... Lesen ist nicht Deine Stärke, was?
John Doe schrieb: > 516133 schrieb: >> Dann hat man etwas zum suchen >> Firmware/Bios laut Suchmaschine >> >> verfügbare BIOS Version ermitteln, soll 3603 sein. > > Wie ich schon viel weiter oben geschrieben habe... > Lesen ist nicht Deine Stärke, was? Das war nicht der Punkt. Mann.
Das Mce-Zeug sieht wirklich nach Speicherfehler o.ä. aus, bei dem der Kern ne Panik kriegen kann: https://www.thomas-krenn.com/de/wiki/Mcelog Auch die vielen Meldungen mit dem zerbrochenen Bios (amd64 EDAC) klingen irgendwie doof nach zu machendem Bios-Update, sofern möglich.
Das Bios passt nicht richtig, steht doch sogar im Klartest in der dmesg Ausgabe: "you might be running a broken BIOS" Also, mach ein Bios update und dann poste Dein neues dmesg.txt.
John Doe schrieb: >> [ 0.000000] Linux version 5.8.0-48-generic (buildd@lgw01-amd64-052) >> (gcc (Ubuntu 10.2.0-13ubuntu1) 10.2.0, GNU ld (GNU Binutils for Ubuntu) >> 2.35.1) #54-Ubuntu SMP Fri Mar 19 14:25:20 UTC 2021 (Ubuntu >> 5.8.0-48.54-generic 5.8.18) >> Auch ein wenig in die Jahre gekommen. > > Was an Ubuntu 20.10 ist denn "in die Jahre gekommen"? Sorry mein Fehler. Aus der Paketversion Ubuntu 10.2.0-13ubuntu1 habe ich irgendwie Ubuntu 10.2 abgeleitet :)
Gut soweit, ich würde jetzt geerne ein BIOS update machen, weiss aber nicht, wie ich <das machen soll. Gruss Robert
R. F. schrieb: > ich würde jetzt geerne ein BIOS update machen, weiss aber nicht, wie ich > <das machen soll. Gehste auf die Asus-Seite und ziehst Dir das aktuelle BIOS für Dein Mobo - Du hast ein X570-E, wenn ich das richtig gesehen habe. https://rog.asus.com/motherboards/rog-strix/rog-strix-x570-e-gaming-model/helpdesk_bios Das entpackst Du, kopierst es danach auf einen USB-Stick, bootest den Rechner, drückst die Entf-Taste beim Booten, um ins Bios zu kommen. Da muß irgendwo das EZ Flash Utility oder so sein, und damit machst Du das Update. Danach solltest Du sicherheitshalber das BIOS auf Werkseinstellugnen zurücksetzen. Dann neu booten, dann Deine Wunscheinstellungen vornehmen.
Nach BIOS Update scheint es besser zu sein. Vielen Dank allerseits.
Beitrag #6649176 wurde vom Autor gelöscht.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.