regex asc file parsen

von Christoph M. (mchris)

28.11.2022 06:41

Lesenswert?

•

Ich würde gerne mit Hilfe regulärer Ausdrücke

https://regex101.com/
https://quickref.me/regex

ein ASC-File parsen. Das File sieht so aus

SYMBOL voltage -128 160 R0
WINDOW 123 0 0 Left 2
WINDOW 39 0 0 Left 2
SYMATTR InstName V1
SYMATTR Value SINE(0 1 1000)
TEXT -160 408 Left 2 !.tran 5m
TEXT 296 272 Left 2 ;time
TEXT 688 256 VLeft 2 ;amplitude (vertical)
TEXT 216 16 Left 2 ;LtSpice Labels
TEXT 160 352 Left 2 ;Label  size 1.5
TEXT 160 408 Left 3 ;Label size 2.0
TEXT 160 480 Left 4 ;Label size 3.5
TEXT 152 544 Left 4 ;Label size 3.5
RECTANGLE Normal 880 784 80 -32 2


und ich will die Zeilen die mit "TEXT" beginnen und ein ";" haben 
finden.

Weis jemand, wie das geht?

Der erste Vorschlag wäre

1	^.TEXT.$


Dieser Ausdruck holt aber alle Zeilen, die "TEXT" enthalten, auch die 
ohne ";"

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Wilhelm M. (wimalopaan)

28.11.2022 07:52

Lesenswert?

•

▲
▼

'^TEXT.*;'

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Rolf M. (rmagnus)

28.11.2022 08:13

Lesenswert?

•

▲
▼

Christoph M. schrieb:
> Dieser Ausdruck holt aber alle Zeilen, die "TEXT" enthalten, auch die
> ohne ";"

In dem Ausdruck kommt ja auch kein ";" vor.

Wilhelm M. schrieb:
> '^TEXT.*;'

Das matcht aber nicht auf die ganze Zeile, sondern nur auf den Teil bis 
zum Semikolon (einschließlich diesem).

Das hier matcht auf ganze Zeilen, die mit "TEXT" beginnen und irgendwo 
danach ein Semikolon enthalten:

1	^TEXT.;.$

Mit Capture-Groups könnte man noch die Bestandteile einzeln extrahieren.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Wilhelm M. (wimalopaan)

28.11.2022 09:33

Lesenswert?

•

▲
▼

Rolf M. schrieb:
> Das matcht aber nicht auf die ganze Zeile, sondern nur auf den Teil bis
> zum Semikolon (einschließlich diesem).

... und die gängigen Tools wie grep, awd, ... geben die ganze Zeile aus, 
wenn ein regex einem Teil der Zeile entspricht. Alles andere vergrößert 
nur die Laufzeit und ist dann eben unnötig.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Christoph M. (mchris)

28.11.2022 12:04

Lesenswert?

•

▲
▼

Rolf M. (rmagnus)

>Das hier matcht auf ganze Zeilen, die mit "TEXT" beginnen und irgendwo
>danach ein Semikolon enthalten:

>^TEXT.*;.*$

>Mit Capture-Groups könnte man noch die Bestandteile einzeln extrahieren.

Danke für den Code. Eigentlich brauche ich von der Zeile nur den Teil 
nach dem Semikolon. Gibt es da eine Möglichkeit, den Regex-Ausdruck zu 
kapseln und dann den Teil nach dem Semikolon zu extrahieren?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Norbert (Gast)

28.11.2022 12:18

Lesenswert?

•

▲
▼

1	sed -nre 's/^TEXT.;(.)$/\1/p' INFILE


time
amplitude (vertical)
LtSpice Labels
Label  size 1.5
Label size 2.0
Label size 3.5
Label size 3.5

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Dirk B. (dirkb2)

28.11.2022 12:28

Lesenswert?

•

▲
▼

Christoph M. schrieb:
> Eigentlich brauche ich von der Zeile nur den Teil
> nach dem Semikolon. Gibt es da eine Möglichkeit, den Regex-Ausdruck zu
> kapseln

Dafür sind die () da

> und dann den Teil nach dem Semikolon zu extrahieren?

Das macht das \1 - der erste gesuchte Ausdruck

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Christoph M. (mchris)

28.11.2022 17:12

Lesenswert?

•

▲
▼

Danke an alle :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Christoph M. (mchris)

28.11.2022 17:20

Lesenswert?

•

▲
▼

Das hier alleine scheint auch zu funktionieren:

1	TEXT.;(.)


https://regex101.com/

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Norbert (Gast)

28.11.2022 17:34

Lesenswert?

•

▲
▼

Christoph M. schrieb:
> Das hier alleine scheint auch zu funktionieren:TEXT.*;(.*)

Scheint…

Christoph M. schrieb:
> Zeilen die mit "TEXT" beginnen

›Beginnen‹ scheint mir hier das wichtige Wort zu sein!  ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Rolf M. (rmagnus)

30.11.2022 09:52

Lesenswert?

•

▲
▼

Christoph M. schrieb:
> Das hier alleine scheint auch zu funktionieren:TEXT.*;(.*)

In dem Fall matchen aber auch Zeilen, wo TEXT nicht am Anfang, sondern 
irgendwo in der Zeile steht, solange irgendwann danach noch ein 
Semikolon kommt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von 🐧 DPA 🐧 (Gast)

30.11.2022 10:25

Lesenswert?

•

▲
▼

Ich würde da gar keine regex verwenden. Einfach passend splitten:

#!/bin/bash
while IFS=';' read sargs last
  set -o noglob
  args=( $sargs )
  set +o noglob
  if [ -n "$last" ]; then args+=("$last"); fi
  echo "Command: ${args[0]}"
  echo "Arguments:"
  printf " - %s\n" "${args[@]:1}"

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Norbert (Gast)

30.11.2022 10:42

Lesenswert?

•

▲
▼

Vieles was ›auch‹ möglich ist, ist nicht unbedingt auch eleganter…

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von TotoMitHarry (Gast)

30.11.2022 13:01

Lesenswert?

•

▲
▼

Oder so.
"(?:^TEXT.*;)(.*)"

.. mit ?: wird die Klammer zwar auch gesucht, aber nicht ausgegeben ;)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Christoph M. (mchris)

02.12.2022 06:23

Lesenswert?

•

▲
▼

von 🐧 DPA 🐧 (Gast)
>Ich würde da gar keine regex verwenden. Einfach passend splitten:

Normalerweise mache ich es auch zu Fuß. Regex scheint recht mächtig, 
aber schwer nachzuvollziehen.
Ich wollte aber mal was neues ausprobieren, deshalb mal mit regex.
Das Ganze soll aber nicht in der bash sondern in Python verwendet 
werden.

TotoMitHarry (Gast)
>.. mit ?: wird die Klammer zwar auch gesucht, aber nicht ausgegeben ;)

Geht aber aber in folgendem Code nicht:

import re
txt = txt + "SYMBOL voltage -128 160 R0" +"\n"
txt = txt + "SYMATTR InstName V1" +"\n"
txt = txt + "SYMATTR Value SINE(0 1 1000)" +"\n"
txt = txt + "TEXT -160 408 Left 2 !.tran 5m" +"\n"
txt = txt + "TEXT 160 352 Left 2 ;Label  size 1.5"+"\n"
txt = txt + "TEXT 160 408 Left 3 ;Label size 2.0"+"\n"
txt = txt + "TEXT 160 480 Left 4 ;Label size 3.5"+"\n"
txt = txt + "TEXT 152 544 Left 4 ;Label size 3.5"+"\n"
txt = txt + "TEXT 688 256 VLeft 2 ;amplitude (vertical)"+"\n"
txt = txt + "RECTANGLE Normal 880 784 80 -32 2" +"\n"
x = re.findall(r"TEXT.*;(.*)", txt) # geht  
#x = re.findall(r"(?:^TEXT.*;)(.*)", txt) #geht nicht 
print(x)
for s in x:
  print(s)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Norbert (Gast)

02.12.2022 08:54

Lesenswert?

•

▲
▼

#!/usr/bin/python3
# -*- coding: UTF-8 -*-
import re
data = '''
SYMBOL voltage -128 160 R0
WINDOW 123 0 0 Left 2
WINDOW 39 0 0 Left 2
SYMATTR InstName V1
SYMATTR Value SINE(0 1 1000)
TEXT -160 408 Left 2 !.tran 5m
TEXT 296 272 Left 2 ;time
TEXT 688 256 VLeft 2 ;amplitude (vertical)
TEXT 216 16 Left 2 ;LtSpice Labels
TEXT 160 352 Left 2 ;Label  size 1.5
TEXT 160 408 Left 3 ;Label size 2.0
TEXT 160 480 Left 4 ;Label size 3.5
TEXT 152 544 Left 4 ;Label size 3.5
RECTANGLE Normal 880 784 80 -32 2
pattern = re.compile(r"^TEXT.*;(.*)")
for line in data.splitlines():
    result = pattern.match(line)
    if result:
        print(result.group(1))

amplitude (vertical)
LtSpice Labels
Label  size 1.5
Label size 2.0
Label size 3.5
Label size 3.5

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Christoph M. (mchris)

03.12.2022 14:36

Lesenswert?

•

▲
▼

Danke dafür.
Jetzt habe ich schon das nächste Problem: Gesucht werden soll über 
mehrere Zeilen ..

Version 4
SHEET 1 948 804
WIRE -128 176 -128 128
WIRE -128 304 -128 256
FLAG -128 304 0
SYMBOL voltage -128 160 R0
WINDOW 123 0 0 Left 2
WINDOW 39 0 0 Left 2
SYMATTR InstName Spannung1
SYMATTR Value SINE(0 1 1000)
SYMBOL button 224 288 R0
SYMATTR InstName button1
SYMBOL button 224 336 R0
SYMATTR InstName button2
SYMBOL button 224 384 R0
SYMATTR InstName button3
TEXT -160 408 Left 2 !.tran 5m
TEXT 216 16 Left 2 ;LtSpice Labels
TEXT 224 232 Left 2 ;Selector
RECTANGLE Normal 880 784 80 -32 2


Die Definition eines Symbols verteilt sich über mehrere Zeilen (z.B. 2)

SYMBOL button 224 288 R0
SYMATTR InstName button1


Ich will den Namen "button1" aus den zwei Zeilen extrahieren. Das 
bedeutet also, man muss zuerst die Zeile mit dem Inhalt "SYMBOL button" 
und dann aus der Zeile mit "SYMATTR InstName" den Namen "button1" 
extrahieren.

Wenn ich als Regex-Expression folgendes nehme

1	(^SYMBOL button(.)\nSYMATTR InstName).

kommen als Matches immer beide Zeilen gleichzeitig, aber nicht der 
gesuchte Namen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Norbert (Gast)

03.12.2022 14:55

Lesenswert?

•

▲
▼

Python regex kann auch problemlos über mehrere Zeilen und man kann 
mehrere groups definieren.

Vielleicht ist noch nicht einmal garantiert, das die Zeilen immer in der 
von dir gewünschten Reihenfolge an die Tür klopfen.
Irgendwann wird es jedoch sinnvoller sein, eine kleine Klasse zu 
schreiben und etwas zusätzliche Logik zu implementieren.
Wer zu Klassen eine eher abweisende Grundeinstellung hat, nimmt dann 
eben closures.

All das zumal dieses aktuelle Problem wahrscheinlich nicht deine letzte 
Herausforderung sein wird.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Christoph M. (mchris)

03.12.2022 15:05

Lesenswert?

•

▲
▼

>Vielleicht ist noch nicht einmal garantiert, das die Zeilen immer in der
>von dir gewünschten Reihenfolge an die Tür klopfen.
>Irgendwann wird es jedoch sinnvoller sein, eine kleine Klasse zu
>schreiben und etwas zusätzliche Logik zu implementieren.

Vielleicht hast Du recht und ich sollte es vielleicht ohnehin ohne regex 
machen. Das ist für mich etwas eingängiger.

Das Format eine *.asc LtSpice Files ist etwas seltsam: Erst kommt die 
Symbolbezeichung und in den nachfolgenden Zeilen die Attribute. Alle 
Zeilen gehören dazu bis zur nächstmöglichen nächsten Symbolbezeichnung. 
Um die Endzeile eines Symbols zu erkennen muss man also erkennen das ein 
neues Symbol anfängt. Es können aber auch andere Elemente wie "TEXT" das 
Ende eines Symbols markieren. Ich weiß gar nicht, ob solch ein komplexer 
Parser mit Regex überhaupt möglich ist.

#!/usr/bin/python3
# -*- coding: UTF-8 -*-
import re
data = '''
Version 4
SHEET 1 948 804
WIRE -128 176 -128 128
WIRE -128 304 -128 256
FLAG -128 304 0
SYMBOL voltage -128 160 R0
WINDOW 123 0 0 Left 2
WINDOW 39 0 0 Left 2
SYMATTR InstName Spannung1
SYMATTR Value SINE(0 1 1000)
SYMBOL button 224 288 R0
SYMATTR InstName button1
SYMBOL button 224 336 R0
SYMATTR InstName button2
SYMBOL button 224 384 R0
SYMATTR InstName button3
TEXT -160 408 Left 2 !.tran 5m
TEXT 216 16 Left 2 ;LtSpice Labels
TEXT 224 232 Left 2 ;Selector
RECTANGLE Normal 880 784 80 -32 2
pattern = re.compile(r"(^SYMBOL button(.*)\\nSYMATTR InstName)(.*)")
print(pattern.match(data))

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: regex asc file parsen

von Norbert (Gast)

03.12.2022 15:13

Lesenswert?

•

▲
▼

Christoph M. schrieb:
> und ich sollte es vielleicht ohnehin ohne regex
> machen.

Gibt kaum etwas schöneres und flexibleres als RegEx.
Lies Zeilenweise ein, kompiliere dir verschiedene RegEx-Pattern, wende 
sie an und sammle die Ergebnisse. Wenn alle Zeilen eines Blocks gelesen 
sind, dann die Infos kombinieren.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: PC-Programmierung regex asc file parsen