Forum: PC-Programmierung Zeichenketten auswerten


von Esmu P. (Firma: privat) (max707)


Lesenswert?

Hallo Spezis,

ich möchte Zechenketten nach bestimmten Inhalten auswerten und die 
Häufigkeiten derer graphisch darstellen.

Diese Zeichketten sind nicht auf ein einziges Kriterium beschränkt. So
z.B. xxx, yyy, zzz... Sonderzeichen etc.

Diese Zeichenketten liegen als täglich generiertes File vor, z.b. 
"*.txt".
Ich hätte gerne statistische Auswertungen, xxx kommt im Monat so oft 
vor.


Welche Software kann das ohne große Einarbeitung leisten? Eine portable 
SW
wird bevorzugt.

: Gesperrt durch Moderator
von g457 (Gast)


Lesenswert?

> Welche Software kann das ohne große Einarbeitung leisten? Eine portable
> SW wird bevorzugt.

bash, grep, wc, vielleicht noch tr oder sed. Viel Einarbeitung benötigt 
das nicht, weil das eh zum Grundwissen gehört.

HTH

von Esmu P. (Firma: privat) (max707)


Lesenswert?

Ich bin aber kein Programmierer und die Auswertungen sollen unter 
Windows ab XP laufen. Also eine simple Lösung wird gesucht.

Ich will nur den Speicherort des Files angeben und die Suchkriterien, 
und als Output will ich eine aussagekräftige Graphik sehen.

von Volle (Gast)


Lesenswert?

BIRT
http://www.eclipse.org/birt/
wurde für solche Aufgab entwickelt

oder klassisch:
perl + gnuplot

von max707 (Gast)


Lesenswert?

BIRT lade ich mir gerade aus dem Netz, ist aber ganz schön umfangreich, 
so um 300 MB. Falls es dann auch noch installiert werden muß, dann ist 
es für mich eher nur noch 2. Wahl.

von max707 (Gast)


Lesenswert?

schon unten durch :(

Kennwörter werden abgefragt... Mist!

von max707 (Gast)


Lesenswert?

Beim Entpacken!!! schon...

von ms (Gast)


Lesenswert?

Hallo,

wie sieht die txt datei genau aus.
Ist es möglich die Datei in *.csv umzubenennen und mit Excel zu öffnen.


ms

von max707 (Gast)


Lesenswert?

Ich bin mir nicht mehr sicher, ob ich das schon früher mal gemacht habe. 
Glaube ja. Zufrieden war ich nicht damit.

von ms (Gast)


Lesenswert?

Hallo,

ich glaube da kommst Du an "regulärer Ausdruck" nicht vorbei.

ms

von max707 (Gast)


Lesenswert?

Oh weh, das liegt schon soooo lange zurück. Wiki hat mich wieder mal 
geerdet.

Es gibt doch bestimmt schon fertige Lösungen als Freeware.

von ms (Gast)


Lesenswert?

Hallo,

was brauchst du genau?
Eine Zeichenkette suchen ist klar.
Die Anzahl erfassen ist auch klar.
und jetzt?

ms

von max707 (Gast)


Lesenswert?

Konkret sind das mehrere Zeichenketten, die Anzahl ist überschaubar. 
Vielleicht kleiner als 100.

Ich will eine graphische Darstellung wie oft bestimme Zeichenketten 
vorkommen, d.h. z.B.: ZK1 20 mal; ZK2 auch 20 mal...
Kommen diese Zeichenketten immer zusammen vor?


Vergleiche in bestimmten Zeiträumen sollen möglich sein. So z.B.
im Januar, im Februar..., der Februar war aber schlechter als...

von max707 (Gast)


Lesenswert?

Zusatz:

Die Text Files sind pro Tag ca. 2 MB groß.

von ms (Gast)


Lesenswert?

Hallo,

woher will die Software wissen das es jetzt Feb. ist.
Steht da ein Datum am Zeilenanfang??
Der Aufbau einer Zeile als Muster währe nicht schlecht.
Oder braucht man sogar eine SQlite?


ms

von max707 (Gast)


Lesenswert?

1. - Das Textfile *.txt ist mit einem Datum versehen wann es angelegt 
wurde.
2. - Im Textfile steht das Datum auch noch.

von ms (Gast)


Lesenswert?

Hallo,

könnte es sein dass das file aus einem ERP-Sytem jeden Tag erstellt 
wird.
Ist es nicht einfacher (sollte es zutreffen) eine SQL Abfrage zu machen 
und
per List u. Label oder vergleichbar Grafisch darzustellen.

ms

von Daniel A. (daniel-a)


Lesenswert?

Welche übereinstimmungskriterien gibt es denn?
Müssen per abstand getrennte wörter exact übereinstimmen?
Falls ja, gibt es auch satzzeichen?
Falls nein, wie müssen überschneidungen gezählt werden?
Zählt testest beim suchbegriff test als 0, 1 oder 2 matches?
Wie sieht es mit sonderzeichen aus?

von Peter M. (r2d3)


Lesenswert?

max707 schrieb:

> Konkret sind das mehrere Zeichenketten, die Anzahl ist überschaubar.
> Vielleicht kleiner als 100.
>
> Ich will eine graphische Darstellung wie oft bestimme Zeichenketten
> vorkommen, d.h. z.B.: ZK1 20 mal; ZK2 auch 20 mal...
> Kommen diese Zeichenketten immer zusammen vor?
>
> Vergleiche in bestimmten Zeiträumen sollen möglich sein. So z.B.
> im Januar, im Februar..., der Februar war aber schlechter als...

Für mich klingt das nach einer einfachen, aber spezifischen 
Zeichenkettensuche.
Welche Software soll diese spezifische Suche durchführen? Mir fällt dazu 
nichts ein.

Ich hätte das in VBA geschrieben.

Ordner-Inhalt und alle Dateien abarbeiten, die der Suchspezifikationen 
entsprechen.

Jede Datei öffnen und zeichenweise einlesen und mit ZK1 bis ZK100 
abgleichen.

Bei Treffern die passende Zählvariablen um 1 erhöhen.

Balkengrafik über den Vektor der Zählvariablen legen.

Deine Fragestellung
> Kommen diese Zeichenketten immer zusammen vor?
ist aber ziemlich unscharf beschrieben.

Es könnte dann sein, dass man das Problem etwas anders angehen sollte.

von Daniel A. (daniel-a)


Angehängte Dateien:

Lesenswert?

Ich habe mal schnell ein kleines tree search Programm in c geschrieben. 
Es fehlt nurnoch etwas, um die Liste einzulesen, und etwas, um 
hochzuzälen.
1
daniel@colibri:~/projects/matcher$ gcc -g -Og -std=c99 -Wall -Wextra -pedantic -Werror tree.c main.c -o tree;./tree
2
Entry 0 matched at offset 2
3
Entry 1 matched at offset 7
4
Entry 3 matched at offset 12
5
Entry 3 matched at offset 15
6
Entry 3 matched at offset 18
7
Entry 2 matched at offset 22
8
Entry 0 matched at offset 27
9
Entry 2 matched at offset 30

von max707 (Gast)


Lesenswert?

Daniel A. schrieb:
> Welche übereinstimmungskriterien gibt es denn?
Exakt
> Müssen per abstand getrennte wörter exact übereinstimmen?
Ja
> Falls ja, gibt es auch satzzeichen?
Ja
> Falls nein, wie müssen überschneidungen gezählt werden?
???
> Zählt testest beim suchbegriff test als 0, 1 oder 2 matches?
0
> Wie sieht es mit sonderzeichen aus?
Exakt

von max707 (Gast)


Lesenswert?

Daniel A. schrieb:
> Ich habe mal schnell ein kleines tree search Programm in c geschrieben.
> Es fehlt nurnoch etwas, um die Liste einzulesen, und etwas, um
> hochzuzälen.
...
> [/pre]

Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne 
jetzt unendlich viele Programme auszuprobieren

von Peter M. (r2d3)


Lesenswert?

max707 schrieb:
> Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne
> jetzt unendlich viele Programme auszuprobieren

"Nein, meine Suppe ess' ich nicht!"

=>

Nein, meine Zeichenkettensuche programmier' ich nicht!


Buchseite 38 im PDF
https://www.reclam.de/data/blickinsbuch/978-3-15-018569-8.pdf

Und wenn er nicht gestorben ist, dann wartet er noch heute.

Wann kommt denn nun sein Ober mit dem silbernen Tablett und der 
Software, die auf Anhieb funktioniert?!

von max707 (Gast)


Lesenswert?

Dieses Unterforum: PC-Programmierung ist wohl der falsche Ort für meine 
Frage.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

max707 schrieb:
> Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne
> jetzt unendlich viele Programme auszuprobieren

Klingt nach Verarschung. Du hoffst echt, dass es ein Programm gibt, das 
ein absolut spezifisches Problem, welches möglicherweise nie zuvor 
jemand hatte, lösen kann?

Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund 
gegeben:

Beitrag "Re: Zeichenketten auswerten"
Beitrag "Re: Zeichenketten auswerten"

Es würde mich wundern, wenn es grep nicht für Windows gäbe.

Und wenn du schon nicht in der Lage bist, deine Anforderungen z.B. mit 
einem regulären Ausdruck zu präzisieren (nein, aus dem, was du 
geschrieben hast geht eben nicht genau hervor, was du willst), dann 
stelle doch zumindest als Beispiel ein abgespecktes file hier rein und 
erkläre, was du für eine Ausgabe erwarten würdest.

Bis dahin schließe ich mich

Beitrag "Re: Zeichenketten auswerten"

an.

von Daniel A. (daniel-a)


Lesenswert?

Noch eine Frage, sind die Zeichenketten und die Inhalte, mit denen diese 
verglichen werden, die selben, oder unterschiedliche?

von max707 (Gast)


Lesenswert?

In dem (den) txt file(s) ist eine sehr wichtige Information enthalten, 
die durchaus auch öfter vorkommen kann.

Ich will wissen wie oft, wenn die Zeitspanne die überprüft werden soll 
ein Monat ist, dann die Anzahl der Übereinstimmungen pro Monat.

Sehr wichtig für mich ist die Anforderung, daß mehrere Suchstrings 
eingegeben werden können.

von max707 (Gast)


Lesenswert?

Md M. schrieb:
> max707 schrieb:
>> Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne
>> jetzt unendlich viele Programme auszuprobieren
>
> Klingt nach Verarschung. Du hoffst echt, dass es ein Programm gibt, das
> ein absolut spezifisches Problem, welches möglicherweise nie zuvor
> jemand hatte, lösen kann?

Wieso?
>
> Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund
> gegeben:
> ...
>
> Es würde mich wundern, wenn es grep nicht für Windows gäbe.
Das ist nicht das Thema.
>
> Und wenn du schon nicht in der Lage bist, deine Anforderungen z.B. mit
> einem regulären Ausdruck zu präzisieren (nein, aus dem, was du
> geschrieben hast geht eben nicht genau hervor, was du willst), dann
> stelle doch zumindest als Beispiel ein abgespecktes file hier rein und
> erkläre, was du für eine Ausgabe erwarten würdest.
>
Was im Textfile steht ist für die Lösung völlig irrelevant! Ich will die 
Zeichenkette auswerten. Punkt.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Und wieso hast du statt eines weiteren nichtssagenden Textes nicht 
einfach ein Beispiel hier reingestellt, wie ich vorgeschlagen habe?

> In dem (den) txt file(s) ist eine sehr wichtige Information enthalten,

Interessiert kein Schwein.

> die durchaus auch öfter vorkommen kann.
> Ich will wissen wie oft, wenn die Zeitspanne die überprüft werden soll
> ein Monat ist, dann die Anzahl der Übereinstimmungen pro Monat.

Ja, das hast du schon erwähnt.

> Sehr wichtig für mich ist die Anforderung, daß mehrere Suchstrings
> eingegeben werden können.

Ja, auch das hast du schon erwähnt.

von Rolf (Gast)


Lesenswert?

max707 schrieb:
> Das ist nicht das Thema.

max707 schrieb:
> für die Lösung völlig irrelevant!

max707 schrieb:
> Punkt.

Ich hab das Gefühl, der Max will mit allen Mitteln verhindern, daß ihm 
jemand hilft...

von max707 (Gast)


Lesenswert?

Wie kommst Du denn darauf?

Die Frage war doch eindeutig genug gestellt, oder etwa nicht?

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

max707 schrieb:
> Md M. schrieb:
>> max707 schrieb:
>>> Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne
>>> jetzt unendlich viele Programme auszuprobieren
>>
>> Klingt nach Verarschung. Du hoffst echt, dass es ein Programm gibt, das
>> ein absolut spezifisches Problem, welches möglicherweise nie zuvor
>> jemand hatte, lösen kann?
>
> Wieso?

Wieso du das hoffst, weiß ich nicht.

>> Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund
>> gegeben:
>> ...
>>
>> Es würde mich wundern, wenn es grep nicht für Windows gäbe.
> Das ist nicht das Thema.

Doch. Du wolltest einen Weg wissen, wie du Zeichenketten in einer 
Textdatei finden und zählen kannst. Dein Thema ist Regex, grep ist eine 
naheliegende und simple Lösung, die auch unter XP funktioniert. Das war 
genau das, wonach du gefragt hast, also ist das sehr wohl das Thema

>> Und wenn du schon nicht in der Lage bist, deine Anforderungen z.B. mit
>> einem regulären Ausdruck zu präzisieren (nein, aus dem, was du
>> geschrieben hast geht eben nicht genau hervor, was du willst), dann
>> stelle doch zumindest als Beispiel ein abgespecktes file hier rein und
>> erkläre, was du für eine Ausgabe erwarten würdest.
>>
> Was im Textfile steht ist für die Lösung völlig irrelevant! Ich will die
> Zeichenkette auswerten. Punkt.

Ja, was da drin steht ist irrelevant, weshalb auch unverständlich ist, 
warum du erwähnst, wie wichtig die Daten sind.

Zeig doch einfach ein kurzes Beispiel mit Phantasie-Daten, das kann doch 
nicht so schwer sein.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

max707 schrieb:
> Die Frage war doch eindeutig genug gestellt, oder etwa nicht?

Eben nicht. Eindeutig wär ein regulärer Ausdruck. Dass du damit 
offensichtlich nichts anfangen kannst ist ja keine Schande. Aber mit

> Diese Zeichketten sind nicht auf ein einziges Kriterium beschränkt. So
> z.B. xxx, yyy, zzz... Sonderzeichen etc.

kann niemand was anfangen. Deshalb hatte ich um ein Beispiel gebeten.

von max707 (Gast)


Lesenswert?

Md M. schrieb:
> max707 schrieb:
>> Md M. schrieb:
>>> max707 schrieb:
...
>
>>> Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund
>>> gegeben:
>>> ...
>>>
>>> Es würde mich wundern, wenn es grep nicht für Windows gäbe.
>> Das ist nicht das Thema.
>
> Doch. Du wolltest einen Weg wissen, wie du Zeichenketten in einer
> Textdatei finden und zählen kannst. Dein Thema ist Regex, grep ist eine
> naheliegende und simple Lösung, ...
>
Der Tip mit grep und Regex ist schon mal nicht schlecht, so meine 
Recherchen dazu. Sie erfüllen aber nicht direkt meine Anforderungen.

...
>
> Zeig doch einfach ein kurzes Beispiel mit Phantasie-Daten, das kann doch
> nicht so schwer sein.
Doch ist es im Moment, da mir die Daten nicht gehören. Irgendo in meinen 
Rechnern habe ich vielleicht noch Daten, die ich erst noch modifizieren 
muss um sie zeigen zu können. Die Files sind schon umfangreich.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

max707 schrieb:
>> Zeig doch einfach ein kurzes Beispiel mit Phantasie-Daten, das kann doch
>> nicht so schwer sein.
> Doch ist es im Moment, da mir die Daten nicht gehören. Irgendo in meinen
> Rechnern habe ich vielleicht noch Daten, die ich erst noch modifizieren
> muss um sie zeigen zu können. Die Files sind schon umfangreich.

Meine Fresse... Ich will auch nicht, dass du hier Kontonummern 
hinschreibst. Aber ein einfaches Beispiel nach dem Prinzip:

Ich habe die Zeichenkette
"aaabbbcccddd"
Ich möchte wissen wie oft die Zeichenketten
"aa"
"aab"
"ab"
"c"
vorkommen.

sollte doch wohl drin sein. Wenn du dann dahinter deine Erwartungswerte, 
also konkrete Zahlen schreiben würdest, wüsste jeder, wonach du suchst. 
Wenn dann doch Ungenaugigkeiten zurückbleiben, könnte dir jemand ein 
Gegenbeispiel hinschreiben und dich fragen, welche Zahlen du erwarten 
würdest.

von max707 (Gast)


Lesenswert?

Das hatte ich bereits angegeben: siehe testest mit test = "0"
siehe hier: Beitrag "Re: Zeichenketten auswerten"

von Rolf (Gast)


Lesenswert?

max707 schrieb:
> Das hatte ich bereits angegeben: siehe testest mit test = "0"
> siehe hier: Beitrag "Re: Zeichenketten auswerten"

Da sehe ich kein einziges Beispiel. (?)

von Daniel A. (daniel-a)


Angehängte Dateien:

Lesenswert?

Ich glaube ich verstehe langsam, wonach der TO sucht. Ich habe mein 
suchprogramm angepasst, damit es jetzt wörter oder wörterketten 
vergleicht. Nächsten Mittwoch oder so mache ich dann einlesen von files, 
auswertung und Benutzerinterface. Für mich hört sich das so an, als ob 
der TO gewönhliche Textdokument mit gewönlichen Texten hat, wie man sie 
z.B. beim mitschneiden von IRC konversationen bekommt, und darin nach 
Wörtern oder Wortfolgen suchen will, um auszuwerten wie häufig diese 
vorkamen etc.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die 
Zahlen jeweils dahinter

"test"
" test"
"test "
" test "
"testest "
" testest"

von max707 (Gast)


Lesenswert?

Md M. schrieb:
> Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die
> Zahlen jeweils dahinter
>
> "test" 1
> " test" 0
> "test " 0
> " test " 0
> "testest " 0
> " testest" 0

von Rolf (Gast)


Lesenswert?

Daniel A. schrieb:
> Für mich hört sich das so an, als ob
> der TO gewönhliche Textdokument mit gewönlichen Texten hat, wie man sie
> z.B. beim mitschneiden von IRC konversationen bekommt, und darin nach
> Wörtern oder Wortfolgen suchen will, um auszuwerten wie häufig diese
> vorkamen etc.

Ich habe ihn so verstanden, daß alle Begriffe untereinander stehen.
Das sind nun ganz verschiedene Meinungen, welche ist richtig?
Und ist überhaupt eine von beiden richtig?

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Daniel A. schrieb:
> Ich habe mein
> suchprogramm angepasst, damit es jetzt wörter oder wörterketten
> vergleicht. Nächsten Mittwoch oder so mache ich dann einlesen von files,
> auswertung und Benutzerinterface.

Echt supernett von dir, aber bitte such mal nach anderen Beiträgen in 
anderen threads von ihm/ihr und überlege dir, ob du das wirklich machen 
möchtest. Er/sie spekuliert drauf, dass andere ihm/ihr fertige Lösungen 
präsentieren.

: Bearbeitet durch User
von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

max707 schrieb:
> Md M. schrieb:
>> Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die
>> Zahlen jeweils dahinter
>>
>> "test" 1
>> " test" 0
>> "test " 0
>> " test " 0
>> "testest " 0
>> " testest" 0

Völlig unlogisch, was du da machen willst. In allen genannten 
Zeichenketten ist die Zeichenkette "test" mindestens einmal vorhanden.

von Rolf M. (rmagnus)


Lesenswert?

Md M. schrieb:
> Völlig unlogisch, was du da machen willst.

Die obige Angabe würde passen, wenn nur dann der Suchbegriff als 
gefunden gelten soll, wenn der gesamte Inhalt der Datei dem Suchbegriff 
entspricht.
Vielleicht werden die Wörter auch nicht mit Leerzeichen getrennt, 
sondern mit irgendeinem anderen Zeichen. Man könnte jetzt ein schönes 
Ratespielchen daraus machen, die gewünschte Struktur rauszufinden.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Rolf M. schrieb:
> Md M. schrieb:
>> Völlig unlogisch, was du da machen willst.
>
> Die obige Angabe würde passen, wenn nur dann der Suchbegriff als
> gefunden gelten soll, wenn der gesamte Inhalt der Datei dem Suchbegriff
> entspricht.

Der Suchbegriff war "test".

Daniel A. schrieb:
> Zählt testest beim suchbegriff test als 0, 1 oder 2 matches?

von Kaukas (Gast)


Lesenswert?

Das ist doch maximale Verarsche hier. Beschäftigungstherapue pur.
Kein Beispiel vom TO trotz zig-facher Aufforderung.
Dann der beherzte Einsatz von Md Ma, endlich ein Anschauungsbeispiel zu 
bekommen - und eine vollkommen schwachsinnige Antwort vom TO.
Leute steckt es und macht wieder sinnvolle Arbeit!

von Peter M. (r2d3)


Lesenswert?

Da gibt's ne Software, die heißt xkeyscore, die soll ganz gut sein.
Das Problem bei dieser Software besteht nur darin, gültige 
Download-Links zu finden!

von max707 (Gast)


Lesenswert?

Peter M. schrieb:
> Da gibt's ne Software, die heißt xkeyscore, die soll ganz gut sein.
> Das Problem bei dieser Software besteht nur darin, gültige
> Download-Links zu finden!

:) ;) :)

von max707 (Gast)


Lesenswert?

Md M. schrieb:
> max707 schrieb:
>> Md M. schrieb:
>>> Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die
>>> Zahlen jeweils dahinter
>>>
>>> "test" 1
>>> " test" 0
>>> "test " 0
>>> " test " 0
>>> "testest " 0
>>> " testest" 0
>
> Völlig unlogisch, was du da machen willst. In allen genannten
> Zeichenketten ist die Zeichenkette "test" mindestens einmal vorhanden.

" test " ist doch ungleich "test" ungleich "Test"


Was bitte ist daran so unverständlich?

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

max707 schrieb:
> " test " ist doch ungleich "test" ungleich "Test"
>
> Was bitte ist daran so unverständlich?

Echt jetzt? In der Zeichenkette " test " ist doch wohl die Zeichenkette 
"test" enthalten, oder nicht? Du hast also einen match.

So wird das nichts. Bis du deine Anforderungen präzise dargelegt hast 
oder ein konkretes Beispiel gezeigt hast (nein, das hast du bis jetzt 
beides nicht gemacht), bin ich raus. Dafür ist mir meine Zeit dann doch 
zu schade. Ich frag hier ja auch viel nach Hilfe, weil ich viel nicht 
weiß oder kann, aber ich bemühe mich dann, meinen Helfern so gut wie 
möglich zuzuarbeiten. Du weißt nichtmal, was du eigentlich willst, kein 
Wunder, dass du dein Problem nicht formulieren kannst. Daniel hat dir 
hier schon umfangreichen Code gezeigt und dir indirekt angeboten, dir 
daraus was fertiges zu machen. Am Ende wird er umsonst Zeit investiert 
haben und du behaupten, dass das hier einfach das falsche Forum für 
deine Frage sei.  Was für ein Schlag ins Gesicht.

: Bearbeitet durch User
von Hugo (Gast)


Lesenswert?

Die Software die Du suchst gibt es hier, ist leider nicht Portabel.
http://www.sas.com/de_ch/software/sas9.html

Dafür kann man mit ein paar Klicks perfekte Auswertungen erstellen und 
gespeichert werden können, damit am nächsten Tag die Daten kumuliert 
werden

PS: Eine Kosten-Obergrenze wurde nicht vorgegeben.

von max707 (Gast)


Lesenswert?

Md M. schrieb:
> max707 schrieb:
>> " test " ist doch ungleich "test" ungleich "Test"
>>
>> Was bitte ist daran so unverständlich?
>
> Echt jetzt? In der Zeichenkette " test " ist doch wohl die Zeichenkette
> "test" enthalten, oder nicht? Du hast also einen match.
>
> So wird das nichts. ...

" Test " heißt mit Worten beschrieben: ein Leerzeichen, dann die 
Buchstabenreihe und dann wieder ein Leerzeichen.
In diesem Beispiel " Test " will ich ganz konktet " Test " wieder 
finden.

von Rolf Magnus (Gast)


Lesenswert?

Md M. schrieb:
> Rolf M. schrieb:
>> Md M. schrieb:
>>> Völlig unlogisch, was du da machen willst.
>>
>> Die obige Angabe würde passen, wenn nur dann der Suchbegriff als
>> gefunden gelten soll, wenn der gesamte Inhalt der Datei dem Suchbegriff
>> entspricht.
>
> Der Suchbegriff war "test".

Ja, eben. Und wenn das der gesamte Dateinhalt ist, ist das laut max als 
Match zu werten.

max707 schrieb:
>> Völlig unlogisch, was du da machen willst. In allen genannten
>> Zeichenketten ist die Zeichenkette "test" mindestens einmal vorhanden.
>
> " test " ist doch ungleich "test" ungleich "Test"

Also mit anderen Worten: Wenn der Dateiinhalt also so aussieht
1
 test
dann soll der Suchbegriff "test" dort als nicht gefunden gelten, da 
der Dateiinhalt " test " und eben nicht "test" ist?

> Was bitte ist daran so unverständlich?

Der Sinn dahinter erschließt sich nicht. Ich vermute, das liegt daran, 
dass du es nicht schaffst, zu erklären, was du willst. Und nein, ein 
Tool, das "zeichenketten auswertet" auf vollkommen beliebige Art und 
Weise und das noch ganz einfach ohne Programmierung wirst du nicht 
finden. Du musst also genau spezifizieren, was du willst.

von Kaukas (Gast)


Lesenswert?

Md M. schrieb:
>>> "test" 1
>>> " test" 0
>>> "test " 0
>>> " test " 0
>>> "testest " 0
>>> " testest" 0

Leute, wenn er das so stehen lässt...
Wacht auf, das ist Verarsche pur!

von ms (Gast)


Lesenswert?

Hallo

wie sieht das Ergebnis bei der suche von 2 Strings aus?
1. Suchstring " Test "
2. Suchstring " mal "

Text Datei: " Test mal "
Was wird gefunden 0 1 2 oder 3 (Binär).

ms

von max707 (Gast)


Lesenswert?

Hugo schrieb:
> Die Software die Du suchst gibt es hier, ist leider nicht Portabel.
> http://www.sas.com/de_ch/software/sas9.html
>
> Dafür kann man mit ein paar Klicks perfekte Auswertungen erstellen und
> gespeichert werden können, damit am nächsten Tag die Daten kumuliert
> werden
>
> PS: Eine Kosten-Obergrenze wurde nicht vorgegeben.

OpenStat habe ich mir besorgt und werde damit erst einmal Erfahrungen 
sammeln. R ist mir nur namentlich bekannt.

Das SAS 9.4 läuft nicht auf meinem Rechner, da die Anforderungen an den 
PC nicht erfüllt werden. Schade. Mal sehen...

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Rolf Magnus schrieb:
> Ja, eben. Und wenn das der gesamte Dateinhalt ist, ist das laut max als
> Match zu werten.

Aha. Er hat also maximal einen match pro file. Das heißt aber auch, dass 
seine bis zu 100 Suchstrings jeweils 2MB lang sind, denn so groß sind 
die täglich generierten files. In dem Fall kann man natürlich mit hashes 
arbeiten.

: Bearbeitet durch User
von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Ok, ich glaube ich verstehe. Er sucht (das Monats-Zeug mal unbeachtet) 
quasi

$ cat *.txt |sort |uniq -c

@max:

Ich habe folgende Dateien und dahinter jeweils die Inhalte

1.txt   aaa
2.txt   bbb
3.txt   ccc
4.txt   aaa
5.txt   bbb
6.txt   aaa

Ist das, was du suchst das hier?

3 aaa
2 bbb
1 ccc

: Bearbeitet durch User
von Rolf (Gast)


Lesenswert?

Und jetzt würde mich mal interessieren, ob dabei mit den 
"test"-Beispielen auch nur einmal eine "1" rauskommt:
>> "test" 1
>> " test" 0
>> "test " 0
>> " test " 0
>> "testest " 0
>> " testest" 0

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Rolf schrieb:
> Und jetzt würde mich mal interessieren, ob dabei mit den
> "test"-Beispielen auch nur einmal eine "1" rauskommt:
>>> "test" 1
>>> " test" 0
>>> "test " 0
>>> " test " 0
>>> "testest " 0
>>> " testest" 0

Hehe, ja, das verwirrt mich auch noch ein bisschen. Mir ist auch nicht 
klar, wie man das grafishc darstellen will, denn in einem Balkendiagramm 
würde über jedem Balken eine 2MB lange Zeichenkette stehen. Man könnte 
zwar was in der Art

$ md5sum *.txt |cut -d ' ' -f 1 |sort |uniq -c

machen, aber es fraglich, ob man mit 5c9597f3c8245907ea71a89d9d39d08e 
was anfangen kann.

von Rolf Magnus (Gast)


Lesenswert?

Md M. schrieb:
> Rolf Magnus schrieb:
>> Ja, eben. Und wenn das der gesamte Dateinhalt ist, ist das laut max als
>> Match zu werten.
>
> Aha. Er hat also maximal einen match pro file.

Nun, das klingt zwar etwas unsinning, wäre aber eine mögliche 
Schlussfolgerung aus den bisherigen Angaben.
Die zweite hab ich oben schon genannt. Wenn Leerzeichen niemals als 
Trennzeichen zwischen den zu findenden Zeichenketten stehen, würde es 
das auch erklären. Ich hab aber das Gefühl, dass das auch eigentlich 
nicht das gesuchte ist.
Deshalb bleibe ich bei meiner ganz anderen Deutung: max/Esmeralda kriegt 
es nicht hin, sein/ihr Problem verständlich zu beschreiben.

Md M. schrieb:
> Ok, ich glaube ich verstehe. Er sucht (das Monats-Zeug mal unbeachtet)
> quasi

Das "Monats-Zeug" ist nochmal eine separate Baustelle.

> $ cat *.txt |sort |uniq -c

"useless use of cat". Es reicht sort *.txt |uniq -c

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Rolf Magnus schrieb:
> "useless use of cat". Es reicht sort *.txt |uniq -c

Ja, ich weiß. Ich habs mir aber deshalb angewöhnt, weil manche Kommandos 
den Parameter auch ohne einen eindeutigen schalter wie "-o" als 
Ausgabedatei betrachten. Also quasi um Unfällen vorzubeugen. Ist mir 
leider schon passiert. Ich empfinde es so als cleaner. Eine Marotte von 
mir.

von Daniel A. (daniel-a)


Angehängte Dateien:

Lesenswert?

Jetzt ist mein Such & Zähl Programm in einem brauchbaren Zustand.
1
daniel@colibri:~/projects/matcher$ ./tree-matcher_linux 
2
usage: ./tree-matcher_linux searchfile [mode] < inputfile
3
4
mode = any, word or line. default is any

Verwendung ist einfach, einfach ein File mit einem Suchbegriff pro Zeile 
erstellen, und als searchfile mitgeben. Die Daten die durchsucht werden 
einfach nach stdin leiten. Es gibt 3 Zählmodi, "any" zählt jede 
Übereinstimmung egal wie oder wo. "word" zählt nur matches, die davor 
und danach kein alphanumerisches Zeichen haben. "line" zählt nur ganze 
linien die komplett mit einem Suchbegriff übereinstimmt. Das resultat 
ist eine Liste aus "anzahl suchbegriff".

von max707 (Gast)


Lesenswert?

Oh, vielen Dank, wunderbar... Ich werde es mal austesten. :)

In der Zwischenzeit habe ich grebWin auf meinem PC zum laufen gebracht. 
:)
Das ist ausreichend und damit bin ich schon sehr zufrieden.

Vielen Dank an Alle die versucht haben mir zu helfen. Kanne Bier für 
Alle!

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Daniel A. schrieb:
> Jetzt ist mein Such & Zähl Programm in einem brauchbaren Zustand.

max707 schrieb:
> In der Zwischenzeit habe ich grebWin auf meinem PC zum laufen gebracht.
> Das ist ausreichend und damit bin ich schon sehr zufrieden.

Unfassbar. Lässt andere für sich coden um dann doch nach unzähligen 
Posts die Lösung aus der ersten Antwort anzunehmen.

von Max707 (Gast)


Lesenswert?

Wie bitte?

Dein Posting ist etwas sehr weit daneben. Schäm dich!

Höflichkeit ist halt nicht jedem gegeben!

von Rolf (Gast)


Lesenswert?

Max707 schrieb:
> Wie bitte?
Meinst du das vorige Posting?
>
> Dein Posting ist etwas sehr weit daneben. Schäm dich!
Ich finde es gar nicht daneben, es trifft genau den Kern.
>
> Höflichkeit ist halt nicht jedem gegeben!
Hättest du dich mal dran gehalten.

Kannst ja die Beiträge nochmal durchlesen.
Vielleicht merkst du dann, was gemeint ist.

von Eric B. (beric)


Lesenswert?

max707 schrieb:

    (GrepWin)
> Das ist ausreichend und damit bin ich schon sehr zufrieden.

Das tut aber nicht was du oben gewollt hast:

max707 schrieb:
>> "test" 1
>> " test" 0
>> "test " 0
>> " test " 0
>> "testest " 0
>> " testest" 0

Da wird bei Grep & co immer 1 rauskommen statt 0.

von Md M. (Firma: Potilatormanufaktur) (mdma)


Lesenswert?

Max707 schrieb:
> Höflichkeit ist halt nicht jedem gegeben!

Höflich wäre gewesen, die dir helfenden Leute nicht im Dunkeln tappen zu 
lassen (du hast nichtmal verraten, ob wir zuletzt richtig vermutet 
haben), was genau du möchtest, z.B. mit einem eindeutigen Beispiel. Oder 
Daniel darin zu bremsen, Zeit und Mühe aufzuwenden, um sein Programm für 
dich anzupassen, wenn du mit grep doch absolut zufrieden bist.
Aber sei es drum, schön, dass dein Problem gelöst ist.

: Bearbeitet durch User
von Greppen ist ein Ort (Gast)


Lesenswert?

> max707 schrieb:
>>> "test" 1
>>> " test" 0
>>> "test " 0
>>> " test " 0
>>> "testest " 0
>>> " testest" 0
>
> Da wird bei Grep & co immer 1 rauskommen statt 0.

  Bei der nicht angegebenen Verwendungsart von und zu grep, trifft 
dieser Kommentar... vielleicht... ab und zu.

<code>
$ grep --count '^test$' Datei.txt
</code>
liefert obige Zählergebnisse.

siehe <http://www.gnu.org/software/grep/manual/grep.html>;

von Yalu X. (yalu) (Moderator)


Lesenswert?

max707 schrieb:
> ich möchte Zechenketten nach bestimmten Inhalten auswerten

g457 schrieb:
> bash, grep, wc, vielleicht noch tr oder sed.

max707 schrieb:
> die Auswertungen sollen unter Windows ab XP laufen.

Md M. schrieb:
> Es würde mich wundern, wenn es grep nicht für Windows gäbe.

max707 schrieb:
> Das ist nicht das Thema.

max707 schrieb:
> In der Zwischenzeit habe ich grebWin auf meinem PC zum laufen gebracht.
> :)
> Das ist ausreichend und damit bin ich schon sehr zufrieden.

Ich kann's einfach nicht glauben :D

Aber bevor der Thread sinnloserweise noch einmal eine Schleife über 70
Beiträge dreht, nur um am Ende wieder bei Beitrag 2 zu landen, mache ich
ihn lieber mal zu.

: Bearbeitet durch Moderator
Dieser Beitrag ist gesperrt und kann nicht beantwortet werden.