Hallo Spezis, ich möchte Zechenketten nach bestimmten Inhalten auswerten und die Häufigkeiten derer graphisch darstellen. Diese Zeichketten sind nicht auf ein einziges Kriterium beschränkt. So z.B. xxx, yyy, zzz... Sonderzeichen etc. Diese Zeichenketten liegen als täglich generiertes File vor, z.b. "*.txt". Ich hätte gerne statistische Auswertungen, xxx kommt im Monat so oft vor. Welche Software kann das ohne große Einarbeitung leisten? Eine portable SW wird bevorzugt.
:
Gesperrt durch Moderator
> Welche Software kann das ohne große Einarbeitung leisten? Eine portable > SW wird bevorzugt. bash, grep, wc, vielleicht noch tr oder sed. Viel Einarbeitung benötigt das nicht, weil das eh zum Grundwissen gehört. HTH
Ich bin aber kein Programmierer und die Auswertungen sollen unter Windows ab XP laufen. Also eine simple Lösung wird gesucht. Ich will nur den Speicherort des Files angeben und die Suchkriterien, und als Output will ich eine aussagekräftige Graphik sehen.
BIRT lade ich mir gerade aus dem Netz, ist aber ganz schön umfangreich, so um 300 MB. Falls es dann auch noch installiert werden muß, dann ist es für mich eher nur noch 2. Wahl.
Hallo, wie sieht die txt datei genau aus. Ist es möglich die Datei in *.csv umzubenennen und mit Excel zu öffnen. ms
Ich bin mir nicht mehr sicher, ob ich das schon früher mal gemacht habe. Glaube ja. Zufrieden war ich nicht damit.
Oh weh, das liegt schon soooo lange zurück. Wiki hat mich wieder mal geerdet. Es gibt doch bestimmt schon fertige Lösungen als Freeware.
Hallo, was brauchst du genau? Eine Zeichenkette suchen ist klar. Die Anzahl erfassen ist auch klar. und jetzt? ms
Konkret sind das mehrere Zeichenketten, die Anzahl ist überschaubar. Vielleicht kleiner als 100. Ich will eine graphische Darstellung wie oft bestimme Zeichenketten vorkommen, d.h. z.B.: ZK1 20 mal; ZK2 auch 20 mal... Kommen diese Zeichenketten immer zusammen vor? Vergleiche in bestimmten Zeiträumen sollen möglich sein. So z.B. im Januar, im Februar..., der Februar war aber schlechter als...
Hallo, woher will die Software wissen das es jetzt Feb. ist. Steht da ein Datum am Zeilenanfang?? Der Aufbau einer Zeile als Muster währe nicht schlecht. Oder braucht man sogar eine SQlite? ms
1. - Das Textfile *.txt ist mit einem Datum versehen wann es angelegt wurde. 2. - Im Textfile steht das Datum auch noch.
Hallo, könnte es sein dass das file aus einem ERP-Sytem jeden Tag erstellt wird. Ist es nicht einfacher (sollte es zutreffen) eine SQL Abfrage zu machen und per List u. Label oder vergleichbar Grafisch darzustellen. ms
Welche übereinstimmungskriterien gibt es denn? Müssen per abstand getrennte wörter exact übereinstimmen? Falls ja, gibt es auch satzzeichen? Falls nein, wie müssen überschneidungen gezählt werden? Zählt testest beim suchbegriff test als 0, 1 oder 2 matches? Wie sieht es mit sonderzeichen aus?
max707 schrieb: > Konkret sind das mehrere Zeichenketten, die Anzahl ist überschaubar. > Vielleicht kleiner als 100. > > Ich will eine graphische Darstellung wie oft bestimme Zeichenketten > vorkommen, d.h. z.B.: ZK1 20 mal; ZK2 auch 20 mal... > Kommen diese Zeichenketten immer zusammen vor? > > Vergleiche in bestimmten Zeiträumen sollen möglich sein. So z.B. > im Januar, im Februar..., der Februar war aber schlechter als... Für mich klingt das nach einer einfachen, aber spezifischen Zeichenkettensuche. Welche Software soll diese spezifische Suche durchführen? Mir fällt dazu nichts ein. Ich hätte das in VBA geschrieben. Ordner-Inhalt und alle Dateien abarbeiten, die der Suchspezifikationen entsprechen. Jede Datei öffnen und zeichenweise einlesen und mit ZK1 bis ZK100 abgleichen. Bei Treffern die passende Zählvariablen um 1 erhöhen. Balkengrafik über den Vektor der Zählvariablen legen. Deine Fragestellung > Kommen diese Zeichenketten immer zusammen vor? ist aber ziemlich unscharf beschrieben. Es könnte dann sein, dass man das Problem etwas anders angehen sollte.
Ich habe mal schnell ein kleines tree search Programm in c geschrieben. Es fehlt nurnoch etwas, um die Liste einzulesen, und etwas, um hochzuzälen.
1 | daniel@colibri:~/projects/matcher$ gcc -g -Og -std=c99 -Wall -Wextra -pedantic -Werror tree.c main.c -o tree;./tree |
2 | Entry 0 matched at offset 2 |
3 | Entry 1 matched at offset 7 |
4 | Entry 3 matched at offset 12 |
5 | Entry 3 matched at offset 15 |
6 | Entry 3 matched at offset 18 |
7 | Entry 2 matched at offset 22 |
8 | Entry 0 matched at offset 27 |
9 | Entry 2 matched at offset 30 |
Daniel A. schrieb: > Welche übereinstimmungskriterien gibt es denn? Exakt > Müssen per abstand getrennte wörter exact übereinstimmen? Ja > Falls ja, gibt es auch satzzeichen? Ja > Falls nein, wie müssen überschneidungen gezählt werden? ??? > Zählt testest beim suchbegriff test als 0, 1 oder 2 matches? 0 > Wie sieht es mit sonderzeichen aus? Exakt
Daniel A. schrieb: > Ich habe mal schnell ein kleines tree search Programm in c geschrieben. > Es fehlt nurnoch etwas, um die Liste einzulesen, und etwas, um > hochzuzälen. ... > [/pre] Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne jetzt unendlich viele Programme auszuprobieren
max707 schrieb: > Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne > jetzt unendlich viele Programme auszuprobieren "Nein, meine Suppe ess' ich nicht!" => Nein, meine Zeichenkettensuche programmier' ich nicht! Buchseite 38 im PDF https://www.reclam.de/data/blickinsbuch/978-3-15-018569-8.pdf Und wenn er nicht gestorben ist, dann wartet er noch heute. Wann kommt denn nun sein Ober mit dem silbernen Tablett und der Software, die auf Anhieb funktioniert?!
Dieses Unterforum: PC-Programmierung ist wohl der falsche Ort für meine Frage.
max707 schrieb: > Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne > jetzt unendlich viele Programme auszuprobieren Klingt nach Verarschung. Du hoffst echt, dass es ein Programm gibt, das ein absolut spezifisches Problem, welches möglicherweise nie zuvor jemand hatte, lösen kann? Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund gegeben: Beitrag "Re: Zeichenketten auswerten" Beitrag "Re: Zeichenketten auswerten" Es würde mich wundern, wenn es grep nicht für Windows gäbe. Und wenn du schon nicht in der Lage bist, deine Anforderungen z.B. mit einem regulären Ausdruck zu präzisieren (nein, aus dem, was du geschrieben hast geht eben nicht genau hervor, was du willst), dann stelle doch zumindest als Beispiel ein abgespecktes file hier rein und erkläre, was du für eine Ausgabe erwarten würdest. Bis dahin schließe ich mich Beitrag "Re: Zeichenketten auswerten" an.
Noch eine Frage, sind die Zeichenketten und die Inhalte, mit denen diese verglichen werden, die selben, oder unterschiedliche?
In dem (den) txt file(s) ist eine sehr wichtige Information enthalten, die durchaus auch öfter vorkommen kann. Ich will wissen wie oft, wenn die Zeitspanne die überprüft werden soll ein Monat ist, dann die Anzahl der Übereinstimmungen pro Monat. Sehr wichtig für mich ist die Anforderung, daß mehrere Suchstrings eingegeben werden können.
Md M. schrieb: > max707 schrieb: >> Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne >> jetzt unendlich viele Programme auszuprobieren > > Klingt nach Verarschung. Du hoffst echt, dass es ein Programm gibt, das > ein absolut spezifisches Problem, welches möglicherweise nie zuvor > jemand hatte, lösen kann? Wieso? > > Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund > gegeben: > ... > > Es würde mich wundern, wenn es grep nicht für Windows gäbe. Das ist nicht das Thema. > > Und wenn du schon nicht in der Lage bist, deine Anforderungen z.B. mit > einem regulären Ausdruck zu präzisieren (nein, aus dem, was du > geschrieben hast geht eben nicht genau hervor, was du willst), dann > stelle doch zumindest als Beispiel ein abgespecktes file hier rein und > erkläre, was du für eine Ausgabe erwarten würdest. > Was im Textfile steht ist für die Lösung völlig irrelevant! Ich will die Zeichenkette auswerten. Punkt.
Und wieso hast du statt eines weiteren nichtssagenden Textes nicht einfach ein Beispiel hier reingestellt, wie ich vorgeschlagen habe? > In dem (den) txt file(s) ist eine sehr wichtige Information enthalten, Interessiert kein Schwein. > die durchaus auch öfter vorkommen kann. > Ich will wissen wie oft, wenn die Zeitspanne die überprüft werden soll > ein Monat ist, dann die Anzahl der Übereinstimmungen pro Monat. Ja, das hast du schon erwähnt. > Sehr wichtig für mich ist die Anforderung, daß mehrere Suchstrings > eingegeben werden können. Ja, auch das hast du schon erwähnt.
max707 schrieb: > Das ist nicht das Thema. max707 schrieb: > für die Lösung völlig irrelevant! max707 schrieb: > Punkt. Ich hab das Gefühl, der Max will mit allen Mitteln verhindern, daß ihm jemand hilft...
Wie kommst Du denn darauf? Die Frage war doch eindeutig genug gestellt, oder etwa nicht?
max707 schrieb: > Md M. schrieb: >> max707 schrieb: >>> Ich will nicht programmieren, sondern ein gee9ignetes Programm ohne >>> jetzt unendlich viele Programme auszuprobieren >> >> Klingt nach Verarschung. Du hoffst echt, dass es ein Programm gibt, das >> ein absolut spezifisches Problem, welches möglicherweise nie zuvor >> jemand hatte, lösen kann? > > Wieso? Wieso du das hoffst, weiß ich nicht. >> Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund >> gegeben: >> ... >> >> Es würde mich wundern, wenn es grep nicht für Windows gäbe. > Das ist nicht das Thema. Doch. Du wolltest einen Weg wissen, wie du Zeichenketten in einer Textdatei finden und zählen kannst. Dein Thema ist Regex, grep ist eine naheliegende und simple Lösung, die auch unter XP funktioniert. Das war genau das, wonach du gefragt hast, also ist das sehr wohl das Thema >> Und wenn du schon nicht in der Lage bist, deine Anforderungen z.B. mit >> einem regulären Ausdruck zu präzisieren (nein, aus dem, was du >> geschrieben hast geht eben nicht genau hervor, was du willst), dann >> stelle doch zumindest als Beispiel ein abgespecktes file hier rein und >> erkläre, was du für eine Ausgabe erwarten würdest. >> > Was im Textfile steht ist für die Lösung völlig irrelevant! Ich will die > Zeichenkette auswerten. Punkt. Ja, was da drin steht ist irrelevant, weshalb auch unverständlich ist, warum du erwähnst, wie wichtig die Daten sind. Zeig doch einfach ein kurzes Beispiel mit Phantasie-Daten, das kann doch nicht so schwer sein.
max707 schrieb: > Die Frage war doch eindeutig genug gestellt, oder etwa nicht? Eben nicht. Eindeutig wär ein regulärer Ausdruck. Dass du damit offensichtlich nichts anfangen kannst ist ja keine Schande. Aber mit > Diese Zeichketten sind nicht auf ein einziges Kriterium beschränkt. So > z.B. xxx, yyy, zzz... Sonderzeichen etc. kann niemand was anfangen. Deshalb hatte ich um ein Beispiel gebeten.
Md M. schrieb: > max707 schrieb: >> Md M. schrieb: >>> max707 schrieb: ... > >>> Nochmal mit Nachdruck, denn diese Tips wuden dir nicht ohne Grund >>> gegeben: >>> ... >>> >>> Es würde mich wundern, wenn es grep nicht für Windows gäbe. >> Das ist nicht das Thema. > > Doch. Du wolltest einen Weg wissen, wie du Zeichenketten in einer > Textdatei finden und zählen kannst. Dein Thema ist Regex, grep ist eine > naheliegende und simple Lösung, ... > Der Tip mit grep und Regex ist schon mal nicht schlecht, so meine Recherchen dazu. Sie erfüllen aber nicht direkt meine Anforderungen. ... > > Zeig doch einfach ein kurzes Beispiel mit Phantasie-Daten, das kann doch > nicht so schwer sein. Doch ist es im Moment, da mir die Daten nicht gehören. Irgendo in meinen Rechnern habe ich vielleicht noch Daten, die ich erst noch modifizieren muss um sie zeigen zu können. Die Files sind schon umfangreich.
max707 schrieb: >> Zeig doch einfach ein kurzes Beispiel mit Phantasie-Daten, das kann doch >> nicht so schwer sein. > Doch ist es im Moment, da mir die Daten nicht gehören. Irgendo in meinen > Rechnern habe ich vielleicht noch Daten, die ich erst noch modifizieren > muss um sie zeigen zu können. Die Files sind schon umfangreich. Meine Fresse... Ich will auch nicht, dass du hier Kontonummern hinschreibst. Aber ein einfaches Beispiel nach dem Prinzip: Ich habe die Zeichenkette "aaabbbcccddd" Ich möchte wissen wie oft die Zeichenketten "aa" "aab" "ab" "c" vorkommen. sollte doch wohl drin sein. Wenn du dann dahinter deine Erwartungswerte, also konkrete Zahlen schreiben würdest, wüsste jeder, wonach du suchst. Wenn dann doch Ungenaugigkeiten zurückbleiben, könnte dir jemand ein Gegenbeispiel hinschreiben und dich fragen, welche Zahlen du erwarten würdest.
Das hatte ich bereits angegeben: siehe testest mit test = "0" siehe hier: Beitrag "Re: Zeichenketten auswerten"
max707 schrieb: > Das hatte ich bereits angegeben: siehe testest mit test = "0" > siehe hier: Beitrag "Re: Zeichenketten auswerten" Da sehe ich kein einziges Beispiel. (?)
Ich glaube ich verstehe langsam, wonach der TO sucht. Ich habe mein suchprogramm angepasst, damit es jetzt wörter oder wörterketten vergleicht. Nächsten Mittwoch oder so mache ich dann einlesen von files, auswertung und Benutzerinterface. Für mich hört sich das so an, als ob der TO gewönhliche Textdokument mit gewönlichen Texten hat, wie man sie z.B. beim mitschneiden von IRC konversationen bekommt, und darin nach Wörtern oder Wortfolgen suchen will, um auszuwerten wie häufig diese vorkamen etc.
Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die Zahlen jeweils dahinter "test" " test" "test " " test " "testest " " testest"
Md M. schrieb: > Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die > Zahlen jeweils dahinter > > "test" 1 > " test" 0 > "test " 0 > " test " 0 > "testest " 0 > " testest" 0
Daniel A. schrieb: > Für mich hört sich das so an, als ob > der TO gewönhliche Textdokument mit gewönlichen Texten hat, wie man sie > z.B. beim mitschneiden von IRC konversationen bekommt, und darin nach > Wörtern oder Wortfolgen suchen will, um auszuwerten wie häufig diese > vorkamen etc. Ich habe ihn so verstanden, daß alle Begriffe untereinander stehen. Das sind nun ganz verschiedene Meinungen, welche ist richtig? Und ist überhaupt eine von beiden richtig?
Daniel A. schrieb: > Ich habe mein > suchprogramm angepasst, damit es jetzt wörter oder wörterketten > vergleicht. Nächsten Mittwoch oder so mache ich dann einlesen von files, > auswertung und Benutzerinterface. Echt supernett von dir, aber bitte such mal nach anderen Beiträgen in anderen threads von ihm/ihr und überlege dir, ob du das wirklich machen möchtest. Er/sie spekuliert drauf, dass andere ihm/ihr fertige Lösungen präsentieren.
:
Bearbeitet durch User
max707 schrieb: > Md M. schrieb: >> Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die >> Zahlen jeweils dahinter >> >> "test" 1 >> " test" 0 >> "test " 0 >> " test " 0 >> "testest " 0 >> " testest" 0 Völlig unlogisch, was du da machen willst. In allen genannten Zeichenketten ist die Zeichenkette "test" mindestens einmal vorhanden.
Md M. schrieb: > Völlig unlogisch, was du da machen willst. Die obige Angabe würde passen, wenn nur dann der Suchbegriff als gefunden gelten soll, wenn der gesamte Inhalt der Datei dem Suchbegriff entspricht. Vielleicht werden die Wörter auch nicht mit Leerzeichen getrennt, sondern mit irgendeinem anderen Zeichen. Man könnte jetzt ein schönes Ratespielchen daraus machen, die gewünschte Struktur rauszufinden.
Rolf M. schrieb: > Md M. schrieb: >> Völlig unlogisch, was du da machen willst. > > Die obige Angabe würde passen, wenn nur dann der Suchbegriff als > gefunden gelten soll, wenn der gesamte Inhalt der Datei dem Suchbegriff > entspricht. Der Suchbegriff war "test". Daniel A. schrieb: > Zählt testest beim suchbegriff test als 0, 1 oder 2 matches?
Das ist doch maximale Verarsche hier. Beschäftigungstherapue pur. Kein Beispiel vom TO trotz zig-facher Aufforderung. Dann der beherzte Einsatz von Md Ma, endlich ein Anschauungsbeispiel zu bekommen - und eine vollkommen schwachsinnige Antwort vom TO. Leute steckt es und macht wieder sinnvolle Arbeit!
Da gibt's ne Software, die heißt xkeyscore, die soll ganz gut sein. Das Problem bei dieser Software besteht nur darin, gültige Download-Links zu finden!
Peter M. schrieb: > Da gibt's ne Software, die heißt xkeyscore, die soll ganz gut sein. > Das Problem bei dieser Software besteht nur darin, gültige > Download-Links zu finden! :) ;) :)
Md M. schrieb: > max707 schrieb: >> Md M. schrieb: >>> Und wie sieht es bei folgenden Zeichenketten aus? Schreibe mal bitte die >>> Zahlen jeweils dahinter >>> >>> "test" 1 >>> " test" 0 >>> "test " 0 >>> " test " 0 >>> "testest " 0 >>> " testest" 0 > > Völlig unlogisch, was du da machen willst. In allen genannten > Zeichenketten ist die Zeichenkette "test" mindestens einmal vorhanden. " test " ist doch ungleich "test" ungleich "Test" Was bitte ist daran so unverständlich?
max707 schrieb: > " test " ist doch ungleich "test" ungleich "Test" > > Was bitte ist daran so unverständlich? Echt jetzt? In der Zeichenkette " test " ist doch wohl die Zeichenkette "test" enthalten, oder nicht? Du hast also einen match. So wird das nichts. Bis du deine Anforderungen präzise dargelegt hast oder ein konkretes Beispiel gezeigt hast (nein, das hast du bis jetzt beides nicht gemacht), bin ich raus. Dafür ist mir meine Zeit dann doch zu schade. Ich frag hier ja auch viel nach Hilfe, weil ich viel nicht weiß oder kann, aber ich bemühe mich dann, meinen Helfern so gut wie möglich zuzuarbeiten. Du weißt nichtmal, was du eigentlich willst, kein Wunder, dass du dein Problem nicht formulieren kannst. Daniel hat dir hier schon umfangreichen Code gezeigt und dir indirekt angeboten, dir daraus was fertiges zu machen. Am Ende wird er umsonst Zeit investiert haben und du behaupten, dass das hier einfach das falsche Forum für deine Frage sei. Was für ein Schlag ins Gesicht.
:
Bearbeitet durch User
Die Software die Du suchst gibt es hier, ist leider nicht Portabel. http://www.sas.com/de_ch/software/sas9.html Dafür kann man mit ein paar Klicks perfekte Auswertungen erstellen und gespeichert werden können, damit am nächsten Tag die Daten kumuliert werden PS: Eine Kosten-Obergrenze wurde nicht vorgegeben.
Md M. schrieb: > max707 schrieb: >> " test " ist doch ungleich "test" ungleich "Test" >> >> Was bitte ist daran so unverständlich? > > Echt jetzt? In der Zeichenkette " test " ist doch wohl die Zeichenkette > "test" enthalten, oder nicht? Du hast also einen match. > > So wird das nichts. ... " Test " heißt mit Worten beschrieben: ein Leerzeichen, dann die Buchstabenreihe und dann wieder ein Leerzeichen. In diesem Beispiel " Test " will ich ganz konktet " Test " wieder finden.
Md M. schrieb: > Rolf M. schrieb: >> Md M. schrieb: >>> Völlig unlogisch, was du da machen willst. >> >> Die obige Angabe würde passen, wenn nur dann der Suchbegriff als >> gefunden gelten soll, wenn der gesamte Inhalt der Datei dem Suchbegriff >> entspricht. > > Der Suchbegriff war "test". Ja, eben. Und wenn das der gesamte Dateinhalt ist, ist das laut max als Match zu werten. max707 schrieb: >> Völlig unlogisch, was du da machen willst. In allen genannten >> Zeichenketten ist die Zeichenkette "test" mindestens einmal vorhanden. > > " test " ist doch ungleich "test" ungleich "Test" Also mit anderen Worten: Wenn der Dateiinhalt also so aussieht
1 | test |
dann soll der Suchbegriff "test" dort als nicht gefunden gelten, da
der Dateiinhalt " test " und eben nicht "test" ist?
> Was bitte ist daran so unverständlich?
Der Sinn dahinter erschließt sich nicht. Ich vermute, das liegt daran,
dass du es nicht schaffst, zu erklären, was du willst. Und nein, ein
Tool, das "zeichenketten auswertet" auf vollkommen beliebige Art und
Weise und das noch ganz einfach ohne Programmierung wirst du nicht
finden. Du musst also genau spezifizieren, was du willst.
Md M. schrieb: >>> "test" 1 >>> " test" 0 >>> "test " 0 >>> " test " 0 >>> "testest " 0 >>> " testest" 0 Leute, wenn er das so stehen lässt... Wacht auf, das ist Verarsche pur!
Hallo wie sieht das Ergebnis bei der suche von 2 Strings aus? 1. Suchstring " Test " 2. Suchstring " mal " Text Datei: " Test mal " Was wird gefunden 0 1 2 oder 3 (Binär). ms
Hugo schrieb: > Die Software die Du suchst gibt es hier, ist leider nicht Portabel. > http://www.sas.com/de_ch/software/sas9.html > > Dafür kann man mit ein paar Klicks perfekte Auswertungen erstellen und > gespeichert werden können, damit am nächsten Tag die Daten kumuliert > werden > > PS: Eine Kosten-Obergrenze wurde nicht vorgegeben. OpenStat habe ich mir besorgt und werde damit erst einmal Erfahrungen sammeln. R ist mir nur namentlich bekannt. Das SAS 9.4 läuft nicht auf meinem Rechner, da die Anforderungen an den PC nicht erfüllt werden. Schade. Mal sehen...
Rolf Magnus schrieb: > Ja, eben. Und wenn das der gesamte Dateinhalt ist, ist das laut max als > Match zu werten. Aha. Er hat also maximal einen match pro file. Das heißt aber auch, dass seine bis zu 100 Suchstrings jeweils 2MB lang sind, denn so groß sind die täglich generierten files. In dem Fall kann man natürlich mit hashes arbeiten.
:
Bearbeitet durch User
Ok, ich glaube ich verstehe. Er sucht (das Monats-Zeug mal unbeachtet) quasi $ cat *.txt |sort |uniq -c @max: Ich habe folgende Dateien und dahinter jeweils die Inhalte 1.txt aaa 2.txt bbb 3.txt ccc 4.txt aaa 5.txt bbb 6.txt aaa Ist das, was du suchst das hier? 3 aaa 2 bbb 1 ccc
:
Bearbeitet durch User
Und jetzt würde mich mal interessieren, ob dabei mit den "test"-Beispielen auch nur einmal eine "1" rauskommt: >> "test" 1 >> " test" 0 >> "test " 0 >> " test " 0 >> "testest " 0 >> " testest" 0
Rolf schrieb: > Und jetzt würde mich mal interessieren, ob dabei mit den > "test"-Beispielen auch nur einmal eine "1" rauskommt: >>> "test" 1 >>> " test" 0 >>> "test " 0 >>> " test " 0 >>> "testest " 0 >>> " testest" 0 Hehe, ja, das verwirrt mich auch noch ein bisschen. Mir ist auch nicht klar, wie man das grafishc darstellen will, denn in einem Balkendiagramm würde über jedem Balken eine 2MB lange Zeichenkette stehen. Man könnte zwar was in der Art $ md5sum *.txt |cut -d ' ' -f 1 |sort |uniq -c machen, aber es fraglich, ob man mit 5c9597f3c8245907ea71a89d9d39d08e was anfangen kann.
Md M. schrieb: > Rolf Magnus schrieb: >> Ja, eben. Und wenn das der gesamte Dateinhalt ist, ist das laut max als >> Match zu werten. > > Aha. Er hat also maximal einen match pro file. Nun, das klingt zwar etwas unsinning, wäre aber eine mögliche Schlussfolgerung aus den bisherigen Angaben. Die zweite hab ich oben schon genannt. Wenn Leerzeichen niemals als Trennzeichen zwischen den zu findenden Zeichenketten stehen, würde es das auch erklären. Ich hab aber das Gefühl, dass das auch eigentlich nicht das gesuchte ist. Deshalb bleibe ich bei meiner ganz anderen Deutung: max/Esmeralda kriegt es nicht hin, sein/ihr Problem verständlich zu beschreiben. Md M. schrieb: > Ok, ich glaube ich verstehe. Er sucht (das Monats-Zeug mal unbeachtet) > quasi Das "Monats-Zeug" ist nochmal eine separate Baustelle. > $ cat *.txt |sort |uniq -c "useless use of cat". Es reicht sort *.txt |uniq -c
Rolf Magnus schrieb: > "useless use of cat". Es reicht sort *.txt |uniq -c Ja, ich weiß. Ich habs mir aber deshalb angewöhnt, weil manche Kommandos den Parameter auch ohne einen eindeutigen schalter wie "-o" als Ausgabedatei betrachten. Also quasi um Unfällen vorzubeugen. Ist mir leider schon passiert. Ich empfinde es so als cleaner. Eine Marotte von mir.
Jetzt ist mein Such & Zähl Programm in einem brauchbaren Zustand.
1 | daniel@colibri:~/projects/matcher$ ./tree-matcher_linux |
2 | usage: ./tree-matcher_linux searchfile [mode] < inputfile |
3 | |
4 | mode = any, word or line. default is any |
Verwendung ist einfach, einfach ein File mit einem Suchbegriff pro Zeile erstellen, und als searchfile mitgeben. Die Daten die durchsucht werden einfach nach stdin leiten. Es gibt 3 Zählmodi, "any" zählt jede Übereinstimmung egal wie oder wo. "word" zählt nur matches, die davor und danach kein alphanumerisches Zeichen haben. "line" zählt nur ganze linien die komplett mit einem Suchbegriff übereinstimmt. Das resultat ist eine Liste aus "anzahl suchbegriff".
Oh, vielen Dank, wunderbar... Ich werde es mal austesten. :) In der Zwischenzeit habe ich grebWin auf meinem PC zum laufen gebracht. :) Das ist ausreichend und damit bin ich schon sehr zufrieden. Vielen Dank an Alle die versucht haben mir zu helfen. Kanne Bier für Alle!
Daniel A. schrieb: > Jetzt ist mein Such & Zähl Programm in einem brauchbaren Zustand. max707 schrieb: > In der Zwischenzeit habe ich grebWin auf meinem PC zum laufen gebracht. > Das ist ausreichend und damit bin ich schon sehr zufrieden. Unfassbar. Lässt andere für sich coden um dann doch nach unzähligen Posts die Lösung aus der ersten Antwort anzunehmen.
Wie bitte? Dein Posting ist etwas sehr weit daneben. Schäm dich! Höflichkeit ist halt nicht jedem gegeben!
Max707 schrieb: > Wie bitte? Meinst du das vorige Posting? > > Dein Posting ist etwas sehr weit daneben. Schäm dich! Ich finde es gar nicht daneben, es trifft genau den Kern. > > Höflichkeit ist halt nicht jedem gegeben! Hättest du dich mal dran gehalten. Kannst ja die Beiträge nochmal durchlesen. Vielleicht merkst du dann, was gemeint ist.
max707 schrieb: (GrepWin) > Das ist ausreichend und damit bin ich schon sehr zufrieden. Das tut aber nicht was du oben gewollt hast: max707 schrieb: >> "test" 1 >> " test" 0 >> "test " 0 >> " test " 0 >> "testest " 0 >> " testest" 0 Da wird bei Grep & co immer 1 rauskommen statt 0.
Max707 schrieb: > Höflichkeit ist halt nicht jedem gegeben! Höflich wäre gewesen, die dir helfenden Leute nicht im Dunkeln tappen zu lassen (du hast nichtmal verraten, ob wir zuletzt richtig vermutet haben), was genau du möchtest, z.B. mit einem eindeutigen Beispiel. Oder Daniel darin zu bremsen, Zeit und Mühe aufzuwenden, um sein Programm für dich anzupassen, wenn du mit grep doch absolut zufrieden bist. Aber sei es drum, schön, dass dein Problem gelöst ist.
:
Bearbeitet durch User
> max707 schrieb: >>> "test" 1 >>> " test" 0 >>> "test " 0 >>> " test " 0 >>> "testest " 0 >>> " testest" 0 > > Da wird bei Grep & co immer 1 rauskommen statt 0. Bei der nicht angegebenen Verwendungsart von und zu grep, trifft dieser Kommentar... vielleicht... ab und zu. <code> $ grep --count '^test$' Datei.txt </code> liefert obige Zählergebnisse. siehe <http://www.gnu.org/software/grep/manual/grep.html>
max707 schrieb: > ich möchte Zechenketten nach bestimmten Inhalten auswerten g457 schrieb: > bash, grep, wc, vielleicht noch tr oder sed. max707 schrieb: > die Auswertungen sollen unter Windows ab XP laufen. Md M. schrieb: > Es würde mich wundern, wenn es grep nicht für Windows gäbe. max707 schrieb: > Das ist nicht das Thema. max707 schrieb: > In der Zwischenzeit habe ich grebWin auf meinem PC zum laufen gebracht. > :) > Das ist ausreichend und damit bin ich schon sehr zufrieden. Ich kann's einfach nicht glauben :D Aber bevor der Thread sinnloserweise noch einmal eine Schleife über 70 Beiträge dreht, nur um am Ende wieder bei Beitrag 2 zu landen, mache ich ihn lieber mal zu.
:
Bearbeitet durch Moderator