String herausfiltern unbeachtet Groß- und Kleinschreibung

von Sandra (Gast)

01.05.2014 22:22

Lesenswert?

•

Hallo,

ich nutze eine Funktion die heißt StringFind und ist wie folgt 
definiert:

int  StringFind(
   string  string_value,        // string in which search is made
   string  match_substring,     // what is searched
   int     start_pos=0          // from what position search starts

Nun möchte ich automatisiert ein Textfile nach einem bestimmten String 
durchsuchen z.B. "Tigerente", dabei soll aber auch "tIgerEnte" oder 
"tiGERente" gefunden werden.

Gibt es eine Möglichkeit, wie ich nach einem bestimmten String suchen 
kann, aber dabei die Groß-/Kleinschreibung der einzelnen Buchstaben 
nicht berücksichtigen brauche?

Mit ist schon klar wie ich ein einzelnes Zeichen von Groß- in 
Kleinschreibung umwandeln kann, aber wie ich einen String suche, von dem 
ich noch nichtmal weiß, wo die Buchstaben groß/kleingeschrieben sind, 
weiß ich nicht.

Mir fällt hier nur folgendes ein (kann ich gerade nicht 
programmierteschnisch umschreiben):

int SeachString(string string_value, string match_substring, int start_pos)
   if(1.Buchstabe von match_substring gross ODER klein gefunden)
     merke die position = pos dieses Buchstaben
     if(2.Buchstabe von match_substring gross ODER klein gefunden)
         if(3.Buchstabe von match_substring gross ODER klein gefunden)
              if(x.Buchstabe von match_substring gross ODER klein gefunden)
                   return(pos+x);
     return(-1); 

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Rolf Magnus (Gast)

01.05.2014 22:34

Lesenswert?

•

▲
▼

Ist die Programmiersprache, in der das geschrieben ist, geheim?
Ansonsten wäre eine einfache Lösung, beide Strings z.B. komplett in 
Großbuchstaben zu konvertieren und dann erst die Suche machen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Daniel A. (daniel-a)

02.05.2014 00:14

Lesenswert?

•

▲
▼

Rolf Magnus schrieb:
> Ist die Programmiersprache, in der das geschrieben ist, geheim?

Scheint eine mischung aus c++ und pseudocode zu sein, mit

using namespace std;

 :( und

1	#include<string>


> Ansonsten wäre eine einfache Lösung, beide Strings z.B. komplett in
> Großbuchstaben zu konvertieren und dann erst die Suche machen.

Finde ich inperformant, und unschön. Ich würde eine Vergleichsfunktion 
übergeben.

Ungetestet:

int16_t compareFunc1(char a,char b){return (int16_t)a-b;}
int16_t compareFunc2(char a,char b){
 if(a>='A'&&a<='Z') a=a-'A'+'a';
 if(b>='A'&&b<='Z') b=b-'A'+'a';
 return (int16_t)a-b;
size_t findString(const std::string s,const std::string w,const size_t b,int16_t(*f)(char,char)){
  size_t n=s.size(),l=w.size();
  for(;b+l<n;b++){
    size_t i;
    for(i=0;l<i;i++){
      if(f(s[b+i],w[i])) break;
    if(i==l) break;
  if(b+l<n)
    return b;
    return n;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Max H. (hartl192)

02.05.2014 00:19

Lesenswert?

•

▲
▼

In ASCII unterscheiden sich Groß- und Kleinbuchstaben nur durch ein 
bit...
Ein bitweises OR mit 0b00100000 mach aus jedem Zeichen einen 
Kleinbuchstaben.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von K. H. (hegy)

02.05.2014 03:10

Lesenswert?

•

▲
▼

Klikk it: 
http://stackoverflow.com/questions/3152241/case-insensitive-stdstring-find

Oder in kompakter mit der Boost-Library:
http://stackoverflow.com/questions/4943770/case-insensitive-stringfind

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Mike (Gast)

02.05.2014 05:50

Lesenswert?

•

▲
▼

Hierzu gibt es in C bereits Funktionen:
http://gd.tuwien.ac.at/languages/c/cref-mleslie/master_index.html

Zuerst beide Strings in Kleinbuchsstaben umwandeln:
=> tolower function. Convert an uppercase character to lowercase.

Und dann den Substring suchen
=> strstr function. Search a string for a substring.
oder mit
=> strtok function. this function splits a string into tokens.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Daniel A. (daniel-a)

02.05.2014 08:05

Lesenswert?

•

▲
▼

Getestet:

#include<stdint.h>
#include<string>
#include<iostream>
int16_t compareFunc1(char a,char b){return (int16_t)a-b;}
int16_t compareFunc2(char a,char b){
 if(a>='A'&&a<='Z') a=a-'A'+'a';
 if(b>='A'&&b<='Z') b=b-'A'+'a';
 return (int16_t)a-b;
size_t findString(const std::string s,const std::string w,size_t b,int16_t(*f)(char,char)){
  size_t n=s.size(),l=w.size();
  for(;b+l<=n;b++){
    size_t i;
    for(i=0;i<l;i++){
      if((*f)(s[b+i],w[i])) break;
    if(i==l) break;
  if(l+b<=n)
    return b;
    return n;
int main(){
  size_t p;
  std::string str("Abc eFg eFg ijK");
  p = findString(str,"aBc",0,compareFunc2);
  if(str.size()-p)
    std::cout << p << std::endl;
    std::cout << "Not found" << std::endl;
  p = findString(str,"efG",0,compareFunc2);
  if(str.size()-p)
    std::cout << p << std::endl;
    std::cout << "Not found" << std::endl;
  p = findString(str,"Efg",5,compareFunc2);
  if(str.size()-p)
    std::cout << p << std::endl;
    std::cout << "Not found" << std::endl;
  p = findString(str,"Ijk",0,compareFunc2);
  if(str.size()-p)
    std::cout << p << std::endl;
    std::cout << "Not found" << std::endl;
  p = findString(str,"xyz",0,compareFunc2);
  if(str.size()-p)
    std::cout << p << std::endl;
    std::cout << "Not found" << std::endl;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Jens G. (jensig)

02.05.2014 11:41

Lesenswert?

•

▲
▼

@Max H. (hartl192)

>In ASCII unterscheiden sich Groß- und Kleinbuchstaben nur durch ein
>bit...
>Ein bitweises OR mit 0b00100000 mach aus jedem Zeichen einen
>Kleinbuchstaben.

Ein String besteht aber nicht nur aus Buchstaben, erst recht nicht nur 
aus Großbuchstaben. Du müsstest als jedes Zeichen prüfen, ob es sich so 
in klein wandeln liese.
Da kannst Du gleich tolower nehmen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Rolf Magnus (Gast)

02.05.2014 23:19

Lesenswert?

•

▲
▼

Außerdem sind Umlaute auch Buchstaben, aber nicht Teil von ASCII.

Daniel A. schrieb:
>> Ansonsten wäre eine einfache Lösung, beide Strings z.B. komplett in
>> Großbuchstaben zu konvertieren und dann erst die Suche machen.
>
> Finde ich inperformant, und unschön. Ich würde eine Vergleichsfunktion
> übergeben.

Wenn man dann schon C++ hat, bietet sich an, ein Template draus zu 
machen, gerade auch für die Performance.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Georg (Gast)

03.05.2014 02:46

Lesenswert?

•

▲
▼

Rolf Magnus schrieb:
> Außerdem sind Umlaute auch Buchstaben, aber nicht Teil von ASCII.

Und noch schöner: mein Liebling das 'ß', wie in Grossbuchstaben?

Beispiele die nur in USA funktionieren sind praktisch völlig wertlos.

Georg

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Rolf Magnus (Gast)

03.05.2014 09:08

Lesenswert?

•

▲
▼

Georg schrieb:
> Rolf Magnus schrieb:
>> Außerdem sind Umlaute auch Buchstaben, aber nicht Teil von ASCII.
>
> Und noch schöner: mein Liebling das 'ß', wie in Grossbuchstaben?

Da gibt's ja immerhin noch die Möglichgkeit einer Sonderbehandlung, 
indem man halt zwei Zeichen draus macht. Aber spätestens umgekehrt ist 
man dann aufgeschmissen (MASSE -> masse oder maße?).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Heinz B. (Firma: Privat) (hbrill)

03.05.2014 10:39

Lesenswert?

•

▲
▼

Das wäre doch ein klassischer Fall für
Reguläre Ausdrücke (RegEx - lib).
Gibt es sowas nicht für C/C++ ?
In meiner Sprache würde das so aussehen :
Print Match$("(?i)Tigerente*[A-Za-z0-9]{1,}", "Ich habe eine tIGerEntE 
zu Hause")

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Kaj (Gast)

03.05.2014 11:12

Angehängte Dateien:

find_tigerente.py (378 Bytes) | Codeansicht
test.txt (127 Bytes)

tigerente.PNG
1,1 KB

Lesenswert?

•

▲
▼

Georg schrieb:
> Beispiele die nur in USA funktionieren sind praktisch völlig wertlos.
Da stimme ich zu.

Rolf Magnus schrieb:
> Georg schrieb:
>> Rolf Magnus schrieb:
>>> Außerdem sind Umlaute auch Buchstaben, aber nicht Teil von ASCII.
>>
>> Und noch schöner: mein Liebling das 'ß', wie in Grossbuchstaben?
>
> Da gibt's ja immerhin noch die Möglichgkeit einer Sonderbehandlung
ja... und was machst du mit allen anderen "Sonderbuchstaben"?
É È ô à usw. ? Allein für den "latin_1"-Bereich gibt es mind. 70 solcher 
"Sonderbuchstaben". Die sind nicht Teil von ASCII... wie viele 
sonderbehandlungen willst du machen?

Daniel A. schrieb:
> Finde ich inperformant, und unschön.
So, du "findest" das es unperformant ist... ich "finde" auch das unsere 
regierung unperformant und unschön ist, aber dieses "empfinden" 
interessiert nicht! Ist es unperformant, oder nicht? Hast du das mal 
getestet? Und was gilt denn als "unperformant"? Da hast du ja bestimmt 
auch mal Zahlenwerte um das vergleichen zu können.

Und warum etwas neu erfinden, was es in den std. libs gibt? Die 
entsprechenden Funktionen sind mit sicherheit nicht in den std. libs 
gelandet, weil sie so super unperformant sind...


An den TO:
Wenn du nicht dazu gezwungen bist C oder C++ zu verwenden, dann nimm 
Python für sowas. Da ist die Stringhandhabung um ein vielfaches 
einfacher als in C oder C++.

# Funktioniert mit Python 2.7 und Python 3.x
MyString = "Hallo liebes Mikrocontroller.net-Forum"
StringToFind = "Bes mIkrO"
IsFound = False
if(StringToFind.lower() in MyString.lower()):
  IsFound = True
print(IsFound)


Heinz Brill schrieb:
> Das wäre doch ein klassischer Fall für
> Reguläre Ausdrücke (RegEx - lib).
Nicht böse gemeint, aber:
"Some people, when confronted with a problem, think: 'I know, I'll use 
regular expressions.' Now they have two problems." - Jamie W. Zawinski
:P
Aber ja, RegEx wäre auch eine Möglichkeit.

Sandra schrieb:
> Nun möchte ich automatisiert ein Textfile nach einem bestimmten String
> durchsuchen z.B. "Tigerente", dabei soll aber auch "tIgerEnte" oder
> "tiGERente" gefunden werden.

Das folgende Programm sagt dir, ob deine Tigerente in der Datei steckt, 
oder nicht.

StringToFind = "Tigerente"
IsFound = False
#Datei zum LESEN ("r") oeffnen
MeineDatei = open("f:\\Projekte\\python\\test.txt", "r")
#komplette Dateiinhalt lesen
DateiInhalt = MeineDatei.read()
if( StringToFind.lower() in DateiInhalt.lower() ):
  IsFound = True
#Datei wieder schliesen
MeineDatei.close()
print("\nDie Tigerente wurde gefunden: %s" % (str(IsFound)) )


Grüße

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Peter S. (psavr)

03.05.2014 11:49

Lesenswert?

•

▲
▼

>> Ansonsten wäre eine einfache Lösung, beide Strings z.B. komplett in
>> Großbuchstaben zu konvertieren und dann erst die Suche machen.
>
>Finde ich inperformant, und unschön. Ich würde eine Vergleichsfunktion
>übergeben.
>
>Ungetestet:
>int16_t compareFunc2(char a,char b){
> if(a>='A'&&a<='Z') a=a-'A'+'a';
> if(b>='A'&&b<='Z') b=b-'A'+'a';


Also ich finde Deine Lösung ist weder schöner noch performanter!

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: String herausfiltern unbeachtet Groß- und Kleinschreibung

von Yalu X. (yalu) (Moderator)

03.05.2014 18:01

Lesenswert?

•

▲
▼

Wenn es wirklich um Performanz geht, sollte man ohnehin einen anderen 
Algorithmus verwenden. Hier sind Beispiele:

  http://de.wikipedia.org/wiki/String-Matching-Algorithmus#.C3.9Cbersicht

Der in diesem Thread bereits in verschiedenen Varianten vorgeschlagene 
Algorithmus wird dort als "naiv" bezeichnet und stellt in den 
allermeisten Fällen die am wenigsten performante Lösung dar.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: PC-Programmierung String herausfiltern unbeachtet Groß- und Kleinschreibung