Forum: PC-Programmierung [C] Leerzeile hat einen komischen ASCII Wert

[C] Leerzeile hat einen komischen ASCII Wert

von Patrick M. (edge540)

27.10.2013 04:02

Lesenswert?

•

Moin,

ich schreibe gerade ein Programm,
welches eine Txt Datei einliest und dann jeweils zählt,
wie häufig jeder Buchstabe vorkommt.
Dafür gehe ich die Zeilen des Textes immer zeichenweise durch
und vergleich sie mit einem Array in welchem ich das ALphabet 
gespeichert
habe. Dann addiere ich zu den jeweiligen Buchstaben Zählern einen hinzu.
Das klappt auch solagen ich keine Leerzeilen habe. Dann nämlich addiert
er mir gerne mal ein oder zwei zusätzlich hinzu.
Ich bin da mit meinem Latein ziemlich am Ende und nach 7 Std Suchen auch 
ziemlich gefrustet^^ Vielleicht ist es ja eine Fehler den einer von euch 
sofort sieht, wäre toll!

Vielen Dank schon mal,

Patrick

#include <stdio.h>
#include <string.h>
#define LNAME 31
#define LLINE 81
int main (void)
  char alphabet[26] = {'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z'};
  int alphcnt[26] = {0};
  int cnti = 0;
  int cntj = 0;
  FILE *pin, *pout;
  char name_in[LNAME], name_out[LNAME];
  char line[LLINE];
  memset( line, NULL, 80 ); //Setzt die ersten 80 Zeichen von line auf NULL
    printf("Enter name of input file : ");
    scanf("%30s", name_in);
    pin = fopen(name_in, "r");
  } while(pin == NULL);
  while(1)
    fgets(line, LLINE, pin);     
    printf("%s", line);
    for(cntj = 0; cntj < 26; cntj++)
        for(cnti = 0; cnti < LLINE; cnti++)
            if(line[cnti] == alphabet[cntj])
                    alphcnt[cntj]++;
                    printf("%d \n", alphcnt[cntj]);
if(feof(pin)) break;
 fclose(pin);
 system("PAUSE");
  return 0;

27.10.2013 11:12: Bearbeitet durch User

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: [C] Leerzeile hat einen komischen ASCII Wert

von Martin M. (capiman)

27.10.2013 07:08

Lesenswert?

•

▲
▼

Bist du dir sicher, dass eine Zeile immer LLINE lang ist?
Bei der Leerzeile bin ich mir da nicht so sicher...

Ändere doch mal

for(cnti = 0; cnti < LLINE; cnti++)

in

for(cnti = 0; cnti < LLINE && line[cnti] != 0; cnti++)

fgets hat auch einen Returnvalue. Schau dir mal folgende Seite an:

http://www.cplusplus.com/reference/cstdio/fgets/

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: [C] Leerzeile hat einen komischen ASCII Wert

von Rainer V. (rudi994)

27.10.2013 07:18

Lesenswert?

•

▲
▼

Obiges Programm analysiert den Lesepuffer line[] unabhängig davon, wie 
lang der eingelesene Text ist. Somit werden z.B. bei Leerzeilen fast 
alle Zeichen aus der zuvor eingelesenen Zeile solange weitergezählt, bis 
die nächste Zeile aus der Datei keine Leerzeile mehr ist.

Das Programm sollte beim Auftreten der Null-Terminierung bzw. des 
Zeilenendes im Lesepuffer die Zählschleifen verlassen und mit der 
nächsten Zeile aus der Datei fortfahren.

Eine Leerzeile in einer TXT-Datei enthält nur das Zeilenende-Zeichen, 
i.d.R. die 2 ASCII-Codes 13 (Carriage Return) und 10 (Line Feed).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: [C] Leerzeile hat einen komischen ASCII Wert

von MWS (Gast)

27.10.2013 07:19

Lesenswert?

•

▲
▼

Die innere Schleife hat nicht auf die maximale Länge des Arrays begrenzt 
zu sein, sondern auf die Länge der aktuell gelesenen Zeile. Sonst werden 
laufend Speicherüberreste aus vorigen Zeilen mit einbezogen. Da fgets 
"bis zu" Zeichen holt, d.h. auch weniger, scheitert die Codelogik 
bereits, wenn nachfolgende Zeilen kürzer als vorhergehende sind. Eine 
Leerzeile ist dabei definitiv kürzer.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: [C] Leerzeile hat einen komischen ASCII Wert

von Justus S. (jussa)

27.10.2013 07:34

Lesenswert?

•

▲
▼

mal abgesehen davon: ist das ganze Prinzip mit dem Alphabet im Array 
nicht eh sehr suboptimal? warum nutzt man nicht aus, das 'a' == 97, 'b' 
== 98,...?

also sowas wie
for(cnti...)
    alphcnt[line[cnti] - 97]++

eventuell noch mit Abfrage, ob ein Buchstabe zwischen 'a' und 'z' 
vorliegt...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: [C] Leerzeile hat einen komischen ASCII Wert

von DirkB (Gast)

27.10.2013 07:39

Lesenswert?

•

▲
▼

Warum liest du eine ganze Zeile ein, wenn du jedes Zeichen einzeln 
untersuchst?
fgetc statt fgets.

Warum mit jedem Zeichen im Alphabet einzeln überprüfen?
Feststellen ob das eingelesene Zeichen >= 'a' und <= 'z' ist.
(Dafür gibt es die Funktion islower() aus der ctype.h)

Wenn das Zeichen ein Kleinbuchstabe ist, dann kannst du es als Index im 
Array nutzen.
alphcnt[zeichen-'a']++;

Aber warum auf Kleinbuchstaben einschränken?

  unsigned int alphcnt[256] = {0};
 ... Datei öffnen 
  while((c=fgetc(pin)!=EOF)
      alphcnt[c]++
  fertig
  Datei schließen

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net