Forum: PC Hard- und Software Suchindex für tausende Dateien erstellen


von Dateisammler (Gast)


Lesenswert?

Ahoi.

Also, ich habe tausende PDF- und HTML-Dateien in vielen Ordnern und 
bräuchte für diese einen durchsuchbaren Index. Der Index muss auf jeden 
Fall die textlichen Inhalte dieser Dateien erfassen (Dateinamen gehen 
bereits mit Bordmitteln). Wenn ich also z.B. nach "Straße" suche, soll 
eine Liste aller Dateien rauskommen, in denen das Wort vorkommt.

Mit welchem Programm ist sowas möglich?
OS: Linux

von Gerhard (Gast)


Lesenswert?

pdftotext + grep ?

von Dateisammler (Gast)


Lesenswert?

Gerhard schrieb:
> pdftotext + grep ?

Das geht für eine oder ein paar Dateien, aber nicht für Tausende. Und 
mit Wildcards wäre die Systembelastung bei jeder Suche viel zu groß.

von insane (Gast)


Lesenswert?


von Oliver (Gast)


Lesenswert?

Recoll, benutze ich auch, kann ich empfehlen

https://www.lesbonscomptes.com/recoll/

von Oliver (Gast)


Lesenswert?

Sorry, habe die Links des obigen Beitrages nicht angeschaut...

von Dateisammler (Gast)


Lesenswert?

Danke euch! Das Programm klingt sehr vielversprechend.

von Ich (Gast)


Lesenswert?

Bei Windows 10 geht das Out of the Box

von Dateisammler (Gast)


Lesenswert?

Ich schrieb:
> Bei Windows 10 geht das Out of the Box

In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs 
gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche 
eingebaut haben? Träum weiter.

von ich (Gast)


Angehängte Dateien:

Lesenswert?

Dateisammler schrieb:
> Ich schrieb:
>> Bei Windows 10 geht das Out of the Box
>
> In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs
> gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche
> eingebaut haben? Träum weiter.

Du kannst mich gerne aufwecken ;-)

von halorp (Gast)


Lesenswert?

Dateisammler schrieb:
> Ich schrieb:
>> Bei Windows 10 geht das Out of the Box
>
> In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs
> gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche
> eingebaut haben? Träum weiter.

Das konnte schon Windows 2000, aber bei weitem nicht bei so vielen 
Dateitypen wie recoll. Recoll ist ausserdem wesentlich schneller.

von Local Area Notwork (Gast)


Lesenswert?

ich schrieb:
> Dateisammler schrieb:
>> Ich schrieb:
>>> Bei Windows 10 geht das Out of the Box
>>
>> In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs
>> gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche
>> eingebaut haben? Träum weiter.
>
> Du kannst mich gerne aufwecken ;-)

Nur weil W10 etwas findet, bedeutet das nicht dass immer alles 
gefunden wird.

Wnt + W2k + Wxp haben sich bei mir wiederholt so "bewiesen" bei der 
DateiNAMENSsuche, dass ich nur noch gegen Entschädigung+Schmerzensgeld 
nach Aufwand damit arbeite(te). Allen Besserungsanpreisungen der 
Folgeprodukte konnten mich bisher nicht umstimmen.

Auf lokalen Laufwerken mögen die Suchergebnisse von Wxy womöglich noch 
vollständig ausfallen, aber auf Netzlaufwerken sinds meist nur 
Zufallsergebnisse.
(N.b: W7 konnte mir zu Bilddateien keine Vorschaubilder/Miniaturen 
bieten; eben: auf lokalen Partionen schon, nicht auf Netzlaufwerken)

Ich hatte noch kein Job ohne Netzlaufwerke...

Die besten Er(g/l)ebnisse mit GUI-Bordmittel hatte ich mit MacOS ab 9 
ff.
Sonst find , locate mit grep kombiniert.

von c-hater (Gast)


Lesenswert?

halorp schrieb:

> Das konnte schon Windows 2000, aber bei weitem nicht bei so vielen
> Dateitypen wie recoll.

Der Indizierungsdienst von Windows kann das für genau die Dateitypen, 
für die ein entsprechender Handler installiert ist. Das wird bei 
"recoll" wohl kein bissel anders sein, was auch immer das sein mag, hab' 
noch nie davon gehört. Scheint also wohl nicht wirklich wichtig zu 
sein...

Der Punkt ist aber: Die geforderten Dateitypen waren ja vom TO 
vorgegeben: PDF und HTML. Für PDF kommt man z.B. spätestens zu einem 
entsprechenden Handler, indem man den Adobe-Reader installiert. 
Bezüglich HTML weiß ich jetzt nicht, könnte aber gut sein, dass es der 
standardmäßig im Lieferumfang ist. Ganz sicher ist er aber im System, 
wenn man ein Microsoft-Office installiert hat.

von Yufka (Gast)


Lesenswert?

c-hater schrieb:
> wenn man ein Microsoft-Office installiert hat.

Dateisammler schrieb:
> OS: Linux

;-)

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.