Ahoi. Also, ich habe tausende PDF- und HTML-Dateien in vielen Ordnern und bräuchte für diese einen durchsuchbaren Index. Der Index muss auf jeden Fall die textlichen Inhalte dieser Dateien erfassen (Dateinamen gehen bereits mit Bordmitteln). Wenn ich also z.B. nach "Straße" suche, soll eine Liste aller Dateien rauskommen, in denen das Wort vorkommt. Mit welchem Programm ist sowas möglich? OS: Linux
Gerhard schrieb: > pdftotext + grep ? Das geht für eine oder ein paar Dateien, aber nicht für Tausende. Und mit Wildcards wäre die Systembelastung bei jeder Suche viel zu groß.
pdftotext + grep + Sahne: https://www.lesbonscomptes.com/recoll/index.html.en https://www.heise.de/ct/artikel/Toolbox-Desktop-Suche-mit-Recoll-1715658.html
Sorry, habe die Links des obigen Beitrages nicht angeschaut...
Ich schrieb: > Bei Windows 10 geht das Out of the Box In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche eingebaut haben? Träum weiter.
Dateisammler schrieb: > Ich schrieb: >> Bei Windows 10 geht das Out of the Box > > In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs > gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche > eingebaut haben? Träum weiter. Du kannst mich gerne aufwecken ;-)
Dateisammler schrieb: > Ich schrieb: >> Bei Windows 10 geht das Out of the Box > > In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs > gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche > eingebaut haben? Träum weiter. Das konnte schon Windows 2000, aber bei weitem nicht bei so vielen Dateitypen wie recoll. Recoll ist ausserdem wesentlich schneller.
ich schrieb: > Dateisammler schrieb: >> Ich schrieb: >>> Bei Windows 10 geht das Out of the Box >> >> In deiner Phantasie vielleicht. Windows bekommt nicht mal eine halbwegs >> gute Dateisuche hin, und da sollen sie eine komplette Inhaltssuche >> eingebaut haben? Träum weiter. > > Du kannst mich gerne aufwecken ;-) Nur weil W10 etwas findet, bedeutet das nicht dass immer alles gefunden wird. Wnt + W2k + Wxp haben sich bei mir wiederholt so "bewiesen" bei der DateiNAMENSsuche, dass ich nur noch gegen Entschädigung+Schmerzensgeld nach Aufwand damit arbeite(te). Allen Besserungsanpreisungen der Folgeprodukte konnten mich bisher nicht umstimmen. Auf lokalen Laufwerken mögen die Suchergebnisse von Wxy womöglich noch vollständig ausfallen, aber auf Netzlaufwerken sinds meist nur Zufallsergebnisse. (N.b: W7 konnte mir zu Bilddateien keine Vorschaubilder/Miniaturen bieten; eben: auf lokalen Partionen schon, nicht auf Netzlaufwerken) Ich hatte noch kein Job ohne Netzlaufwerke... Die besten Er(g/l)ebnisse mit GUI-Bordmittel hatte ich mit MacOS ab 9 ff. Sonst find , locate mit grep kombiniert.
halorp schrieb: > Das konnte schon Windows 2000, aber bei weitem nicht bei so vielen > Dateitypen wie recoll. Der Indizierungsdienst von Windows kann das für genau die Dateitypen, für die ein entsprechender Handler installiert ist. Das wird bei "recoll" wohl kein bissel anders sein, was auch immer das sein mag, hab' noch nie davon gehört. Scheint also wohl nicht wirklich wichtig zu sein... Der Punkt ist aber: Die geforderten Dateitypen waren ja vom TO vorgegeben: PDF und HTML. Für PDF kommt man z.B. spätestens zu einem entsprechenden Handler, indem man den Adobe-Reader installiert. Bezüglich HTML weiß ich jetzt nicht, könnte aber gut sein, dass es der standardmäßig im Lieferumfang ist. Ganz sicher ist er aber im System, wenn man ein Microsoft-Office installiert hat.
c-hater schrieb: > wenn man ein Microsoft-Office installiert hat. Dateisammler schrieb: > OS: Linux ;-)
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.