Forum: Offtopic Frage an Mac-User: Mit Vorschau zusammengefügte PDFs nicht durchsuchbar?


von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Die Frage kann sicher nur ein Mac-User oder PDF-Experte beantworten, 
aber die soll es hier ja auch geben.

Mit der Apple-Vorschau kann man recht unkompliziert mehrere PDFs 
zusammenfügen. Leider verlieren sie dabei die Durchsuchbarkeit, obwohl 
es sich NICHT um Scans handelt, sondern Text enthaltende PDFs.

- Die nicht zusammengefügten PDFs können durchsucht werden (Vorschau, 
rechts oben, Suchzeile), Zahlen und Texte werden problemlos gefunden

- bei einem zusammengefügten PDF findet die Suchfunktion NICHTs, obwohl 
Texte und Zahlen markiert werden können und definitiv vorhanden sind

Ich habe ein solches zusammengefügtes PDF mal mit Word für Mac geöffnet. 
Aber dann sind sämtliche (!) Zeichen absolut unleserlicher Crippel-Code 
(extrem falsches Encoding, nicht nur Umlaute verändert). Möglicherweise 
hängt das irgendwie zusammen.

Habs unter Windows versucht: Das zusammengefügte PDF wird korrekt 
angezeigt, ist aber ebenfalls nicht durchsuchbar

Habs mit Firefox versucht (der nutzt pdf.js): gleiches Problem - korrekt 
angezeigt, nicht durchsuchbar

... wie geht das?

von Εrnst B. (ernst)


Lesenswert?

Frank E. schrieb:
> wie geht das?

Ein beliebter "Kopierschutz" für PDFs ist es, einen Zeichensatz 
einzubetten, aber in dem die Codepoints der einzelnen Buchstaben 
durcheinanderzuwürfeln.

Das PDF wird dann richtig angezeigt, ist aber nicht mehr bearbeitbar, 
durchsuchbar, und Copy&Paste liefert nur Buchstabensalat.

Zur Frage warum die Mac-Vorschau das scheinbar ungefragt so macht müssen 
jetzt die Mac-Experten ran.

von Peter M. (r2d3)


Lesenswert?

Hallo Frank,

bin weder Mac-User noch PDF-Experte!
Du unterstellst, dass das Problem in der Datei begründet ist.
Du hättest auch erwähnen dürfen, unter welcher Software genau Du 
Ausschnitte nicht auswählen kannst!

Eventuell hat Deine zusammengefügte PDF-Datei ein Recht gesetzt, dass 
das Herauskopieren von Text verbietet (Eigenschaften des Dokuments 
kontrollieren!).

Vielleicht ist es aber auch ein Problem in der Betrachter-Software.
Der Firefox hat eventuell auch ein Adobe-Plugin. Der kann aber auch ohne 
das Plugin PDF-Dateien mehr schlecht als Recht darstellen, meine ich.

Prüf' Doch erst einmal das Offensichtliche:

https://helpx.adobe.com/de/acrobat/kb/unable-to-search-text-in-pdf.html

Viel Erfolg!

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.