Hallo zusammen, mein System zum Archivieren von Web-Artikeln versagt so langsam schmählich. Normalerweise "drucke" ich die Seiten als PDF. Das gibt immer mal wieder Probleme mit dem Seitenumbruch, aber wenn ich das in drei unterschiedlichen Programmen mit unterschiedlichen Einstellungen versuche, kommt meistens ein Dokument dabei heraus, das brauchbar genug ist. Die meisten Seiten werden ja eh nicht wieder ausgedruckt und die meisten PDF-Readern kommen mit sehr langen Seiten klar. Gibt es irgendwie ein Browser/Plugin/PDF-Editor mit Web-Capture, der Seiten als ganze Seiten beliebiger Größe abspeichern kann?
:
Bearbeitet durch User
Beachte: PDF hat je nach Version verschiedene max. Seitengrößen. Auch wenn das bei PDF 1.6 inzwischen fast unbegrenzt ist (mehrere Kilometer Kantenlänge) unterstützen einige Anzeigeprogramme nur die Limits aus 1.5 mit ~5 Metern Kantenlänge
Das Drucken von Webseiten macht fast immer Probleme, die sind einfach für den Bildschirm gemacht. Das Speichern als HTML habe ich inzwischen aufgegeben weil die Scripte etc. Probleme machen.
Walter T. schrieb: > Gibt es irgendwie ein Browser/Plugin/PDF-Editor mit Web-Capture, der > Seiten als ganze Seiten beliebiger Größe abspeichern kann? Wie meinst du das jetzt? Webseiten können ja riesengroß sein, sagen wir mal übertrieben z.B. Telefonbuch-Größe. Willst du den Text passend auf einer DIN A4-Seite haben, oder schön formatiert auf mehreren Seiten, oder einfach als Tapete für die Wand, wie bei Pi-Nachkommastellen? Bei Libre-Office gibt es einen guten PDF-Export, den könnte man indirekt nutzen, also offline. Du könntest auch bei Stackoverflow nachsehen, und feststellen, dass du einen gewissen Workflow brauchst. (https://stackoverflow.com/questions/45824393/exporting-web-page-as-pdf oder https://stackoverflow.com/questions/21270522/using-javascript-to-create-a-pdf-file-of-the-current-web-page)
:
Bearbeitet durch User
Die Frage, ob überhaupt Sinn macht, pdfs zu erzeugen, die eh niemand mehr liest, stellt sich dann aber auch noch. Wer tatsächlich HTML-Seiten über die Lebensdauer des zugehörigen links hinaus archivieren will, muß schon ein sehr seltenes Hobby betreiben. Ansonsten ist die Halbwertszeit des dort zu findenden Wissens dafür viel zu kurz. Oliver
Oliver S. schrieb: > Die Frage, ob überhaupt Sinn macht, pdfs zu erzeugen, die eh niemand > mehr liest, stellt sich dann aber auch noch. privat besitze ich seit >10 Jahren noch nicht mal mehr einen Drucker.
Εrnst B. schrieb: > PDF hat je nach Version verschiedene max. Seitengrößen. > Einige Anzeigeprogramme nur die > Limits aus [PDF] 1.5 mit ~5 Metern Kantenlänge Das Limit ist mir bewußt - das entspricht in etwa 17 A4-Seiten. Aber meistens passen ja fast alle Webseiten, die interessant genug sind, um aufbewahrt zu werden, auf 17 Seiten, und zum anderen unterstützen zum Glück genügend (nämlich mindestens 1 brauchbares) Anzeigeprogramm auf Windows und Android PDF 1.6, also läßt sich damit leben. Rüdiger B. schrieb: > Das Speichern als HTML habe ich inzwischen > aufgegeben weil die Scripte etc. Probleme machen. Genau das. Früher™ fand ich MHTML eine gute Idee, aber mittlerweile funktioniert das nicht mehr. Rbx schrieb: > Willst du den Text passend auf einer DIN A4-Seite haben, oder schön > formatiert auf mehreren Seiten, oder einfach als Tapete für die Wand, > wie bei Pi-Nachkommastellen? Ich denke breit wie ungefähr A4 und so hoch wie eben nötig kommt bei den meisten Geräten dem üblichen Lesefluß am meisten entgegen.
Ich benutze gelegentlich das Firefox-Addon "Print Edit WE". Damit kann man auswählen, welche Teile der Seite gedruckt werden sollen, und im PDF-Dialog auch die Vergrößerung. Dann drucke ich damit ein PDF.
Kannst ja mal Testen, wie dein PDF-Viewer auf solche Papier-Größen reagiert. Im Anhang ein Export von Beitrag "uC für 0,20€ CH552 / CH554 von WCH Billig Micro mit USB Funktion, Chip vorstellung" als PDF (kein besonderer Grund warum dieser Thread, war einfach der Erste auf der Startseite mit dreistelliger Post-Anzahl) Erstellt mit wkhtmltopdf. (https://wkhtmltopdf.org/) Seitenlänge sind 25 Meter, wenn ich mich nicht verrechnet habe, trotzdem sind's drei davon geworden. Mehr Seitenlänge wäre auch möglich gewesen.
Ich werf da mal wkhtmltopdf in die runde. Output siehe Anhang. Edit: Oh, geht sogar auf eine Seite, wenn man
1 | --page-width |
und
1 | --page-height |
angibt, siehe 2. Anhang
:
Bearbeitet durch User
Εrnst B. schrieb: > Kannst ja mal Testen, wie dein PDF-Viewer auf solche Papier-Größen > reagiert. Schon interessant. Firefox verschluckt sich, PDFXChange und Edge funktionieren problemlos, wobei der Edge eher zäh ist, aber PDFXChange schwuppdich bleibt. Εrnst B. schrieb: > wkhtmltopdf. Eduard I. schrieb: > wkhtmltopdf Danke, das werde ich mir mal ansehen. Der erste Eindruck ist ja sehr positiv. Christoph db1uq K. schrieb: > Ich benutze gelegentlich das Firefox-Addon "Print Edit WE". Das sieht auch sehr gut aus und verdient eine sorgfältigere Betrachtung. Danke für die Anregungen!
:
Bearbeitet durch User
Εrnst B. schrieb: > Kannst ja mal Testen, wie dein PDF-Viewer auf solche Papier-Größen > reagiert. Sumatra v3.1.2 kann es, der Foxit-Reader 4.3.1.0218 macht sehr lange Denkpausen, aber zeigt auch korrekt an.
Nachtrag: Das Firefox-Addon "Print Edit WE" macht ziemlich genau das, was ich brauche. Gestern und heute morgen hat es bereits gute Arbeit geleistet. Wenn man beim "PDF speichern" die Seitengrößte auf 8,3 x 200 inch stellt, hat man genau die maximale PDF-Größe ausgenutzt, und Bilder werden nicht zerlegt. Abschneiden kann man ja später immer noch. wkhtmltopdf sieht auch vielversprechend aus, aber das Firefox-Plugin hat bei niedrigster Einstiegshürde alles so gut gemacht, dass ich das evtl. bessere gar nicht brauche. Danke für die Tipps! Edit: Als Nebeneffekt lassen sich manche Seiten sogar besser lesen, weil z.B. sinnlose Spaltenbreitenbegrenzungen verschwinden.
:
Bearbeitet durch User
Ich habe noch nie die Möglichkeiten alle nachgelesen, was z.B. die drei "delete except" unterscheidet, oder was "Webstyle" genau ändert. Es ist aber für den Zweck auch so brauchbar.
Christoph db1uq K. schrieb: > Ich habe noch nie die Möglichkeiten alle nachgelesen Ich verstehe die Frage vermutlich nicht. Für mich stellt sich das so dar: Web-Style: Umschalten zwischen Druckansicht und Web-Ansicht. Unterschied zwischen "Hide Except" und "Delete Except": Bei "Hide" wird der Platz nicht neu berechnet. Was mich etwas stört: Ich habe bei meiner eigenen Seite sehr darauf geachtet, eine brauchbare Web- und eine brauchbare Druckansicht zu haben. Aber das Plugin zerstört das Layout komplett. Ich werde also wohl nochmal das alte CSS anpacken müssen. Das Plugin zeigt mir, dass etwas im Argen sein muss. Mist.
:
Bearbeitet durch User
Lustig, ausgerechnet die Mozilla-Seite lässt sich nicht bearbeiten: https://addons.mozilla.org/de/firefox/addon/print-edit-we/ Aber mit dem "vereinfachten" Druckdialog lässt sich wenigstens der Text einzeln drucken. "Delete Except" hat z.B. noch drei Unterpunkte, Restricted/Without Float/Unrestricted". Mich stört, dass Bilder beim Druck auf aufeinanderfolgende Seiten zerstückelt werden, aber das lässt sich sicher auch irgendwo ändern. Jedenfalls eine papiersparendes Programm für Internet-Ausdrucker wie mich. Jetzt muss man die PDFs nur noch auf der Platte wiederfinden.
Der Programmautor bietet noch weitere Add-Ons an, und scheint sehr öffentlichkeitsscheu zu sein. Auch die anderen Seiten sind mit seinem Programm nicht zu bearbeiten. Ich sehe gerade, dass ich das PDF zweimal gepostet habe, da hat mir die Forensoftware wieder einen Streich gespielt.
:
Bearbeitet durch User
in Win7 nehme ich, wenn ich sehr lange Threads, bzw über mehrere Webseiten verteilte Zusammenhänge in einer pdf speichern will, Freepdf (mit Ghostscript). ich kann im Browser Freepdf dann als "Drucker" anweisen. im Anhang eine Anleitung.
:
Bearbeitet durch User
Der PDF-Drucker ist nicht das Problem. Eigentlich alle Browser haben eine PDF-Speicherfunktion, die wie ein PDF-Drucker funktioniert. Das Problem ist, dass eine Seite für einen vernünftigen "Ausdruck" ein vernünftiges Extra-Layout benötigt, ansonsten sind z.B. die Seitenränder übel und Bilder werden mittig durchgeschnitten. Bei meiner eigenen Website habe ich ziemlich viel Zeit benötigt, bis das Druck-Layout vernünftig aussah und die Bilder nicht mehr zersägt wurden. Dass Kapitelüberschriften nicht zu Schusterjungen werden, habe ich aber z.B. bis heute nicht hinbekommen. Aber die meisten Seiten sparen sich den Aufwand - entsprechend schlecht sieht der PDF-"Ausdruck" dann aus. Deswegen suchte ich etwas, was dichter am "Screenshot" ist.
Bei Chrome spiele ich meist mit den Formaten und hoch/breit. Anscheinend sind viele Webseiten im DinA3-Format. Problematisch ist dann die zu lange Schriftzeile, oder daß der Text im Vergleich zum eingebetteten Bild zu klein ist. Oft verdeckt Werbung wichtiges. Manchmal kann man durch Auswählen/Markieren selektieren was gedruckt werden soll. Manche Leute kriegen es hin über F12 Teile auszuwählen, frag mich nicht wie. Wenn es gar nicht anders geht, mache ich Screenshots und füge in Paint mehrere Screenshots aneinander, speichere als Bild. Aber die Links sind dann nicht mehr klickbar. klick, klick, klick, - , leer, wegschmeiss
Oliver S. schrieb: >... > Wer tatsächlich HTML-Seiten über die Lebensdauer des zugehörigen links > hinaus archivieren will, muß schon ein sehr seltenes Hobby betreiben. > Ansonsten ist die Halbwertszeit des dort zu findenden Wissens dafür viel > zu kurz. > > Oliver Es gibt so manche Seiten, die verschwunden sind, - alles wird (verständlicherweise) eben nicht in "Way back" Maschinen gespeichert. Es geht ja nicht nur um recht allgemeines Wissen, sondern auch um barrierefreies (und Barrieren sind auch Neuerungen in Sachen Bezahlung, Anmeldung) Fachwissen, Scans von Büchern, audiovisuelle Medien (siehe was schon alles bei Youtube - aus welchen Gründen auch immer) für die Allgemeinheit (für dich und mich)verschwunden ist. Manches kann man, solange die Seite und natürlich die "Dateien" bestehen, mit entsprechenden Werkzeugen lokal für "immer" sichern. Aber ganze Webauftritte? Es wird immer schwieriger bis unmöglich - nicht nur ich hätte sicherlich sehr gerne so manchen Webauftritt (und das dort verbreitet - oft immer noch relevante Wissen und Unterhaltung) aus der Erinnerung, oder von einem letztendlich ins Leere laufenden aktuellen Suchmaschinentreffer, zumindest als vollwertige digitale Kopie bei sich lokal und "Orginal" auf dem Rechner. Nein, für einen persönlich wichtige Onlinedaten sollte man immer lokal sichern, wobei es einem bei audiovisuelle Medien meist nicht leicht gemacht wird. Ich ( bzw. korrekter "das Netz" und die Leute der diversen hervorragenden Projekte und Programme, die einen "Download" dann doch ermöglichen) habe bis jetzt aber immer Möglichkeiten gefunden, die mir wichtigen Dokumente und Medien lokal zu sichern und hatte das vor vielen Jahren (allerdings aus anderen Gründen - schnelles Internet und Flatrate waren nicht immer vorhanden...) als es noch recht einfach ging, sogar ganze Webauftritte lokal gesichert - natürlich war die Linktiefe begrenzt - "Das Internet sichern" war auch schon vor (mittlerweile für mich 25 Jahren...)nicht möglich - selbst wenn es schon DSL und Festplatten in TB Größen für den normalen Nutzer gegeben hätte. Und ja - eben auch aus jener Zeit gibt es Wissen und vor allem Inhalte, die einfach verschwunden sind (worden sind - mit Vorsatz und durch Druck)oder jetzt hinter Anmelde- und Bezahlschranken sind. Aber es brauchen keine Jahrzehnte oder gar nur Monate zu sein. Teilweise "verschwindet" Information und vor allem Unterhaltung (die "Text"Datei, das Dokument, das Video, das Hörbuch, der Podcast, die "Radioaufnahme" der Foren Thread.. ) schon nach Tagen oder gar Stunden...
:
Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.