Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopieren

Alles, was nicht in die anderen Foren gehört.

Moderator: jNizM

Johnny R
Posts: 348
Joined: 03 Oct 2013, 02:07

Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopieren

05 Mar 2015, 03:33

Es gibt manchmal eine merkwürdige Form ungeschützter pdf-Dokumente, denen ich beim Kopieren von Text (mit CTRL-C) keinen Text, sondern ständig nur Zeichensalat entlocken kann. Weiß jemand, was da los ist und warum das Herauskopieren nicht funktioniert? Ich bekomme es eigentlich nur dann sicher gebacken, wenn ich die PDF umständlich zunächst als jpg-Bilder speichere und dann wieder als PDF einlese, was lange dauert und die Qualität verschlechtert. Manchmal (aber selten) hilft es auch, die PDF in Adobe zu öffnen und dann nach PDFCreator zu drucken. Die Durchführung des OCR-Plugins bringt niemals Hilfe.

Ich meine z. B. diese beiden PDFs auf dieser Seite, wobei die eine PDF (BRAK-Mitteilungen) beim Kopieren von Text streikt und die andere PDF (BRAK-Magazin) komischerweise problemlos funktioniert. Ich arbeite mit Adobe Acrobat 9 Pro.

Kann sich da bitte jemand einen Reim darauf machen?
wolf_II
Posts: 2688
Joined: 08 Feb 2015, 20:55

Re: Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopi

15 Mar 2015, 12:17

Die genannten pdf Dateien sind in unterschiedlichen Formaten:
BRAK_2015_01.pdf ist version 1.5
BRAKMagazin_1_2015.pdf ist version 1.6
Johnny R
Posts: 348
Joined: 03 Oct 2013, 02:07

Re: Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopi

15 Mar 2015, 12:49

Danke! Und meinst Du, daß dieser Unterschied unser Problem erklärt und ggf. löst? Mit anderen PDF-Viewern konnte ich das Problem übrigens auch nicht lösen. Ein blödes Problem, wenn plötzlich Copy & Paste nicht mehr funktioniert. Wie soll man da seine Doktorarbeiten schreiben... ;)
gregster
Posts: 9066
Joined: 30 Sep 2013, 06:48

Re: Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopi

15 Mar 2015, 14:35

Scheint ein bekanntes Problem zu sein, zu dem es keine einheitliche Lösung gibt. Der einzige Ausweg scheint wohl doch über OCR zu führen. Du könntest mal dieses Vorgehen probieren, das Luke Jennings im Adobe-Forum vorschlägt:

https://forums.adobe.com/thread/906503

Hab gerade kein Adobe auf dem Rechner - daher keine Ahnung, ob das funktioniert...
wolf_II
Posts: 2688
Joined: 08 Feb 2015, 20:55

Re: Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopi

15 Mar 2015, 20:29

Johnny R wrote:Und meinst Du, daß dieser Unterschied unser Problem erklärt und ggf. löst?
Nach weiteren Versuchen, der Lösung näher zu kommen, möchte ich vermuten: das PDF-Format hat vielleicht doch nichts mit der Verschlüsselung zu tun. Ich habe auch leider keine Software gefunden, die mich zwischen verschiedenen Formaten wählen lässt.

Getestet habe ich mit Bullzip PDF-Printer, Foxit (Viewer und virtueller Printer) und Sumatra-PDF (open-source Viewer)

Ich wollte keine falsche Fährte legen, sondern im Sinne von Brainstorming meine Beobachtung mitteilen.
Johnny R
Posts: 348
Joined: 03 Oct 2013, 02:07

Re: Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopi

16 Mar 2015, 02:15

@gregster, Dein Link hat funktioniert! Danke!
You will be able to use OCR in Acrobat after you convert the type to outlines. You will need to add some transparency, then use the flattener preview to outline your type. Here are the steps (for Acrobat 9):
1. Document> Watermark> Add (add a text watermark, hit the space bar once).
2. Advanced> Print Production> Flattener Preview> Convert all text to outlines (checkbox on). Save.
3. Document> OCR text recognition> recognize text using OCR. Select all text with the type tool, copy.
This method is not perfect, you will need to check the copy for errors.
Auf Deutsch:
1. Dokument>Wasserzeichen>Hinzufügen (Betätige einmal die Leer-Taste).
2. Erweitert>Druckproduktion>Reduzieren-Vorschau>Checkbox "Gesamten Text in Pfade kopieren" und Checkbox "Alle Seiten im Dokument" markieren>Anwenden
3. Dokument>OCR-Texterkennung>Text mit OCR erkennen
Die pdf hat jetzt zwar statt ursprünglich 2,6 MB plötzlich 38,3 MB. Aber was ist schon Festplattenplatz... ;)
Rolf

Re: Manche pdf-Dokumente erzeugen nur Zeichensalat beim Kopieren

23 Apr 2024, 09:00

Mit der App iScanner kann man mit Hilfe der AI den nicht zu kopierenden Text als .doc erstellen lassen und dann bearbeiten.

Return to “Allgemeines”

Who is online

Users browsing this forum: No registered users and 3 guests