Text aus PDF kopieren

Dieses Thema im Forum "Anwendungssoftware" wurde erstellt von ~Illuminatus~, 28. Januar 2015 .

Schlagworte:
  1. 28. Januar 2015
    Zuletzt von einem Moderator bearbeitet: 14. April 2017
    Hallo,

    ich möchte gerne den Text aus einem PDF File in ein Word Dokument kopieren. Allerdings habe ich das Problem, dass bei einigen Stellen anstatt dem Text nur Sonderzeichen im Word-Dokument erscheinen, nachdem ich den Text eingefügt habe.

    Ich habe schon eine OCR Texterkennung durchgeführt und das PDF in HTML kovertiert - leider bisher ohne Erfolg.

    Hier das PDF File

    Es handelt sich um die Seiten 30 - 58.

    Ich wäre euch überaus dankbar, wenn ihr mir weiterhelfen könntet.

    Viele Grüße und ein großes Danke im Voraus
     
  2. 28. Januar 2015
    AW: Text aus PDF kopieren

    Google ist dein Freund.

    Es wäre außerdem sicher sinnvoll gewesen, dein Problem konkreter zu beschreiben - nämlich wo genau Fehler bei der Schrift auftreten. So könnte man seine Lösung dann nämlich kontrollieren, bevor man dir die präsentiert.

    Hier werden diverse Tools vorgestellt. Probieren musst du die selber.
    PDF-Import: Fünf Lösungen um PDFs zu bearbeiten - NETZWELT

    Diese Lösung wird wohl ausfallen, denn wenn ein PDF-Reader installiert ist, braucht man schließlich keinen Umweg über Word.
    Hinzufügen einer PDF-Datei zu einer Office-Datei

    Mein Versuch mit Adobe Acrobat 8 war leider nicht wirklich erfolgreich, weil "einige Informationen fehlen", um alle Schriftarten korrekt zu erkennen. Ganz davon abgesehen war das Layout total im Eimer. Bleibt dir immer noch der obige Link.

    Ansonsten, wobei der Aufwand sich hier vielleicht sogar lohnt, hilft das gute Produkt von Adobe ja vielleicht weiter.
    PDF in Word umwandeln, PDF in Word | Adobe Acrobat XI
    Inwiefern Acrobat XI tatsächlich kostenfrei getestet werden kann, musst du selbst herausfinden.
     
  3. 28. Januar 2015
    AW: Text aus PDF kopieren

    Ich habe vergessen zu erwähnen, dass ich das alles schon probiert habe. Aber nach der Konvertierung werden Seite 30-58 nur als Sondersymbole dargestellt.
    Die Methode mit dem Acrobat Reader XI Pro hab ich auch ausprobiert.
     
  4. 28. Januar 2015
    AW: Text aus PDF kopieren

    Kann es sein, dass die Datei irgendwie geschützt ist?

    Mein (hoffentlich funktionierender) Workaround: Seiten 30-58 per XPS Document Writer "drucken" und die XPS dann in ein beliebiges Textformat umwandeln.

    // Hat bei mir nicht geklappt, aber ich könnte mir vorstellen, dass es damit geht.
    // Da ist die XPS-Methode auch dabei...bei mir hat sie nicht funktioniert. Beim "Drucken als PDF" hängt sich mein XPS-Viewer auf. Vielleicht hilft was davon: Entsichern einer geschützten PDF Datei – wikiHow
     
  5. 28. Januar 2015
    AW: Text aus PDF kopieren

    Es handelt sich um ein zusammengefügtes PDF File. Sprich die einzelnen Kapitel stammen aus unterschiedlichen Quellen. Da kann es schon gut sein, dass die Seiten 30-58 geschützt sind.

    Das mit XPS hat nicht funktioniert. Habe versucht es in txt, doc und docx umzuwandeln.
     
  6. 28. Januar 2015
    AW: Text aus PDF kopieren

    Jo, da sind Teile geschützt - bei mir einfach zu testen durch: Dokument im Browser öffnen, Text auf beliebiger Seite markieren, Rechtsklick > Google nach "..." durchsuchen. Wenn da das markierte steht ist es ungeschützt, ansonsten stehen da nur irgendwelche komischen Zeichen eben. Vielleicht gibt es Open-Source Software oder ein Workaround, aber das Quell-Buch ist wohl ein wirklich teurer Schmöker (60€). Einfach abtippen könnte schneller sein. ;-)
     
  7. 28. Januar 2015
    AW: Text aus PDF kopieren

    Habe es jetzt letztendlich hinbekommen, indem ich beim PDF XChange Viewer Pro den OCR drüberlaufen und es als Bilddatei habe ausgeben lassen.

    Bei diesen Bildern konnte man dann den Text kopieren und in Word einfügen.

    Danke für eure Hilfsbereitschaft, wahnsinnig stark!
     
  8. Video Script

    Videos zum Themenbereich

    * gefundene Videos auf YouTube, anhand der Überschrift.