.PDF-Frage in Sachen Zeilen/Wörter-Erkennung

0 Mitglieder und 1 Gast betrachten dieses Thema.

Offline Ash

  • der Werbe-Bot
  • Moderator
  • *****
    • Tod durch SnuSnu
      • Show only replies by Ash
    Also ich weiss nicht genau, wie ich mich ausdrücken soll. Ich versuche es mal:

    Es gibt pdf-Dokumente, wo man die einzelnen Sätze rauskopieren kannn (markieren>kopieren>einfügen) aber nicht immer. Manchmal kann man das auch nicht und die ganze Seite wird als Bild markiert.

    Gibt es eine Möglichkeit, wie ich einzelne Textteile von zu jpg abgescannte Texte kopierbar mache? Ich habe ein paar Seiten die ich übersetzen muss für ein Referat. Würde gerne die abgescannten Sätze markieren und in ein Translatorprogramm einfügen. Das würde mir ne Menge Arbeit ersparen, wenn das möglich ist.



    Offline der Dude

    • Die Großen Alten
        • Show only replies by der Dude
      Also aus einem JPG kannst keinen Text rauskopieren. Für den PC befindet sich da keine Text sondern eine Ansammlung von verschiedenfarbigen Pixeln. Es gibt allerdings Programme mit denen du direkt beim Einscannen den Text erkennen lassen kannst. Da googlest am besten einfach nach "OCR" (Optical Character Recognition), es gibt ein paar brauchbare Open Source Lösungen, allerdings ne Empfehlung kann ich dir nicht geben, dafür habe ich zu wenig Erfahrung in dem Bereich. Der Nachteil von solchen Programmen ist leider, dass die immernoch eine möglichst kontrastreiche und saubere Vorlage brauchen. Text auf Farbpapier oder mit Wasserzeichen im Hintergrund... da wirds schon schwierig.


      Offline Ash

      • der Werbe-Bot
      • Moderator
      • *****
        • Tod durch SnuSnu
          • Show only replies by Ash
        Sauber, THX für den Tipp, hab mir den fi_Reader besorgt, funzt super und die Texte sind halbwegs gut übersetzt worden. :biggrin: