Beyond Hollywood - das Filmsyndikat

Technik => PC, Konsolen & Games => PC: Hard- & Software, Technik, Zubehör, Probleme => Thema gestartet von: Ash am 01. Januar 2009, 21:47:34

Titel: .PDF-Frage in Sachen Zeilen/Wörter-Erkennung
Beitrag von: Ash am 01. Januar 2009, 21:47:34
Also ich weiss nicht genau, wie ich mich ausdrücken soll. Ich versuche es mal:

Es gibt pdf-Dokumente, wo man die einzelnen Sätze rauskopieren kannn (markieren>kopieren>einfügen) aber nicht immer. Manchmal kann man das auch nicht und die ganze Seite wird als Bild markiert.

Gibt es eine Möglichkeit, wie ich einzelne Textteile von zu jpg abgescannte Texte kopierbar mache? Ich habe ein paar Seiten die ich übersetzen muss für ein Referat. Würde gerne die abgescannten Sätze markieren und in ein Translatorprogramm einfügen. Das würde mir ne Menge Arbeit ersparen, wenn das möglich ist.
Titel: Re: .PDF-Frage in Sachen Zeilen/Wörter-Erkennung
Beitrag von: der Dude am 03. Januar 2009, 22:59:01
Also aus einem JPG kannst keinen Text rauskopieren. Für den PC befindet sich da keine Text sondern eine Ansammlung von verschiedenfarbigen Pixeln. Es gibt allerdings Programme mit denen du direkt beim Einscannen den Text erkennen lassen kannst. Da googlest am besten einfach nach "OCR" (Optical Character Recognition), es gibt ein paar brauchbare Open Source Lösungen, allerdings ne Empfehlung kann ich dir nicht geben, dafür habe ich zu wenig Erfahrung in dem Bereich. Der Nachteil von solchen Programmen ist leider, dass die immernoch eine möglichst kontrastreiche und saubere Vorlage brauchen. Text auf Farbpapier oder mit Wasserzeichen im Hintergrund... da wirds schon schwierig.
Titel: Re: .PDF-Frage in Sachen Zeilen/Wörter-Erkennung
Beitrag von: Ash am 05. Januar 2009, 19:55:22
Sauber, THX für den Tipp, hab mir den fi_Reader besorgt, funzt super und die Texte sind halbwegs gut übersetzt worden. :biggrin: