In einem privaten Projekt ging es vor kurzem darum aus einem bereits gedruckten Material, welches nicht mehr im Original digitalen Format vorliegt, reinen editierbaren Text zu erzeugen. Zwei Möglichkeiten standen mir zur Verfügung – entweder ich tippe alles ab, was mich eine ganze Menge Zeit gekostet hätte, oder ich benutze eine OCR (Optical Character Recognition) Software. Meine Wahl fiel auf letzteres und da ich Abbyy FineReader bereits von früher kannte, besorgte ich mir also die neuste Version für den Mac.

ABBYY FineReader Express Edition für Mac ist sehr einfach zu bedienen. Man startet die Applikation und erhält eine Auswahl an Optionen. Hierzu zählt woher kommt das Material, also scanned man es selber ein (kann direkt via TWAIN bzw. ICA Schnittstelle direkt von einem Scanner importiert werden) oder hat man bereits ein PDF, Bilddatei etc.

In meinem Beispiel habe ich mal die Lieferkarte einer Pizzeria genommen welche mir im PDF Format vorlag. Nachdem ich die Eingangsdatei ausgewählt hatte, musste ich mich für ein Ausgangsformat entscheiden, hier stehen Richtext, reiner Text, HTML Seite, durchsuchbares PDF und Excel zur Verfügung.

Nachdem ABBYY FineReader Express Edition für Mac das Eingangsdokument durchgearbeitet hat präsentiert es eine Übersicht, hier kann man schön erkennen das es Textbereiche, Tabellenbereiche und Bildbereiche automatisch erkannt hat. Sollte das mal nicht der Fall sein können die Bereiche selber geändert/angepasst werden.
Ein kurzer Druck auf Konvertieren und das wars. Das Ergebnis bei meinen Tests war immer sehr positiv, bis auf ein paar sehr merkwürdige Schriftarten, wurde alles tadellos erkannt. So spart man sich eine ganze Menge Arbeit.

Die Texterkennung funktioniert dank der Unterstützung für 171 Sprachen sehr gut. Dabei kann ein Dokument bis zu drei verschiedene Sprachen gleichzeitig beinhalten - ABBYY FineReader Express Edition für Mac erkennt diese automatisch oder man wählt sofort die Sprachen aus.

Die Beibehaltung des Original Layouts klappte in meinen Tests sehr gut. Speziell die Erkennung von Tabellen ist hierbei wichtig und diese beherrscht FineReader Express. In der Regel erkennt FineReader Tabellen vollautomatisch, sollte aber Bedarf sein, kann man diese noch explizit abändern. So kann man Trennzeichen für Tabellen hinzufügen, Trennzeichen in Tabellen löschen, Tabellenzellen trennen, Tabellenzeilen und Spalten verbinden.

Fazit
ABBYY FineReader Express Edition für Mac gehört für mich ab sofort zum Standardwerkzeug auf meinem Mac, denn vor allem zum erstellen von durchsuchbaren PDFs die man aus “dummen” PDFs erzeugt, eignet es sich ganz hervorragend! Ein einziges Manko habe ich jedoch feststellen müssen. Die Komprimierung der erzeugten PDFs ist sehr hoch, und dadurch leidet leider die Qualtiät selbiger. Ich hoffe ABBYY bessert hier nach und gibt dem Benutzer die Möglichkeit an den Einstellungen selber zu drehen.
ABBYY FineReader Express Edition für Mac kostet €89,99 und ist direkt im Mac AppStore erhältlich. Eine kostenlose Demoversion gibt es direkt beim Hersteller (hier wird lediglich die erste Seite eines Dokuments bearbeitet und die Testlaufzeit beträgt 15 Tage)
ABBYY FineReader ExpressHersteller: ABBYY USA Software House Inc



Kann man denn auch mehrere Dateien auf einmal bearbeiten, wie es beispielsweise in der Windows-Version möglich ist?Denn wenn ich einen Stapel Dokumente in durchsuchbare PDFs umwandeln möchte, wäre es schlecht, wenn ich jedes Dokument einzeln scannen lassen muss.
Jein. Solange das Dokument mehrere Seiten hat bzw. wenn du 5 Seiten in den Scanner packst werden diese gemeinsam verarbeitet. Du kannst aber z.B. nicht Rechnung 1, Rechnung 2 und Rechnung drei in drei getrennten Dateien ablegen. Es geht immer nur eine Datei/Scan
Schöne Vorstellung. Bisher brauchte ich noch nicht so eine Lösung, aber mit fast 90 Eur schon auch nicht preiswert. Muss man selber abwägen, ob einem die Zeit das Geld wert ist :=)
von Sebastian kürzlich veröffentlicht: Fazit nach einem Monat #boff3
Hallo,
habe noch einen neu verschweißten ABBYY Finereader 11 Professional Edition für WIndows hier.
Jemand interessiert?
Momentan bei MacUpdate.com für $50: http://deals.macupdate.com/deal/13877/abbyy-finereader-express (dann aber nicht aus dem Mac AppStore).
Und woher dann, wenn nicht aus dem Store?
Siehe Link, aber leider ist der “Deal” mittlerweile beendet.
Hallo,
die hohe Kompression bei pdf ist schon lange ein Thema und wenn ich die lange Laufzeit der jetzigen Version betrachte, muss ich vermuten, dass eine ernsthafte Weiterentwicklung nicht geplant ist für OSX..
Da ist OCRkit für mich eine Alternative. Bei PDFs kann ich die Kompression einstellen, es fragt mich nicht unnötig nach den zu speichernden Dateinamen (erweitert den Namen nach Vorgabe) und es wird möglich einen ganzen Ordner PDFs in lesbare PDFs zu wandeln. Es ist preislich deutlich günstiger. Wie gut die OCR-Erkennung ist im Detail zu Abby Finereader habe ich nicht getestet, vermutlich für meinen “häuslichen” Gebrauch ausreichend (durchsuchbare, von Spotlight indizierbare PDFs).