ABBYY FineReader Express Edition für Mac: OCR ganz einfach

In einem privaten Projekt ging es vor kurzem darum aus einem bereits gedruckten Material, welches nicht mehr im Original digitalen Format vorliegt, reinen editierbaren Text zu erzeugen. Zwei Möglichkeiten standen mir zur Verfügung – entweder ich tippe alles ab, was mich eine ganze Menge Zeit gekostet hätte, oder ich benutze eine OCR (Optical Character Recognition) Software. Meine Wahl fiel auf letzteres und da ich Abbyy FineReader bereits von früher kannte, besorgte ich mir also die neuste Version für den Mac.

ABBYY FineReader Express Edition für Mac ist sehr einfach zu bedienen. Man startet die Applikation und erhält eine Auswahl an Optionen. Hierzu zählt woher kommt das Material, also scanned man es selber ein (kann direkt via TWAIN bzw. ICA Schnittstelle direkt von einem Scanner importiert werden) oder hat man bereits ein PDF, Bilddatei etc.

In meinem Beispiel habe ich mal die Lieferkarte einer Pizzeria genommen welche mir im PDF Format vorlag. Nachdem ich die Eingangsdatei ausgewählt hatte, musste ich mich für ein Ausgangsformat entscheiden, hier stehen Richtext, reiner Text, HTML Seite, durchsuchbares PDF und Excel zur Verfügung.

Nachdem ABBYY FineReader Express Edition für Mac das Eingangsdokument durchgearbeitet hat präsentiert es eine Übersicht, hier kann man schön erkennen das es Textbereiche, Tabellenbereiche und Bildbereiche automatisch erkannt hat. Sollte das mal nicht der Fall sein können die Bereiche selber geändert/angepasst werden.

Ein kurzer Druck auf Konvertieren und das wars. Das Ergebnis bei meinen Tests war immer sehr positiv, bis auf ein paar sehr merkwürdige Schriftarten, wurde alles tadellos erkannt. So spart man sich eine ganze Menge Arbeit.

Die Texterkennung funktioniert dank der Unterstützung für 171 Sprachen sehr gut. Dabei kann ein Dokument bis zu drei verschiedene Sprachen gleichzeitig beinhalten – ABBYY FineReader Express Edition für Mac erkennt diese automatisch oder man wählt sofort die Sprachen aus.

Die Beibehaltung des Original Layouts klappte in meinen Tests sehr gut. Speziell die Erkennung von Tabellen ist hierbei wichtig und diese beherrscht FineReader Express. In der Regel erkennt FineReader Tabellen vollautomatisch, sollte aber Bedarf sein, kann man diese noch explizit abändern. So kann man Trennzeichen für Tabellen hinzufügen, Trennzeichen in Tabellen löschen, Tabellenzellen trennen, Tabellenzeilen und Spalten verbinden.

Fazit

ABBYY FineReader Express Edition für Mac gehört für mich ab sofort zum Standardwerkzeug auf meinem Mac, denn vor allem zum erstellen von durchsuchbaren PDFs die man aus “dummen” PDFs erzeugt, eignet es sich ganz hervorragend! Ein einziges Manko habe ich jedoch feststellen müssen. Die Komprimierung der erzeugten PDFs ist sehr hoch, und dadurch leidet leider die Qualtiät selbiger. Ich hoffe ABBYY bessert hier nach und gibt dem Benutzer die Möglichkeit an den Einstellungen selber zu drehen.

ABBYY FineReader Express Edition für Mac kostet €89,99 und ist direkt im Mac AppStore erhältlich. Eine kostenlose Demoversion gibt es direkt beim Hersteller (hier wird lediglich die erste Seite eines Dokuments bearbeitet und die Testlaufzeit beträgt 15 Tage)

[app 412310371]

[grey_box] Ich bedanke mich bei der Firma ABBY für die Bereitstellung des Produkts für diesen Artikel. [/grey_box]

8 Antworten auf „ABBYY FineReader Express Edition für Mac: OCR ganz einfach“

  1. Kann man denn auch mehrere Dateien auf einmal bearbeiten, wie es beispielsweise in der Windows-Version möglich ist?Denn wenn ich einen Stapel Dokumente in durchsuchbare PDFs umwandeln möchte, wäre es schlecht, wenn ich jedes Dokument einzeln scannen lassen muss.

    1. Jein. Solange das Dokument mehrere Seiten hat bzw. wenn du 5 Seiten in den Scanner packst werden diese gemeinsam verarbeitet. Du kannst aber z.B. nicht Rechnung 1, Rechnung 2 und Rechnung drei in drei getrennten Dateien ablegen. Es geht immer nur eine Datei/Scan

  2. Hallo,

    die hohe Kompression bei pdf ist schon lange ein Thema und wenn ich die lange Laufzeit der jetzigen Version betrachte, muss ich vermuten, dass eine ernsthafte Weiterentwicklung nicht geplant ist für OSX..

    Da ist OCRkit für mich eine Alternative. Bei PDFs kann ich die Kompression einstellen, es fragt mich nicht unnötig nach den zu speichernden Dateinamen (erweitert den Namen nach Vorgabe) und es wird möglich einen ganzen Ordner PDFs in lesbare PDFs zu wandeln. Es ist preislich deutlich günstiger. Wie gut die OCR-Erkennung ist im Detail zu Abby Finereader habe ich nicht getestet, vermutlich für meinen “häuslichen” Gebrauch ausreichend (durchsuchbare, von Spotlight indizierbare PDFs).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

* Die DSGVO-Checkbox ist ein Pflichtfeld.

*

Zustimmung zur Datenspeicherung lt. DSGVO