hebOCR

hebOCR (ehemaliger Name: HOCR) ist eine Open Source Texterkennungssoftware für die hebräische Schrift. Die Software ist besonders für alte religiöse Texte und Poesie vorgesehen. Sie ist als freie Software auch mit unter der Lizenz GPL veröffentlicht.

Der Kern von hebOCR ist die Software Bibliothek libhocr, die in C und C++ erstellt wurde. Dazu gibt es zwei Schnittstellen: das von Yuval Tanny mit Python und GTK+ erstellte hocr-gtk, welches auch eine graphische Oberfläche bietet, und das Kommandozeilenprogramm hocr, welches mehr Möglichkeiten bietet und zur Automatisierung vorgesehen ist.

Mit qHocr gibt auch ein (externe) Qt-basiertes, graphisches Frontend. Zur Bibliothek existieren  eine Python- und eine Perl-Anbindung, über die sie per Skript gesteuert werden kann.

Download

https://sourceforge.net/projects/hocr.berlios/