
Das Thema Texterfassung taucht regelmäßig dann auf, wenn ältere Dokumente wieder veröffentlicht werden sollen.
Folgende Szenarien sind denkbar:
Um Ihnen die Umsetzung solcher Projekte zu ermöglichen, haben wir verschiedene Varianten erarbeitet.
Diese reichen von
Welche Variante für Sie die Beste ist, lässt sich pauschal nicht sagen. Hier ist immer ein Test notwendig.
Diese Tests führen wir sehr kurzfristig durch, damit Sie schnell entscheiden können, ob dieses Projekt realisiert werden kann.
OCR steht für Optical character recognition, zu deutsch Optische Zeichenerkennung. Hierbei wird in der Regel ein Text gescannt und dieser dann durch ein spezielles Programm verarbeitet. Als Ergebnis wird meist eine MS-Word-Datei gewünscht, es sind aber auch andere Datei-Formate möglich. Sprechen Sie uns diesbezüglich an.
Als problematisch für die OCR-Erfassung können folgende Aspekte gesehen werden:
Original als Grafik

umgewandelt in Text
