Tekstherkenning verhoogt productiviteit

0
55
Dit artikel is deel 1 van 3 in het DiskIdee dossier OCR
DossiernavigatieTekstherkenning voor de professional

Krantenartikel
Ons tweede testdocument is een krantenartikel met daarin één afbeelding. We scannen eerst naar Word. We scannen op 600 dpi en in kleur. We vinden slechts drie conversiefouten: een ‘n’ in plaats van een ‘h’, een ‘8’ in plaats van een ‘g’, en van ‘ook’ heeft de software ‘lok’ gemaakt. Dat de software een ‘n’ maakte van een ‘h’ is eenvoudig te verklaren: de karakters stonden pal onder elkaar. Het opzet van de software blijft echter van kracht: tijd besparen. Als we scannen naar een bewerkbare pdf, blijft de opmaak behouden. We tellen hier eveneens drie conversiefouten.

Ingewikkelde lay-out
Stel je voor: je moet voor je vereniging een oude flyer hergebruiken. Je hebt geen digitale versie meer, alleen een afdruk. De flyer namaken kost veel tijd en dat lukt bovendien niet altijd even goed. We gaan dus Abbyy FineReader 10 Professional loslaten op een flyer met ingewikkelde lay-out. In dit geval moet de opmaak behouden blijven en de tekst in beperkte mate bewerkbaar zijn. Lukt dit of niet? We kiezen voor een ‘exacte kopie’ die we naar MS Word sturen. Helaas gaat de software hier helemaal de mist in… De opmaak is volledig weg. We proberen dan maar te scannen naar een bewerkbare pdf. De opmaak blijft grotendeels behouden, maar het resultaat is niet geschikt om zonder correcties te drukken. We besluiten een laatste scan ‘exacte kopie’ naar MS Word te sturen. Nu is het resultaat beter. We hebben nochtans geen instellingen gewijzigd. Dit keer is de opmaak grotendeels behouden en tellen we vier conversiefouten. Een ‘i’ werd bijvoorbeeld omgezet in een ‘.’. Ook een bestaande tabel blijft netjes behouden. Een aanvaardbaar resultaat.

1
2
3
4
5
6
7
8
Vorig artikelTrio iPod-luidsprekersystemen van Pioneer
Volgend artikelZwarte magie

LAAT EEN REACTIE ACHTER

Schrijf je reactie!
Vul hier je naam in

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.