Tekstherkenning verhoogt productiviteit

0
55
Dit artikel is deel 1 van 3 in het DiskIdee dossier OCR
DossiernavigatieTekstherkenning voor de professional

Nieuwe taak
In het venster ‘Nieuwe taak’ zie je vier categorieën: ‘Algemeen’, ‘Microsoft Word’, ‘Adobe PDF’ en ‘Overige’. We kiezen als eerste uit de categorie ‘Algemeen’ voor ‘Scannen naar Microsoft Word’. Je krijgt vervolgens de mogelijkheid om een scanner te selecteren en enkele instellingen naar je hand te zetten. We laten alles op standaard staan en drukken op ‘Voorbeeld’. Helaas krijgen we een foutmelding: ‘De parameter is onjuist’. Het blijkt een probleem met de driver van de scanner te zijn.

Reclamefolder
Als we in plaats van ‘WIA’ voor ‘Twain’ kiezen, werkt alles naar behoren. WIA is een algemene driver die voor de meeste moderne scanners werkt. Twain is merkafhankelijk. We scannen de afbeelding op 600 dpi in zwart-wit en kleur. Na enkele minuten beschikken we over een Word-document met daarin de tekst van de scan. De tekst is verdeeld in drie pagina’s en dus is de opmaak niet mee overgenomen in het Word-document. De software staat dus kennelijk niet ingesteld op ‘exacte kopie’ voor de sneltaak ‘Scannen naar Microsoft Word’. Het gescande document is reclame van ‘De Post’.

De scannerinstellingen in Abbyy FineReader 10

De scannerinstellingen in Abbyy FineReader 10 (© ; licentie: )

Van een ‘+’ maakt de software een ‘1’. Een beetje verder in het document maakt de software deze fout niet meer. Een ezel stoot zich geen twee keer aan dezelfde steen? Een voetnootverwijzing 2 wordt omgezet naar 1 en 3 naar 2. Ook in de ‘kleine lettertjes van de reclame vinden we dergelijke foutjes. Voor het overige zijn we tevreden van de geconverteerde tekst. We scannen hetzelfde document naar een doorzoekbare pdf-afbeelding. Deze keer blijft de opmaak behouden en is het document eenvoudig doorzoekbaar. Het blijft in dit geval namelijk een afbeelding met tekst onder het paginabeeld. Tot slot scannen we de reclame naar een bewerkbaar pdf-document via de categorie ‘Adobe PDF’. Het verschil tussen een scan in kleur of in zwart-wit is niet merkbaar. De conversiefouten (foutief omgezette karakters) zijn gelijk in de twee scans: twee.

1
2
3
4
5
6
7
8
Vorig artikelTrio iPod-luidsprekersystemen van Pioneer
Volgend artikelZwarte magie

LAAT EEN REACTIE ACHTER

Schrijf je reactie!
Vul hier je naam in

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.