Eenvoudig en betaalbaar OCR-programma

5
89

Eenvoud troef
ABBYY onthoudt je vorige instellingen. Het veronderstelt dus dat je waarschijnlijk wil scannen (stap 1 sla je over), dat het weer een Nederlandstalig document is (stap 2 sla je ook over) en dat je het resultaat in Word wil openen (stap 3 sla je ook weer over). In de praktijk open je bijgevolg ABBYY, klikt op Start en je document staat in Word. Eenvoudiger is moeilijk te bedenken.
ABBYY werkt ook merkwaardig snel. De duur van het inscannen zelf is uiteraard afhankelijk van het merk en type scanner dat je hebt en van het feit of de lamp al dan niet warm is. Eens het scannen voorbij mag je rekenen op 30 seconden tot 1 minuut om een doorsnee-pagina te converteren. Onze testmachine was nochtans niet direct een snelheidsmonster (een Pentium III – 667 MHz).
Eenvoud is één ding, maar voor een OCR-programma is nauwkeurigheid uiteraard doorslaggevend. Om het zo realistisch mogelijk te maken, stelden we een zo gevarieerd mogelijke testverzameling samen (een overzicht vind je in een afzonderlijke kader).


Het arsenaal testdocumenten dat we inscanden


Instellingen

In de handleiding wordt je voor het scannen een resolutie van 300 dpi in 256 grijswaarden aangeraden. Onze testscanner (HP Scanjet 3530c) werkt standaard op een resolutie van 200 dpi. Dus probeerden we het verschil uit op een recept gedrukt in bruine letters op een beige achtergrond. En inderdaad: op 200 dpi telden we zes fouten, een aantal fouten in het lettertype en een deel tekst op de foto werd niet als dusdanig herkend. Op 300 dpi telden we slechts één foutje en merkwaardig genoeg, op 450 dpi opnieuw drie fouten.
Even ter zijde: in het recept stond "1 / 2 flesje triple blond bier", en dat werd overal "112 flesje triple blond bier". Die Russen toch!


Duidelijke, verstaanbare tips

Tussen het scannen in kleur of in grijswaarden konden we evenwel geen verschillen in de nauwkeurigheid optekenen. Tijdens het scannen krijg je af en toe nuttige tips, in een klare taal opgesteld: "Het document bevat kleingedrukte tekst. Opnieuw scannen met een hogere scanresolutie kan de nauwkeurigheid verbeteren." "Het document is erg donker. Scan het opnieuw in maar verhoog de helderheid voor een beter resultaat". "Controleer en wijzig de documenttalen in het dialoogvenster Opties" (er zat inderdaad een Engelstalig document tussen).

1
2
3
4
5
Vorig artikelDraadloos digitale televisie bekijken
Volgend artikelBreed inzetbare multimediaprojector
René Paulus
René Paulus is medewerker van Diskidee.

5 REACTIES

  1. Hallo Franky,
    Ik kan je wel garanderen dat ik tijdens het testen niet alleen ABBYY open had staan, maar soms ook tegelijkertijd Word, Excel, Outlook, IE, Paintshop Pro (voor de screencaptures) – en dat ik geen enkele crash gehad heb. Nochtans was dat maar een oud PC-tje Pentium III.
    Over de helpdesk kan ik je niets vertellen, dat is ook moeilijk te testen – hier blijf ik je het antwoord schuldig.
    Ik heb wel alle gebruikte documenten bijgehouden – mocht de nieuwe OmniPage of ReadIris of weet ik veel welke OCR toevallig in mijn handen vallen, doe ik dezelfde test opnieuw, en dan kunnen we zinnig vergelijken!

  2. Jammer dat je geen vergelijking maakt met OmniPage van Scansoft, dat stikt van de fouten, vol onherstelbare bugs zit en het ene blue screen of death na het andere genereert (zelfs op en kersverse XP-installatie). Daarnaast hebben ze bij nog de slechtste helpdesk uit de hele softwarewereld. Doet Abby hier ook beter?

  3. Bedankt!

    Ik vond het apropos indrukwekkend dat het programma die foto nog kan \”lezen\”. Een goede bespreking!

  4. Je drukt het perfect uit, Andreas: je gaat een deel van het ingebouwd gebruiksgemak missen – maar wees gerust: de functionaliteit blijft. Alleen zal je steeds in twee stappen moeten werken: eerst ABBYY om te scannen, en het resultaat opslaan als DOC, XLS of RTF. Dan je eigen tekstverwerker / spreadsheet openen, en daarin het opgeslagen resultaat openen. Enige voorwaarde: je tekstverwerker moet DOC of RTF kunnen lezen, je spreadsheet een XLS – maar dat doet de meeste software gelukkig wel.
    Wat je mail betreft hoef je evenmin problemen te verwachten, omdat ABBYY van het resultaat een attachment maakt en dat naar het standaard-mailprogramma stuurt.

  5. Wat ik nog graag zou willen weten: als je geen Microsoft Office hebt, mis je dan (behalve een beetje ingebouwd gebruiksgemak) ook functionaliteit?

Reacties zijn gesloten.