Eenvoudig en betaalbaar OCR-programma

5
89

In de praktijk: de resultaten
Een volledig overzicht van de resultaten vind je in een afzonderlijke bijlage bij deze test die je hier als Excel-bestand kunt openen of als als PDF-bestand. Even de belangrijkste vaststellingen op een rij.
Teksten in normale lettertypes worden quasi foutloos geconverteerd. In tekenreeksen heeft het programma het vaak moeilijk met het verschil tussen het cijfer 0 en de hoofdletter O, tussen het cijfer 1 en de kleine letter L.


Zo ziet het origineel eruit

Teksten in vet en cursief geven een iets slechter, maar nog zeer aanvaardbaar resultaat. Bij onderlijnde tekst willen letters die onder de lijn komen (j, p, enz.) wel eens problemen geven. In zinnen vangt het woordenboek dit probleem meestal op, in tekenreeksen natuurlijk niet.
Vreemde lettertypes worden steevast omgezet naar Times New Roman of Arial.
Cijfertabellen worden foutloos in Excel omgezet. Merkwaardig genoeg is het (in Excel opgemaakte) resultatenblad gewoonweg onbruikbaar.
De verzameling recepten werd met groot succes ingescand, en ondanks de soms zeer creatieve lay-out vergden de resultaten nauwelijks correctie, op de reeds eerder vermelde problemen met de cijfers 0 en 1 na.


Dit is het resultaat in Word

Indrukwekkend was de omzetting van het krantenartikel, de pagina uit het woordenboek en de getypte tekst: foutloos. Vooral dat laatste is opmerkelijk: de meeste OCR programma’s brengen niets terecht van "echt getypte" documenten.

1
2
3
4
5
Vorig artikelDraadloos digitale televisie bekijken
Volgend artikelBreed inzetbare multimediaprojector
René Paulus
René Paulus is medewerker van Diskidee.

5 REACTIES

  1. Hallo Franky,
    Ik kan je wel garanderen dat ik tijdens het testen niet alleen ABBYY open had staan, maar soms ook tegelijkertijd Word, Excel, Outlook, IE, Paintshop Pro (voor de screencaptures) – en dat ik geen enkele crash gehad heb. Nochtans was dat maar een oud PC-tje Pentium III.
    Over de helpdesk kan ik je niets vertellen, dat is ook moeilijk te testen – hier blijf ik je het antwoord schuldig.
    Ik heb wel alle gebruikte documenten bijgehouden – mocht de nieuwe OmniPage of ReadIris of weet ik veel welke OCR toevallig in mijn handen vallen, doe ik dezelfde test opnieuw, en dan kunnen we zinnig vergelijken!

  2. Jammer dat je geen vergelijking maakt met OmniPage van Scansoft, dat stikt van de fouten, vol onherstelbare bugs zit en het ene blue screen of death na het andere genereert (zelfs op en kersverse XP-installatie). Daarnaast hebben ze bij nog de slechtste helpdesk uit de hele softwarewereld. Doet Abby hier ook beter?

  3. Bedankt!

    Ik vond het apropos indrukwekkend dat het programma die foto nog kan \”lezen\”. Een goede bespreking!

  4. Je drukt het perfect uit, Andreas: je gaat een deel van het ingebouwd gebruiksgemak missen – maar wees gerust: de functionaliteit blijft. Alleen zal je steeds in twee stappen moeten werken: eerst ABBYY om te scannen, en het resultaat opslaan als DOC, XLS of RTF. Dan je eigen tekstverwerker / spreadsheet openen, en daarin het opgeslagen resultaat openen. Enige voorwaarde: je tekstverwerker moet DOC of RTF kunnen lezen, je spreadsheet een XLS – maar dat doet de meeste software gelukkig wel.
    Wat je mail betreft hoef je evenmin problemen te verwachten, omdat ABBYY van het resultaat een attachment maakt en dat naar het standaard-mailprogramma stuurt.

  5. Wat ik nog graag zou willen weten: als je geen Microsoft Office hebt, mis je dan (behalve een beetje ingebouwd gebruiksgemak) ook functionaliteit?

Reacties zijn gesloten.