PDF-documenten inlezen

2
268

ABBYY PDF Transformer is helemaal geen nieuw programma, maar het sluit naadloos aan bij een vorig artikel dat je hier kon lezen over het OCR programma ABBYY Scan to Office. Daar kon je lezen dat ABBYY Scan to Office wel een ingescand document kon versturen als PDF-bijlage aan een e-mail, maar zelf geen PDF-documenten kon inlezen. Dat is nou net wat ABBYY PDF Transformer wel kan: PDF-documenten inlezen en de inhoud openen als een Microsoft Word- of Excel-bestand. Er een HTML-pagina voor je website van maken of een doodgewoon tekstbestand, behoort ook tot de mogelijkheden.
abbyypdf_doos

Het volledige programma bestaat eigenlijk uit één enkele wizard, die je in drie kinderlijk eenvoudige stappen naar je doel leidt. In stap 1 geef je op welk bestand je wilt converteren, in stap 2 zeg je wat je met het resultaat wil doen en in stap 3 krijg je dan de opties. Dat is eenzelfde venster als bij broertje Scan to Office, dus ook hier heb je weer de keuze uit 37 talen. Ook kan je aangeven of je het volledige PDF-document wil omzetten, of slechts bepaalde pagina’s ervan.

Resultaten
De meeste PDF-documenten die we testten werden schitterend geconverteerd, inclusief het behoud van de opmaak. Een vrij slecht resultaat daarentegen behaalden we met een document dat we ook in de vorige test gebruikten: een recept gedrukt in bruine letters op een beige achtergrond met een foto erbij. We hadden dat eerst ingescand met ABBYY Scan to Office, en als PDF-bijlage naar onszelf gemaild. Dat PDF-bestand gaven we dan ter verwerking aan ABBYY PDF Transformer. Het resultaat bevatte meer dan tien fouten, hele tekstblokken stonden op een verkeerde plaats en de opmaak was miserabel. Het resultaat met ABBYY Scan to Office was in ieder geval stukken beter bij dat testverslag (zie pagina 4 van dat artikel).

ABBYYPDF_word.jpg

Achter de schermen
Eigenlijk kon je dit resultaat verwachten, omdat er twee soorten PDF-bestanden bestaan: fotobestanden en tekstbestanden (eventueel geïllustreerd met foto’s). De meeste PDF-bestanden zijn van het tekst-type, zij bevatten dus de tekst zelf. ABBYY PDF Transformer kan die tekst gemakkelijk recupereren en moet zich alleen nog bezighouden met de opmaak. Vandaar waarschijnlijk de uitstekende resultaten bij het merendeel van de testen.
De ongeformatteerde tekst uit dergelijke PDF-bestanden halen kan je echter ook gemakkelijk zelf met de gratis Acrobat Reader zonder ABBYY PDF Transformer: klik op de knop "tekst selecteren", en zo via knippen-en-plakken recupereer je de tekst. Of eenvoudiger nog: in het menu "Bestand" van Acrobat Reader klik je op "Opslaan als tekst".

ABBYYPDF_zelf.jpg

Wanneer ABBYY PDF Transformer ook met PDF-bestanden van het foto-type overweg kan, bewijst dat dat het een eigen OCR-engine (Optical Character Recognition) aan boord heeft, maar waarschijnlijk van een oudere generatie dan dat van het eerder geteste ABBYY Scan to Office. Bovendien zijn PDF-bestanden heel sterk gecomprimeerd wat de kwaliteit niet ten goed komt, vandaar het eerder zwakke resultaat.

Conclusie
Uit de meeste PDF-bestanden kan je ook zonder ABBYY PDF Transformer de tekst recupereren. Hier kan ABBYY PDF Transformer alleen wat formattering aan toevoegen, maar waarschijnlijk wou je die tekst sowieso in je eigen document met je eigen opmaak gebruiken. De meerwaarde van het programma is hier dan ook erg miniem.
Bij PDF-bestanden van het foto-type is het resultaat bedenkelijk en zeker geen 40 euro waard. Eigenlijk heeft ABBYY PDF Transformer weinig reden van bestaan als een autonoom programma. Geïntegreerd in ABBYY Scan to Office zou het wel een meerwaarde kunnen geven aan dit laatste.
Adviesprijs
40 euro
Systeemvereisten
Pc met Pentium of AMD processor, 200 MHz of hoger
Windows XP, 2000, NT 4.0 (SP6 of hoger), Me/98
64 MB RAM (Windows XP/2000/NT 4.0) of 32 MB (Windows Me/98)
150 MB op vaste schijf + 70 MB voor programmawerking
SVGA videokaart en monitor (min. resolutie 800 x 600 pixels)
Vorig artikelGoedkoop fotobeheerprogramma
Volgend artikelSpiegelreflex op basis van FourThirds standaard
René Paulus
René Paulus is medewerker van Diskidee.

2 REACTIES

  1. Dag,
    Mijn reden om ABBYY transformer 2.0 te kopen is juist omdat het een PDF bestand naar "Word" vertaald (in RTF). Dit brengt met zich mee dat ik dit RTF bestand dan in MemoQ kan inlassen. (MemoQ is een vertaal programma.)
    Nu is het wel zo dat ik in ZA woon en het licencie nummer graag "online" wil kopen van een verkoper in Belgie (en door mijn bank aldaar te betalen in Euros). Zoeken en zoeken en ik vind niemand. Ze willen allemaal het CD verkopen en aansturen. Maar… we hebben hier (in Zuid Afrika) heel wat mensen bij het post kantoor werken die sterke lijm aan hun handen hebben! Dus U begrijpt wel dat een (zuinige) kaaskop zoals ik, liever het licencie online koopt. Ik heb het programma inmiddels wel op mijn Laptop, het gebruik ervan is echter verlopen.
    Zoudt U zo vriendelijk zijn om mij de naam (en http adres) geven van een voortverkoper in Belgie, dan zou ik U wel echt hiervoor dankbaar  zijn.
    Warme en zonnige groeten van Wessel!

Reacties zijn gesloten.