Intelligente informatiebron voor grafische sector

0
17

Het Vlaamse Innovatiecentrum voor de Grafische Sector (VIGC) is een kenniscentrum voor de zich snel ontwikkelende grafische sector. De medewerkers worden er net zoals iedereen geconfronteerd met het fenomeen van de information overload. De ontwikkelingen in de grafische sector zijn voor een gewone sterveling niet meer bij te houden. GraphicBrain.com is een intelligente informatiebron die dat probleem moet oplossen. De technologie erachter werd ontwikkeld door het VIGC en het Hasseltse softwarebedrijf MediaMine en wordt momenteel verder gecommercialiseerd als MediaMine InfoPortal. Reden genoeg om aan Eddy Hagen, manager van GraphicBrain.com, te vragen wat er nu zo speciaal is aan GraphicBrain.com.
graphicbrain_1
De ontwikkelingen in de grafische sector gaan de laatste tien jaar enorm snel en de ICT speelde daarin een belangrijke rol. Van een ambachtelijke, industriële sector evolueerde het grafische bedrijf naar een high tech sector. Vanuit de grafische industrie zelf ontstond de behoefte aan een kenniscentrum. Zo ontstond eind 1997 het VIGC (de links openen een nieuw venster), dat gevestigd is in Turnhout, de hoofdstad van de grafische sector in België. Het VIGC richt zich zowel op de ontwikkelaars als op de gebruikers van de grafische technologie.

Informatie beheren
Eén van de belangrijkste taken van een kenniscentrum is informatie verzamelen en beheren. PIRA, de tachtig jaar oude Britse tegenhanger van het VIGC, begon twintig jaar geleden met een abstractdienst. Vijftien mensen zijn er full time bezig om driehonderd vaktijdschriften te excerperen. Het werk gebeurt grotendeels manueel en is zeer arbeidsintensief. Het VIGC zocht een andere, meer efficiënte oplossing. “Eerst probeerden we tijdschriftartikels in te scannen en te digitaliseren via ocr,” zo vertelt Eddy Hagen, manager van GraphicBrain.com en manager Training en Trendwatch van het VIGC. “Dat bleek te traag en te onprecies. Bovendien bleek er steeds meer bruikbare informatie te vinden te zijn op het internet. Ook publiceren veel tijdschriften hun archieven op het internet.”Het VIGC schreef een openbare aanbesteding uit voor een documentbeheersysteem. Van de vier kandidaten die inschreven, sprong het voorstel van het Hasseltse softwarebedrijf MediaMine er onmiddellijk uit. Eddy Hagen: “Wat zij voorstelden, ging veel verder dan wij hadden gevraagd. Dat zette ons aan het denken. De mogelijkheden bleken veel uitgebreider dan wij ons aanvankelijk konden voorstellen.” In overleg tussen Hagen en MediaMine werd het concept uitgetekend van wat nu GraphicBrain.com is, een intelligente informatiebron voor de grafische sector.

Gerichter
GraphicBrain.com lijkt op het eerste zich een gespecialiseerde zoekmachine te zijn. Bij nader toezien, blijkt een zoekopdracht veel gerichter informatie op te leveren over de grafische sector dan een algemene zoekmachine zoals Google. U kunt het zelf uitproberen door naar de site te surfen en te zoeken naar een technische term uit de grafische sector zoals “trapping” (het heeft iets te maken met vierkleurendruk). Je krijgt onmiddellijk relevante hits terug. Zoek je op dezelfde term bij Google dan krijg je een hoop zinloze documenten terug, genre “Trapping Bin Laden”. Nog een verschil is dat GraphicBrain.com een leesbare samenvatting geeft van elk document. De lengte daarvan kan de gebruiker trouwens zelf instellen. Die intelligente samenvattingen zijn te danken aan de software van het Britse bedrijf Autonomy (een spin-off van de Universiteit van Cambridge) die door MediaMine werd geïntegreerd. Die software werkt met concept matching en is zelflerend. Het categoriseren van de informatie gebeurt volautomatisch en bovendien taalonafhankelijk, dankzij het feit dat de software aan patroonherkenning doet op het niveau van de bits en de bytes. “Het systeem maakt samenvattingen op basis van de volledige tekst van het document,” aldus Eddy Hagen. “Daaruit kiest het de meest relevante zinnen en voegt die samen tot een leesbare samenvatting, die minstens evenwaardig is aan de manuele abstracts van onze Engelse collega’s. Eigenlijk zijn ze handiger, want de samenvatting die GraphicBrain.com geeft is geënt op de zoekopdracht die de gebruiker ingaf.” De patroonherkenning laat de zoekmachine ook toe om onmiddellijk het relevante deel uit een lang artikel of document aan de gebruiker te tonen.

Manueel
Het VIGC telt acht medewerkers. Het onderhoud van GraphicBrain.com vergt wekelijks slechts één tot twee manuren. Dat laat de medewerkers de handen vrij voor andere, belangrijkere taken dan het knippen en plakken van interessante informatie. Het grootste onderhoud kruipt in de configuratie van de 25 spiders die om de twee weken drieduizend relevante sites doorzoeken op nieuwe informatie. De xml-gebaseerde database bevat momenteel twee miljoen documenten. Elk document (met uitzondering van de documenten van betalende sites) wordt lokaal opgeslagen, zodat GraphicBrain.com ook dienst doet als archief voor informatie die niet meer op het internet is te vinden. Dat is tegelijk een van de belangrijkste reden waarom de software achter GraphicBrain.com alleen voor gespecialiseerde informatiecentra dienst kan doen. Anders zou je een database nodig hebben die gans het internet zou kunnen bevatten, en dat is uiteraard een zinloze en vooral zeer kostelijke oefening.

Hardwarevereisten
De hardwarevereisten zijn zoals het nu is al stevig genoeg. Het systeem draait op vier verschillende Windows NT servers: de webserver, de MediaMine server, de Autonomy server en de webspidering server. Alles wordt gehost bij HostIT. “Bandbreedte is daar geen probleem en de support is goed,” aldus Eddy Hagen. In het begin was de budgettering van de bandbreedte een probleem, maar de laatste maanden blijft die vrij stabiel. Het systeem gebruikt momenteel ongeveer 128 kbit/s, waarvan het grootste deel opgaat aan de spidering.Het bezoekerspubliek is internationaal, met de V.S. op kop, gevolgd door België en Nederland. Per maand bezoeken vijfduizend mensen de site. Achthonderd personen en instellingen registreerden zich. De site is vrij toegankelijk maar dan kun je alleen webdocumenten openen. Om alle artikelen in de database te kunnen openen, dien je een jaarabonnement van 25 euro te nemen. Geregistreerde gebruikers krijgen verder toegang tot intelligente “agents” die automatisch op zoek gaan naar informatie die in het interesseveld van de abonnee ligt. Gebruikers kunnen hun agents delen met andere gebruikers op het systeem. Op die manier wordt er ook aan networking gedaan. Het is mogelijk om GraphicBrain.com te integreren in het intranet van andere bedrijven. Zo is het VIGC uiteraard zelf een van de grootste gebruikers van het systeem.De samenwerking met MediaMine beviel zo goed dat dit bedrijf ondertussen de technologie achter GraphicBrain.com commercialiseert onder de naam InfoPortal. “MediaMine leverde heel goed werk voor ons en dat voor een realistische prijs,” aldus Eddy Hagen. “Alle wensen die wij hadden hebben ze kunnen realiseren. Als we met een nieuw idee afkwamen dan dacht men creatief na hoe dit kon worden toegepast. Tenslotte dienden zij nog altijd de code te schrijven.”

Conclusie
Eddy Hagen is, zoals hij het zelf noemt, een “witte raaf, namelijk een tevreden ICT gebruiker”. En dat mag ook wel eens worden gezegd. Voor iedereen die betrokken is bij de grafische sector of op zoek is naar grafische informatie is GraphicBrain.com een webadres dat moet worden toegevoegd aan de favorieten.
Vorig artikelEr hangt muziek in de lucht
Volgend artikelDigitaal kwaliteitsgeluid
Jozef Schildermans
Jozef Schildermans is journalist en schrijver. Zijn recentste roman is De reis van de hofarts (samen met Ludo Schildermans) onder de auteursnaam L.J. Schildermans gepubliceerd bij Uitgeverij Houtekiet.