Hans Peter Ros spreekt over de MAIS-Flexis-suite naar aanleiding van de workshop documenten- en krantenviewer
Geschreven op dinsdag 28 mei 2013 10:48
Voor de opslag en ontsluiting van digitale archiefbescheiden geven wij bij het Haags Gemeentearchief logischerwijs de voorkeur aan het gemeentebrede DMS dat wij beheren.
Maar voor de ontsluiting van anderssoortige bronnen, zoals die waar OCR achter zit, houden wij de ontwikkelingen goed in de gaten. Wij ontsluiten al jaren verschillende gedrukte bronnen in drie verschillende applicaties, van drie verschillende leveranciers, maar de ontwikkelingen gaan snel en verbetering is altijd mogelijk.
De workshop 'kranten- en documentenviewer' van DE REE archiefsystemen toonde mij hiervan een goed voorbeeld. De techniek erachter is robuust en betrouwbaar als altijd, de vormgeving en het gebruikersgemak zijn prima, en de verwerking van OCR-data is gebaseerd op een internationale standaard. Met wat finetuning, waarvoor de workshop mede bedoeld was, is dit een hele mooie uitbreiding van wat je zo langzamerhand de MAIS-Flexis-suite kan noemen.
Maar eerlijk is eerlijk: er ontbreekt naar mijn smaak nog wel iets in deze eerste versie. De kracht van de MAIS-Flexis-produkten is, dat ze de gebruiker het volledige beheer geven over 'zijn' data. De gebruiker heeft de regie en kan flexibel inspelen op wijzingen en aanvullingen, daar waar die gewenst zijn. MAIS-Flexis is niet zo maar alleen een publicatietool, maar ondersteunt werkprocessen. En juist dat laatste element is bij de nieuwe functionaliteit niet aanwezig: er is geen module die het mogelijk maakt om OCR-data, die per definitie fouten bevat, te verbeteren of tekstblokken te markeren en te metadateren. Er valt, met andere woorden, niet iets te beheren. Nog niet, moet ik hier waarschijnlijk schrijven, want het zou me niets verbazen als hierin in een volgende versie alsnog wordt voorzien. Volgens mij een gat in de markt!
Hans Peter Ros, Projectleider Digitaliseren op verzoek
Reactie DE REE archiefsystemen
De eerste versie van de documenten en krantenviewer gaat uit van het metadateren van documenten en/of kranten in MAIS-Flexis en ziet de ALTO/xml (de OCR-informatie) als een product van een scanbedrijf. Uiteraard zijn en blijven bij ons deze ALTO/xml-bestanden eigendom van de opdrachtgever. Dit in tegenstelling tot sommige andere leveranciers. DE REE archiefsystemen gaat de komende tijd onderzoeken op welke wijze de kwaliteit van de OCR kan worden verbeterd. Wij zien dat uitdrukkelijk als een noodzaak, maar nog niet in deze eerste versie.
Erik de Ree, directeur