

door Jelle van Soelen, RAR
Dit jaar werd het Regionaal Archief Rivierenland gewezen op een interessante casus: een website die binnenkort offline gaat. Enorm zonde om deze waardevolle informatiebron verloren te laten gaan. Dus werd er een enthousiaste projectgroep opgericht en zijn we aan de slag gegaan met als doel het “op eigen kracht het geautomatiseerd binnenhalen van websites.” Harvesten dus! In een relatief korte periode is er een Linux-server gerealiseerd met passende software om de harvesting uit te voeren. De uitkomst van deze harvesting is een wacz-bestand. Wacz staat voor Web Archive Collection Zipped.
De volgende uitdaging was om dit bestand in ons e-depot te plaatsen en beschikbaar te stellen via MAIS-(M)DWS. In MAIS-Flexis was het al mogelijk om .warc-bestanden te openen en beschikbaar te stellen. Op ons verzoek heeft DE REE dit ook mogelijk gemaakt voor .wacz-bestanden. Het importeren van websites naar MAIS-Flexis kan op 2 manieren: MAIS-Ingest of het direct uploaden via FTP naar de DDO. Als de website (wacz. bestand) geupload is naar MAIS-Flexis is het nader te beschrijven via de AET “Internetbron”. Dit kan ook automatisch gedaan worden via een verwerkingsmodel in de ingestmodule.
Tijdens dit proces heeft DE REE ook nog 2 verbeteringen doorgevoerd om de publicatie op de website aantrekkelijker te maken. Het is nu mogelijk om een eigen thumbnail toe te voegen. Wij hebben hier gekozen voor een printscreen van de homepage. De tweede verbetering is het direct tonen van de startpagina via een flexveld en een uitvoertag in de uitvoerdefinitie. Als je dit niet instelt, wordt het .wacz-bestand geopend als een soort ZIP-bestand
Via flexvelden in deze AES is de website beschreven en auteursrechtelijk beschermd. Dit wil zeggen dat de website voorlopig alleen in te zien is op onze studiezaal. Via MAIS-(M)DWS hebben we de eerste zes websites online kunnen beschikbaarstellen op de website.
De oplossing van DE REE voor het toegankelijk maken van websitebestanden is een heel fijne functionaliteit. Eigenlijk is het niet heel anders dan het toegankelijk maken van een foto of film in MAIS-Flexis. De grootste uitdaging voor archiefdiensten zit hem in het binnenhalen van de websitebestanden. Het importeren en beschikbaar stellen is naar onze mening daarna een fluitje van een cent.
Deze test met 6 websites is voor ons nog maar het begin. Enige tijd geleden zijn er opt-outbrieven verstuurd naar verschillende organisaties. Hierin is uitgelegd wat we precies gaan doen en geven we websitebeheerders de gelegenheid eventuele opmerkingen of bezwaren te maken.
Deze websites zijn inmiddels geharvest en op korte termijn gaan we ze opslaan in ons e-depot en beschikbaar stellen via onze website.
Neem contact op en wij geven je vrijblijvend advies
© DE REE - Certificering - Cookies - Privacyverklaring - Sitemap -
Ontwerp & sitebeheer door ForYou B.V. in samenwerking met Best4u
Afbeeldingen onder licentie van Shutterstock.com