Nieuws Over Informatie Gesproken
"Overheidsinformatie is vaak onnodig ontoegankelijk”
.jpg)
WIE: Maarten Marx
WERKT BIJ: Het IRLab van het Informatica Instituut aan de Universiteit van Amsterdam.
WAT IS ONDERZOCHT: Mede gefinancierd door Over Informatie Gesproken onderzocht hij hoe documenten als adviezen, onderzoeken en convenanten beter te ontsluiten zijn.
Wat gaat er nu vaak mis als het gaat om open overheidsinformatie?
‘Documenten zoals adviezen, onderzoeksrapporten en convenanten zijn vaak slecht vindbaar of technisch onbruikbaar. Bestuursorganen classificeren documenten onvoldoende en worden niet op een toegankelijke manier getoond. Zo worden stukken regelmatig alleen als scan geplaatst, waardoor ze niet doorzoekbaar zijn en ontoegankelijk zijn voor mensen met een visuele beperking. Daarnaast ontbreekt duidelijke categorisering: veel documenten worden simpelweg als ‘publicatie’ aangeduid, zonder verdere specificatie van het type of onderwerp. Dit belemmert gerichte zoekopdrachten en maakt belangrijke informatie moeilijk te traceren. Zo zijn er slechts 737 convenanten online te vinden. Zelfs ministeries publiceren ze zelden, en als dat wel gebeurt, is het vaak zonder correcte metadata of duidelijke vind locatie. Dit zorgt ervoor dat deze belangrijke overeenkomsten vrijwel onzichtbaar blijven voor burgers, journalisten en onderzoekers, terwijl ze essentieel zijn voor transparantie en publieke controle — precies wat de Woo zou moeten bevorderen.’
Hoe zijn jullie te werk gegaan om tot een oplossing te komen?
‘Door middel van een combinatie van automatische en handmatige methodes. Via gerichte Google-query's, scraping en handmatige analyse hebben we documenten verzameld van 109 bestuursorganen. Deze documenten zijn vervolgens beoordeeld op hun technische kwaliteit: zijn ze machineleesbaar, bevatten ze metadata en zijn ze correct gecategoriseerd? Een groot deel van het werk bestond uit het herstellen van tekortkomingen in de publicatiepraktijk van overheden. Zo hebben we zelf classificaties toegevoegd en met tekstherkenning gescande documenten toegankelijk gemaakt. Voor convenanten hebben we bovendien automatisch herkend welke organisaties betrokken zijn. Het project is vernieuwend omdat het voor het eerst systematisch drie onderbelichte Woo-documentcategorieën (adviezen, rapporten, convenanten) in kaart brengt en analyseert. De verzamelde adviezen en onderzoeksrapporten zijn via het platform Woogle beschikbaar gemaakt, en de dataset met bijna 3.000 convenanten en 14.549 betrokken partijen is te vinden via DANS Data Station. Deze data is bedoeld voor wetenschappers, journalisten, beleidsmakers en ambtenaren, zodat zij beter inzicht krijgen in hoe overheidsinformatie wordt gedeeld en gebruikt.’
Hoe gaat jullie werk bijdragen aan een beter Woo-proces?
‘Wij hebben concrete hulpmiddelen ontwikkeld om documenten beter toegankelijk te maken. Voor burgers betekent dit onderzoek een betere toegang tot informatie, waardoor zij beter geïnformeerd kunnen deelnemen aan het publieke debat. Voor journalisten en onderzoekers biedt het gestructureerde en doorzoekbare data voor diepgaand onderzoek, bijvoorbeeld naar samenwerkingen tussen overheid en belangenorganisaties. De verwachting is dat de dataset breed gebruikt zal worden, en dat overheidsorganisaties het als voorbeeld gebruiken om hun publicatiepraktijk te verbeteren. Onze bevindingen zijn gedeeld met instanties die verantwoordelijk zijn voor het opstellen van Woo-richtlijnen. Zo kunnen toekomstige documenten beter worden geclassificeerd, van metadata voorzien en digitaal toegankelijk gepubliceerd.’