Het Ministerie van Volksgezondheid, Welzijn en Sport heeft DNV gevraagd een systeem te ontwikkelen waarmee automatisch de juiste trefwoorden aan de documenten worden toegekend. Om daarmee tot een aanzienlijke verbetering van zoekresultaten te komen op Minvws.nl, de website van het ministerie.

15.000 documenten
De website Minvws.nl is de afgelopen jaren hard gegroeid, zowel het aantal documenten als ook de diversiteit ervan. Momenteel zijn er zo’n 15.000 documenten geplaatst op de site, variërend van kamerstukken en speeches tot nieuws- en persberichten. Dagelijks worden tientallen nieuwe stukken geplaatst. Veel van deze stukken moeten binnen 15 minuten na de officiële publicatie op de website terug te vinden zijn.
Lastig te vinden
Bezoekers van de website gaven aan dat het lastig was om informatie op de website te vinden. Zoekvragen leverden teveel of juist te weinig resultaten op. En als men op zoek was naar specifieke documenten, waren deze moeilijk te lokaliseren. Men stelde vast dat de gebruikte full-text zoekmethode tekort schoot. En dat het noodzakelijk was om trefwoorden aan documenten toe te kennen die overeenstemden met de zoektermen van de verschillende gebruikersgroepen.
Tijdrovend
De mogelijkheid tot het toekennen van trefwoorden was reeds aanwezig. Echter, als gevolg van de grote diversiteit aan onderwerpen en het ontbreken van een standaard woordenlijst, was er een grote variëteit in de trefwoorden die aan documenten werden toegekend. Tevens maakte het tijdrovende karakter van de taak, dat trefwoorden in steeds mindere mate toegekend werden. Er diende gezocht te worden naar een werkwijze waarbij op een makkelijke wijze (liefst automatisch) eenduidige trefwoorden aan alle documenten toegekend worden.
Aanpak
Allereerst is geïnventariseerd hoe de bezoekers van de website hun informatie proberen te vinden. Op basis van deze analyse is inzichtelijk gemaakt welke zoektermen worden gebruikt. De zoektermen zijn, in combinatie met delen van de reeds beschikbare VWS-thesaurus, gebundeld tot een taxonomie. Deze taxonomie vormt de verzameling van standaard trefwoorden die toegekend kunnen worden aan documenten.
Selectietraject
Vervolgens is een selectietraject gestart voor de aanschaf van een software tool dat automatisch documenten kan classificeren en van trefwoorden kan voorzien. De geselecteerde tool is getraind met voorbeelddocumenten waardoor het systeem leert welke (combinatie van) trefwoorden uit de taxonomie aan documenten moet worden toegekend. De getrainde classificatietool is geïntegreerd met het bestaande redactiesysteem van de website.
Optimaliseren
Als laatste is de gebruikte zoekmachine op de website uitvoerig geanalyseerd en volledig geoptimaliseerd.
Het resultaat
Het toekennen van trefwoorden aan nieuwe documenten is volledig geïntegreerd in het bestaande redactieproces. Bij het invoeren van een nieuw document, geeft de classificatiesoftware een voorstel voor de toe te kennen trefwoorden. Een internetredacteur kan nu volautomatisch, op een snelle en consistente wijze, elk document voorzien van de juiste trefwoorden. Tevens zijn alle reeds gepubliceerde documenten automatisch van sleutelwoorden voorzien.
Zoekresultaten aanzienlijk verbeterd
De classificatiesoftware, in combinatie met de taxonomie, wordt onderhouden door een klein team van redacteuren en documentatiespecialisten, waardoor de kwaliteit van de trefwoorden èn classificatie gewaarborgd blijft. In combinatie met het optimaliseren van de zoekmachine zijn de zoekresultaten op de website aanzienlijk verbeterd.
