KB-Wiki-Stats-Graphs

Het gebruik van DBNL in Nederlandstalige Wikipedia-artikelen, september 2024

Olaf Janssen, 31 januari 2025

Dit artikel is ook beschikbaar als PDF.

Logo Wikipedia

Logo DBNL

De Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) is een veelgebruikte bron in de Nederlandstalige Wikipedia. In dit artikel bekijken we hoe vaak er in welke Wikipedia-artikelen verwezen wordt naar de DBNL, en welke DBNL-pagina’s het vaakst worden geciteerd. Ook speuren we naar Wikipedia-artikelen die geheel of grotendeels op de DBNL zijn gebaseerd.

De belangrijkste punten (per 5 september 2024) uit dit artikel zijn:

De Nederlandstalige Wikipedia maakt veelvuldig gebruik van informatie uit de DBNL om in artikelen te verwerken. Vanuit zo’n lemma wordt dan door middel van één of meerdere URLs terugverwezen naar de gebruikte broninformatie in de DBNL. Dit kunnen bijvoorbeeld links zijn naar een profiel van een auteur, naar een gedigitaliseerd boek of naar een specifieke artikel in een tijdschrift. Een aantal voorbeelden:

Illustratie van hoe informatie uit de DBNL verwerkt wordt in de Nederlandstalige Wikipedia.
Illustratie van hoe informatie uit de DBNL verwerkt wordt in de Nederlandstalige Wikipedia. Screenshot november 2024. Zie de tekst hierboven voor nadere uitleg. (Klik voor vergroting).
Licentie beeld: CC-BY-SA 4.0 / Olaf Janssen, KB nationale bibliotheek.

Vijf hoofdgroepen van DBNL-verwijzingen

Als we deze diverse soorten verwijzingen in Wikipedia proberen te groeperen, komen er vijf hoofdgroepen naar voren:

1) Auteurs

Screenshot van het Nederlandstalige Wikipedia-artikel over de Nederlandse auteur Albert_Verwey (1865–1937)

De meest voorkomende verwijzingen zijn die naar DBNL-auteurspagina’s, bijvoorbeeld die van Albert Verwey. Dit soort pagina’s bevat typisch overzichten van oorspronkelijke publicaties, teksten en vertalingen van de auteur, biografieën en secundaire literatuur over de auteur, of brieven die geschreven of ontvangen zijn door de auteur. Als we kijken naar het Wikipedia-artikel over Albert Verwey, dan zien we dat er op drie plaatsen naar zijn DBNL-auteurspagina wordt verwezen:

a) Onder de portretfoto staat een link genaamd Dbnl-profiel. Als we in de broncode van het artikel kijken, dan zien we dat deze link wordt gemaakt met behulp van het Sjabloon:Infobox auteur, waar in het veld dbnl de waarde verw008 is ingevuld.

b) In de lijst onder Externe links staat de regel Biografieën, werken en teksten bij de Digitale Bibliotheek voor de Nederlandse Letteren (dbnl). Deze regel wordt gemaakt met behulp van het Sjabloon:Link dbnl auteur, waarin de waarde id=verw008 is ingevuld.

c) Helemaal onderaan het artikel staat een uitklaplijst met Bibliografische informatie. Als je deze openklapt, zie je daar een lijst met identifiers van Verwey in allerlei (bibliografische) databases en websites, waaronder de DBNL, met als waarde verw008. Deze lijst wordt gegenereerd door het Sjabloon:Bibliografische informatie, dat op zijn beurt weer gebruik maakt van de Module:Authority control. Hierin zit een stukje code dat de URL naar de DBNL-auteurspagina van Verwey genereert.

Bij al deze sjablonen wordt de waarde verw008 uit het Wikidata-item over Albert Verwey gehaald.

Het voordeel van het gebruik van deze sjablonen is dat ze zorgen voor een uniforme opmaak van artikelen over auteurs en andere personen die in de DBNL voorkomen.

2) Teksten

De tweede grote groep van verwijzingen in Wikipedia zijn die naar specifieke teksten in DBNL, zoals boeken, tijdschrfiten, artikelen, biografieën, gedichten, toneelstukken of brieven. Deze teksten zitten niet alleen op auteursniveau in bovengenoemde Biografieën, werken en teksten bij de Digitale Bibliotheek voor de Nederlandse Letteren (dbnl), maar kunnen ook elders in een artikel gebruikt worden. Bijvoorbeeld in het notenapparaat, zoals bij bovengenoemde gedigitaliseerde DBNL-boeken in het artikel over Geertruida Bosboom-Toussaint.

Cover van het boek: Geschiedenis van de techniek in Nederland. De wording van een moderne samenleving 1800-1890. Deel I

3) Titels

De beschikbare titels in DBNL varieren van proza, bloemlezingen en poezië, via naslagwerken, jeugdliteratuur of drama, tot brieven, toneelstukken en essays, en nog veel meer. Zo zien we bijvoorbeeld in het artikel over Jacob van Lennep verwijzingen naar de titels Dagboek van mijne reis uit 1823, Elizabeth Musch (3 delen) uit 1850-1851, Zeemansliedtjens uit 1852, Zeemans-woordenboek uit 1856, De vermakelijke spraakkunst uit 1865 en De lotgevallen van Klaasje Zevenster uit 1866.

Maar ook buiten de context van letterkundige auteurs of teksten kunnen DBNL-titels in Wikipedia voorkomen. Zo wordt in het artikel Lijst van vaktermen in de vestingbouwkunde verwezen naar het Militair woordenboek van H.M.F. Landholt uit 1861-1862. En in het artikel over Techniekgeschiedenis wordt verwezen naar Geschiedenis van de techniek in Nederland uit 1992-1995.

4) Resultaten van zoekacties

Soms wil een schrijver van een Wikipedia-artikel weten waar in de DBNL een bepaalde zoekterm voorkomt. Kijk bijvoorbeeld naar het artikel over de 17eeuws Amsterdamse boekdrukker Tymon Houthaeck. Dit bevat helemaal onderaan, onder het kopje Literatuur, een verwijzing naar de zoekvraag in welke titels en teksten in de DBNL de frase “Amsterdamse boekhandel” voorkomt.

5) Overige pagina’s

De laatste groep verwijzingen zijn die naar de overige pagina’s van de DBNL, zoals de homepage, Over DBNL, de Basisbibliotheek, de letterkundige collecties over Friesland, Limburg, Suriname en Zuid-Afrika, of de DBNL-atlas.

Zo bevat het Wikipedia-artikel over de Belgische schrijver Paul Verrept een verwijzing naar een overzicht van auteurs die in de Vlaamse plaats Deurne geboren danwel overleden zijn. Of kijk bijvoorbeeld naar de Lijst van rederijkerskamers, dat artikel leunt sterk op de alfabetisch lijst van Vlaamse, Frans-Vlaamse, Brabantse, Limburgse en Nederlandse rederijkerskamers uit de DBNL.

Naar aanleiding van bovenstaande anekdotische voorbeelden, is het interessant om een complete analyse van verwijzingen naar de DBNL in de Nederlandstalige Wikipedia te maken. We krijgen daarmee precies inzicht welke Wikipedia-artikelen hoe vaak naar de DBNL verwijzen, en welke DBNL-pagina’s het vaakst worden geciteerd.

Hoe kunnen we alle DBNL-links in Wikipedia systematisch opsporen? Daar biedt Wikipedia een handig hulpmiddel voor, genaamd Externe koppelingen zoeken. Hiermee vind je Wikipedia-pagina’s die een bepaald URL-patroon bevatten. Zo kunt je bijvoorbeeld zoeken naar pagina’s die het patroon www.dbnl.org bevatten. Je vindt hierbij niet alleen de reguliere artikelen, maar ook pagina’s in de ‘achterkant’ van Wikipedia, zoals Overleg- en Gebruikerspagina’s.

Je kunt dit op een gelijkwaardige manier ook via de Wikipedia API uitvragen. Hierbij kun je dan meteen filteren op alleen de artikelen (eunamespace=0), waarbij dus (o.a.) Overleg- en Gebruikerspagina’s niet worden meegenomen. Dit doe je met de API-call https://nl.wikipedia.org/w/api.php?action=query&list=exturlusage&eulimit=100&eunamespace=0&format=json&euprotocol=https&euquery=www.dbnl.org.

Met behulp van dit soort API-calls een stukje Python-code kunnen we alle artikelen in de Nederlandstalige Wikipedia die (één of meer keer) verwijzen naar http(s)://*.dbnl.org|.nl opsporen.

De volledige analyse

Begin september 2024 hebben we deze speurtocht uitgevoerd en de ruwe data gepubliceerd. De vijf artikelen die verwijzen naar dbnl.be zijn hierbij niet meegenomen, omdat de auteur toen niet op de hoogte was van het bestaan van dit domein.

In de rest van dit artikel zullen we met behulp van vier datavisualisaties de resultaten van deze analyse presenteren.

1) Aantal verwijzingen naar DBNL vanuit Wikipedia

Als eerste kijken we hoe vaak er in Wikipedia-artikelen verwezen wordt naar pagina’s in de eerder genoemde DBNL-groepen. Dit laat onderstaande donutgrafiek zien. Deze visualisatie onderscheidt vier (niet: vijf) hoofdcategorieën:

1) Auteurs (rood): Deze bevat de URLs van DBNL-auteurspagina’s. In deze URLs komt het patroon /auteurs/ voor, typisch met de syntax www.dbnl.org/auteurs/auteur.php?id=. Komt overeen met de hierboven genoemde groep 1) Auteurs.

2) Teksten (groen): Deze bevat de URLs van specifieke teksten in DBNL. In deze URLs komt het patroon /tekst/ voor, typisch met de syntax www.dbnl.org/tekst/. Komt overeen met de hierboven genoemde groep 2) Teksten.

3) Titels (lichtblauw): Deze bevat de URLs van DBNL-titels. In deze URLs komt het patroon /titels/ voor, typisch met de syntax www.dbnl.org/titels/titel.php?id=. Komt overeen met de hierboven genoemde groep 3) Titels.

4) Overige (donkerblauw): Deze bevat de URLs van de overige pagina’s in de DBNL, bijvoorbeeld die met zoekresultaten of de homepage. In deze URLs komen o.a. de patronen /zoeken/zoekeninteksten/, /letterkunde/, /atlas/ of /overdbnl/ voor. Is een samenvoeging van de hierboven genoemde groepen 4) Resultaten van zoekacties en 5) Overige pagina’s. Het aantal URLs in deze groepen was te klein om ze elk een eigen segment in de donut te geven, dus zijn ze samengevoegd tot één segment.

Zo zien we bijvoorbeeld dat er (op 5 september 2024)


Wanneer we iets dieper op de data inzoomen zien we dat er op 5 september 2024 in totaal 18.458 verschillende Wikipedia-artikelen waren die één of meerdere links (URLs) naar de DBNL bevatten.

Onderstaande grafiek toont de Top 20 van die artikelen. Zo bevatte De groote schouburgh der Nederlantsche konstschilders en schilderessen maar liefst 442 verwijzingen, en het artikel over Israël Querido bevatte er 23.


3) DBNL-pagina’s waarnaar het vaakst verwezen wordt vanuit Wikipedia-artikelen

Vervolgens kunnen we ook kijken naar de in totaal 27.875 unieke DBNL-pagina’s waar Wikipedia-artikelen op peildatum 5 september 2024 naar verwezen. De staafgrafiek hieronder laat de Top 20 van deze DBNL-pagina’s zien.

De inhoudsopgave van het Algemeen letterkundig lexicon staat met verwijzingen vanuit 229 Wikipedia-artikelen bovenaan deze lijst, terwijl er bijvoorbeeld in 17 artikelen verwezen wordt naar het lemma over de taekwondo-grootmeester Eric Lie in het derde deel van Onze sporthelden van Guno Hoen uit 1999.


4) Wikipedia-artikelen die grotendeels op DBNL gebaseerd zijn

Bij punt 2) hebben we gekeken naar de Wikipedia-artikelen die veel links naar de DBNL bevatten. In het verlengde hiervan is het ook interessant om te onderzoeken of er artikelen bestaan waarin alle, of bijna alle externe koppelingen naar de DBNL verwijzen.

Als je bijvoorbeeld kijkt naar het artikel over de Nederlandse uitgeverij C.A.J. van Dishoeck, dan zie je dat de bronvermeldingen onderaan vrijwel allemaal naar de DBNL linken. Je zou dus kunnen zeggen dat dit artikel grotendeels op de inhoud van de DBNL is gebaseerd, of dat het zijn bestaan dankt aan de DBNL als contentleverancier en aan de Wikipedia-gemeenschap die al die stukjes DBNL-content heeft samengevoegd tot dit artikel.

Hoe kunnen we dit soort artikelen systematisch opsporen? Daarvoor verwijs ik graag naar het artikel Detecting Wikipedia articles strongly based on single library collections uit 2020. Hierin wordt een methode beschreven om Wikipedia-artikelen te vinden die geheel of grotendeels gebaseerd op inhoud uit één online bron, zoals een digitaal krantenarchief met volledige tekst (bv. Delpher) of een digitale tekstbibliotheek zoals de DBNL.

Samengevat kijken we bij deze methode naar twee parameters:

Om te beoordelen of een artikel grotendeels op de DBNL is gebaseerd, hebben we de volgende drempelwaarden gekozen:

Dat levert onderstaande lijst op van 17 artikelen op.


In kolom 3 zien we dat het aantal externe URLs (NrOfExternalUrls ) groter of gelijk is aan de drempelwaarde van 6. De LinkRatio in kolom 4 is de verhouding tussen de waarden in kolommen 2 en 3, en dus steeds groter dan 0.75.

We zien dat het artikel over De groote schouburgh der Nederlantsche konstschilders en schilderessen alleen maar DBNL-URLs bevat, evenals dat over Jozef van Walleghem en dat over Drogon, de debuutroman van Arthur van Schendel.

Het artikel uit 2020 bevat een vergelijkbaar overzicht van 54 Wikipedia-artikelen die geheel of grotendeels op DBNL gebaseerd zijn. Destijds zijn de volgende drempelwaarden gekozen: Number of external links >= 4 , Link ratio >= 0.7. Het is interessant - tevens een oefening voor de lezer - om de overeenkomsten en verschillen te zoeken tussen die tabel en de lijst van 17 artikelen hierboven.

Ruwe data

Alle data gebruikt voor de visualisaties en analyses in dit artikel is beschikbaar op Github. Je kunt het Excel-bestand ook direct downloaden.

Bijbehorende presentatie

Screenshot van de openingsdia van een presentatie met de titel 'Wat betekenen DBNL en Wikipedia voor elkaar?', ter gelegenheid van de viering van 25-jarige bestaan van de DBNL op 8 november 2024.

Dit dataverhaal is gebruikt in de presentatie Wat betekenen DBNL en Wikipedia voor elkaar? tijdens de viering van 25-jarige bestaan van de DBNL op 8 november 2024. Deze presentatie is beschikbaar op Zenodo en Wikimedia Commons.

Vergelijkbaar artikel over Delpher en Wikipedia

Screenshot van het artikel 'Het gebruik van Delpher in Nederlandstalige Wikipedia-artikelen, januari 2025' op Github.

In februari 2025 publiceerden we een soortgelijk artikel getiteld Het gebruik van Delpher in Nederlandstalige Wikipedia-artikelen, januari 2025. Hierin bekijken we hoe vaak er in welke Wikipedia-artikelen verwezen wordt naar Delpher, en welke Delpher-pagina’s het vaakst worden geciteerd. Ook speuren we naar Wikipedia-artikelen die geheel of grotendeels op Delpher zijn gebaseerd.

Over de auteur

Afbeelding van Olaf Janssen in Tel Aviv in 2018.

Logo van de KB, de nationale bibliotheek van Nederland

Olaf Janssen is de Wikimedia-coördinator van de KB, de nationale bibliotheek van Nederland. Hij draagt bij aan Wikipedia, Wikimedia Commons en Wikidata als Gebruiker:OlafJanssen. ORCID: 0000-0002-9058-9941.

Hergebruik van dit artikel

De tekst van dit artikel is vrijgegeven onder de Creative Commons Naamsvermelding CC-BY 4.0 licentie.
Logo van de CC-BY licentie

Citatie: Janssen, O.D. (2025). ‘Het gebruik van DBNL in Nederlandstalige Wikipedia-artikelen, september 2024’. Zenodo, 31 januari 2025. https://doi.org/10.5281/zenodo.14779865.

Naamsvermelding: KB, nationale bibliotheek van Nederland / Olaf Janssen, CC-BY 4.0

Identifiers en URLs van dit artikel

Persistent:

Niet-persistent: