KB-Wiki-Stats-Graphs

Het gebruik van Delpher in Nederlandstalige Wikipedia-artikelen, januari 2025

Olaf Janssen, 15 februari 2025

Dit artikel is ook beschikbaar als PDF.

Logo Wikipedia

Logo Delpher

Delpher biedt toegang tot miljoenen gedigitaliseerde pagina’s uit Nederlandse historische kranten, boeken en tijdschriften. Het is een veelgebruikte bron in de Nederlandstalige Wikipedia. In dit artikel bekijken we hoe vaak er in welke Wikipedia-artikelen verwezen wordt naar Delpher, en welke Delpher-pagina’s het vaakst worden geciteerd. Ook speuren we naar Wikipedia-artikelen die geheel of grotendeels op Delpher zijn gebaseerd.

Er zijn veel Wikipedia-artikelen die (bijna) geheel op basis van Delpher geschreven zijn. Zonder Delpher zou het artikel Vuilnisman niet hebben bestaan.

De belangrijkste punten (per 17 januari 2025) uit dit artikel zijn:

De Nederlandstalige Wikipedia maakt veelvuldig gebruik van informatie uit Delpher om in artikelen te verwerken. Vanuit zo’n lemma wordt dan door middel van één of meerdere URLs terugverwezen naar de gebruikte broninformatie in Delpher. Dit kan bijvoorbeeld een link zijn naar een specifiek krantenartikel, een gedigitaliseerd boek, een bepaalde pagina in een tijdschrift, een hele PDF van een publicatie, of een zoekopdracht in radiobulletins. Laten we een aantal voorbeelden bekijken:

In kranten:

In boeken

Illustratie van een rokende man in een stoel op het strand door Theo Ortmann in het boek Onmaatschappelijke voorkeur van Mary Dorna uit 1938.Illustratie door Theo Ortmann in het boek Onmaatschappelijke voorkeur van Mary Dorna uit 1938. - Bron, publiek domein.

In tijdschriften

In radiobulletins

De structuur van Delpher-URLs

Voordat we een volledige analyse van Delpher-verwijzingen in Wikipedia kunnen maken, is het handig om eerst de structuur van Delpher-URLs beter te begrijpen. Deze kunnen in een aantal logische groepen worden onderverdeeld:

1) Kranten-URLs: dit zijn URLs van krantentitels, -afleveringen, -pagina’s en -artikelen, of van full-text en/of samengestelde zoekopdrachten, PDF’s van afleveringen of de platte tekst (OCR) van een krantenartikel. Dit kun je zien wanneer je de URLs van bovenstaande voorbeelden inspecteert.
Dit materiaal is op Delpher te vinden onder de ingang Kranten 1618-1995 en URLs beginnen typisch met de syntax http(s)://www.delpher.nl/nl/kranten/ maar ook vaak met http(s)://resolver.kb.nl/resolve?urn=. Zie voor uitgebreidere uitleg over deze ‘resolver-syntax’ hierna.

2) Boeken-URLs: dit zijn URLs van boektitels, -pagina’s of -illustraties, of van full-text en/of samengestelde zoekopdrachten, PDF’s van hele boeken of de platte tekst (OCR) van een heel boek. Dit wordt inzichtelijker wanneer je de URLs van bovenstaande voorbeelden inspecteert.
Dit materiaal is op Delpher te vinden onder twee ingangen:

3) Tijdschriften-URLs: dit zijn URLs van tijdschriftentitels, -jaargangen, -afleveringen, -pagina’s en -artikelen, of van full-text en/of samengestelde zoekopdrachten, of PDF’s van afleveringen. Dit kun je zien wanneer je de URLs van bovenstaande voorbeelden inspecteert.
Dit materiaal is op Delpher te vinden onder de ingang Tijdschriften 19e t/m 21e eeuw en URLs beginnen typisch met de syntax http(s)://www.delpher.nl/nl/tijdschriften/ maar ook vaak met http(s)://resolver.kb.nl/resolve?urn=. Zie voor uitgebreidere uitleg over deze ‘resolver-syntax’ hierna.

4) Radiobulletins-URLs: dit zijn URLs van de uitgetypte teksten van radiojournaaluitzendingen van het ANP, van full-text en/of samengestelde zoekopdrachten of van scans (jpg’s) van de typoscripten. Zie de bovenstaande voorbeelden.
Dit materiaal is op Delpher te vinden onder de ingang Radiobulletins (van het ANP) en URLs beginnen typisch met de syntax http(s)://www.delpher.nl/nl/radiobulletins/ of met http(s)://resolver.kb.nl/resolve?urn=anp, waarbij de suffix =anp dan aangeeft dat dit een radiobullettin (van het ANP) betreft. Zie voor uitgebreidere uitleg over deze ‘resolver-syntax’ hierna.

5) Overige URLs (statische pagina’s): dit zijn URLs van de overige pagina’s in Delpher die niet tot één van de vier bovenstaande groepen behoren. Denk daarbij aan de homepage, Wat is Delpher?, Wat zit er in Delpher? of overkoepelende zoekopdrachten in alle materiaalsoorten tegelijk, zoals bv. zoeken naar “Hans Janmaat”.

Duurzaam verwijzen d.m.v. resolver-URLs

Naast die vijf groepen Delpher-URLs die hierboven besproken worden, is er nóg een zeer grote verzameling URLs die naar materialen in Delpher verwijzen. Dit zijn persistente URLs die beginnen met de ‘abstracte resolver-syntax’ http(s)://resolver.kb.nl/resolve?urn=.

De KB heeft een zgn. resolver-service die duurzame, abstracte, materiaalsoortonafhankelijke URLs vertaalt naar bovengenoemde materiaalsoortspecifieke URLs. Zo verwijst bijvoorbeeld de abstracte URL https://resolver.kb.nl/resolve?urn=KBNRC01:000035786:mpeg21:a0014 door naar een krantenartikel met URL https://www.delpher.nl/nl/kranten/view?coll=ddd&identifier=KBNRC01:000035786:mpeg21:a0014

Dit is een duurzame manier van verwijzen, omdat de KB ervoor zorgt dat deze resolver-URLs altijd naar de juiste Delpher-pagina blijven verwijzen, ook als de URL-structuur van Delpher in de toekomst zou veranderen.

In bovenstaand voorbeeld staat de (set)identifier KBNRC01, wat aangeeft dat het om een krantencolllectie gaat, in dit geval het Algemeen Handelsblad, een voorloper van de NRC. Voor haar resolver-service hanteert de KB een groot aantal verschillende (set)identifiers die naar kranten, boeken, tijdschriften of ANP-radiobulletins verwijzen. Via http://services.kb.nl/mdo/oai?verb=ListSets kun je een indruk krijgen van de verschillende (set)identifiers die de KB hanteert met welke materiaalsoorten ze geassocieerd worden.

Naar aanleiding van bovenstaande anekdotische voorbeelden en de uitleg over Delpher-URLs, is het interessant om een complete analyse van verwijzingen naar Delpher in de Nederlandstalige Wikipedia te maken. We krijgen daarmee precies inzicht welke Wikipedia-artikelen hoe vaak naar Delpher verwijzen, en welke Delpher-pagina’s het vaakst worden geciteerd.

Hoe kunnen we alle Delpher-links in Wikipedia systematisch opsporen? Daar biedt Wikipedia een handig hulpmiddel voor, genaamd Externe koppelingen zoeken. Hiermee vind je Wikipedia-pagina’s die een bepaald URL-patroon bevatten. Zo kunt je bijvoorbeeld zoeken naar pagina’s die het patroon https://www.delpher.nl bevatten. Je vindt hierbij niet alleen de reguliere artikelen, maar ook pagina’s in de ‘achterkant’ van Wikipedia, zoals Overleg- en Gebruikerspagina’s.

Je kunt dit op een gelijkwaardige manier ook via de Wikipedia API uitvragen. Hierbij kun je dan meteen filteren op alleen de artikelen (eunamespace=0), waarbij dus (o.a.) Overleg- en Gebruikerspagina’s niet worden meegenomen. Dit doe je met de API-call https://nl.wikipedia.org/w/api.php?action=query&list=exturlusage&eulimit=100&eunamespace=0&format=json&euprotocol=https&euquery=www.delpher.nl. Op een zelfde manier kun je m.b.v. deze API-call alle Wikipedia-artikelen opsporen die een verwijzing naar kranten(artikelen) in bovengenoemde KBNRC01-collectie bevatten, m.a.w. die het patroon resolver.kb.nl/resolve?urn=KBNRC01 bevatten.

Met behulp van dit soort API-calls een stuk Python-code kunnen we alle artikelen in de Nederlandstalige Wikipedia die (één of meer keer) verwijzen naar Delpher opsporen.

De volledige analyse

In februari 2025 hebben we de hele speurtocht volbracht en de ruwe data gepubliceerd. In de rest van dit artikel zullen we met behulp van datavisualisaties de resultaten van deze analyse presenteren.

15.569 verschillende Wikipedia-artikelen bevatten gezamenlijk 45.409 links naar 43.063 verschillende pagina’s in Delpher.

1) Aantal verwijzingen naar Delpher vanuit Wikipedia

Als eerste kijken we hoe vaak er in Wikipedia-artikelen verwezen wordt naar kranten, boeken, tijdschriften, radiobulletins en statische pagina’s in Delpher. Dit laat onderstaande donutgrafiek zien. Zo zien we bijvoorbeeld dat er op 17 januari 2025


Wanneer we iets dieper op de data inzoomen zien we dat er op 17 januari 2025 in totaal 15.569 verschillende Wikipedia-artikelen waren die één of meerdere links naar Delpher bevatten.

Onderstaande grafiek toont de Top 25 van die artikelen. Zo bevat de Lijst van rampen in Nederland maar liefst 182 verwijzingen naar veelal krantenberichten, en het artikel over de Geschiedenis van Feyenoord bevat er 63, tevens meestal naar krantenberichten.


3) Delpher-pagina’s waarnaar het vaakst verwezen wordt vanuit Wikipedia-artikelen

Vervolgens kunnen we ook kijken naar de in totaal 43.063 unieke Delpher-pagina’s waar Wikipedia-artikelen op peildatum 17 januari 2025 naar verwezen.

Voor de goede orde: onder Delpher-pagina’s verstaan we hier o.a.

De staafgrafiek hieronder laat de Top 25 van deze Delpher-pagina’s zien.

Wanneer we de Kranten homepage en Delpher homepage buiten beschouwing laten, dan zien we dat er 13 verschillende Wikipedia-artikelen bestaan die naar de illustratie Afstandsaanduidingen langs Rijkswegen in de Nieuwe Tilburgsche Courant van 12-02-1937 verwijzen. Op de tweede plek staat pagina 2 van de krant Suriname van 02-09-1933, met verwijzingen vanuit 12 artikelen.


4) Wikipedia-artikelen die grotendeels op Delpher gebaseerd zijn

Bij punt 2) hebben we gekeken naar de Wikipedia-artikelen die veel links naar de Delpher bevatten. In het verlengde hiervan is het ook interessant om te onderzoeken of er artikelen bestaan waarin alle, of bijna alle externe koppelingen naar Delpher verwijzen.

Foto van een vuilnisman in Amsterdam die een vuilnisemmer in een vuilniswagen leegt; circa 1930.

Als je bijvoorbeeld kijkt naar het artikel Vuilnisman, dan zie je onderaan dat de Bronnen, noten en/of referenties allemaal naar krantenberichten in Delpher linken. Je zou dus kunnen zeggen dat dit artikel grotendeels op de inhoud van Delpher is gebaseerd, of dat het zijn bestaan dankt aan Delpher als contentleverancier en aan de Wikipedia-gemeenschap die al die stukjes Delpher-krantencontent heeft samengevoegd tot dit artikel.

Hoe kunnen we dit soort artikelen systematisch opsporen? Daarvoor verwijs ik graag naar het artikel Detecting Wikipedia articles strongly based on single library collections uit 2020. Hierin wordt een methode beschreven om Wikipedia-artikelen te vinden die geheel of grotendeels gebaseerd op inhoud uit één online bron, zoals een digitaal krantenarchief met volledige tekst (Delpher), of een digitale tekstbibliotheek zoals de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL).

Samengevat kijken we bij deze methode naar twee parameters:

Om te beoordelen of een artikel grotendeels op Delpher is gebaseerd, hebben we de volgende drempelwaarden gekozen:

Dat levert onderstaande lijst op van 61 artikelen op.


In kolom 3 zien we dat het aantal externe URLs (NrOfExternalUrls ) groter of gelijk is aan de drempelwaarde van 20. De LinkRatio in kolom 4 is de verhouding tussen de waarden in kolommen 2 en 3, en dus steeds groter dan of gelijk aan 0.80.

We zien dat de top 3 gevorm wordt door de artikelen over Jacques Anquetil, Les Grandes Galeries Belges en de Ontstaansgeschiedenis van het Wilhelminakanaal.

Foto van de wielrenner Walter Dalgal in het Splendor-tenue

Voorts zien we dat er meerdere artikelen volledig op Delpher (veelal kranten) gebaseerd zijn (LinkRatio=1.00):

Het eerder genoemde artikel uit 2020 bevat een vergelijkbaar overzicht van 193 Wikipedia-artikelen die geheel of grotendeels op Delpher gebaseerd zijn. Destijds zijn de volgende drempelwaarden gekozen: Number of external links >= 6 , Link ratio >= 0.75. Dit leverde een stuk bredere artikelselectie op dan met de nu gehanteerde drempelwaarden van 20 en 0.80. Het is interessant - en tevens een oefening voor de lezer - om de overeenkomsten en verschillen te zoeken tussen die tabel en de lijst van 61 artikelen hierboven.

Ruwe data

Alle data gebruikt voor de visualisaties en analyses in dit artikel is beschikbaar op Github. Je kunt het Excel-bestand ook direct downloaden.

Vergelijkbaar artikel over DBNL en Wikipedia

Screenshot van het artikel 'Het gebruik van DBNL in Nederlandstalige Wikipedia-artikelen, september 2024' op Github.

In januari 2025 publiceerden we een soortgelijk artikel getiteld Het gebruik van DBNL in Nederlandstalige Wikipedia-artikelen, september 2024. Hierin bekijken we hoe vaak er in welke Wikipedia-artikelen verwezen wordt naar de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL), en welke DBNL-pagina’s het vaakst worden geciteerd. Ook speuren we naar Wikipedia-artikelen die geheel of grotendeels op de DBNL zijn gebaseerd.

Over de auteur

Afbeelding van Olaf Janssen in Tel Aviv in 2018.

Logo van de KB, de nationale bibliotheek van Nederland

Olaf Janssen is de Wikimedia-coördinator van de KB, de nationale bibliotheek van Nederland. Hij draagt bij aan Wikipedia, Wikimedia Commons en Wikidata als Gebruiker:OlafJanssen. ORCID: 0000-0002-9058-9941.

Hergebruik van dit artikel

De tekst van dit artikel is vrijgegeven onder de Creative Commons Naamsvermelding CC-BY 4.0 licentie.
Logo van de CC-BY licentie

Citatie: Janssen, O.D. (2025). ‘Het gebruik van Delpher in Nederlandstalige Wikipedia-artikelen, januari 2025’. Zenodo, 15 februari 2025. https://doi.org/10.5281/zenodo.14825756.

Naamsvermelding: KB, nationale bibliotheek van Nederland / Olaf Janssen, CC-BY 4.0

Identifiers en URLs van dit artikel

Persistent:

Niet-persistent: