Wikisage is op 1 na de grootste internet-encyclopedie in het Nederlands. Iedereen kan de hier verzamelde kennis gratis gebruiken, zonder storende advertenties. De Koninklijke Bibliotheek van Nederland heeft Wikisage in 2018 aangemerkt als digitaal erfgoed.
- Wilt u meehelpen om Wikisage te laten groeien? Maak dan een account aan. U bent van harte welkom. Zie: Portaal:Gebruikers.
- Bent u blij met Wikisage, of wilt u juist meer? Dan stellen we een bescheiden donatie om de kosten te bestrijden zeer op prijs. Zie: Portaal:Donaties.
CLARIAH
CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is een gedistribueerde onderzoeksinfrastructuur voor de geestes- en sociale wetenschappen. Onderzoekers kunnen via de CLARIAH infrastructuur toegang krijgen tot grote verzamelingen digitale data en tot innovatieve en gebruiksvriendelijke applicaties voor de verwerking van deze data. Zowel de data als de applicaties zullen duurzaam worden beheerd, zodat ze ook in de toekomst van nut kunnen zijn voor wetenschappers: van letterkundigen, historici en archeologen tot taalkundigen, spraaktechnologen en mediawetenschappers.
Achtergrond
De toenemende mogelijkheden van software om "iets te kunnen" met uitingen van menselijke creativiteit (teksten, spraak, tekeningen, video's, schilderijen, etc.) en het beschikbaar komen van steeds meer en betere digitale bronnen, leidde er in 2007 toe om een infrastructuur voor de geesteswetenschappen te maken. Het doel was:
- het bij elkaar brengen en zichtbaar maken van beschikbare data en het standaardiseren van de metadata om het gebruik van te vereenvoudigen.
- het ontwikkelen en/of beschikbaar maken geavanceerde software om met data van en voor geesteswetenschappelijk onderzoek te kunnen werken. Voorbeelden hiervan zijn Automatische Spraakherkenning (ASR) om Oral History onderzoekers te helpen bij het ontsluiten van hun interviews of Named Entity Recognition (NER) om entiteiten in geschreven of gesproken content te vinden.
Anders dan bij veel onderzoekers uit de bètawetenschappen is het verzamelen en bewerken van data, het schrijven van software om iets met die data te doen, en het publiceren van de resultaten, iets dat door veel verschillende (soorten van) mensen wordt gedaan. De beschikbaarheid van steeds meer digitale data (gedigitaliseerd of born-digital) en de aanwezigheid van (dikwijls op AI en BigData gebaseerde) software maakt de aanwezigheid van een infrastructuur zoals CLARIAH mogelijk en gewenst.
Gerelateerde projecten
Het project CLARIAH-CORE (2015-2018) is de opvolger van het CLARIN-NL (2009-2015) programma. Het ontwerpt, implementeert en exploiteert het Nederlandse deel van de Europese CLARIN- en DARIAH infrastructuren. De wensen van de toekomstige gebruikers staan hierbij centraal. Workshops, summerschools en demonstrators laten zien welke onderzoeksmogelijkheden de beschikbare data en tools bieden en vergroten zo de betrokkenheid van de beoogde gebruikers.
CLARIAH staat op NWO’s Nationale Roadmap Grootschalige Onderzoeksfaciliteiten. Na het CLARIAH-SEED project (2013-2014) is het CLARIAH-CORE project gehonoreerd met 12.6 M€.
Focus gebieden
CLARIAH richt zich op drie focusgebieden die functioneren als voorloper voor andere disciplines binnen de geesteswetenschappen. Samen vertegenwoordigen zij de belangrijkste datatypes: tekst, beeld, audiovisueel materiaal en gestructureerde data (databases). De drie focusgebieden zijn:
Taalkunde Sociaal-economische geschiedenis Mediastudies
Werkwijze
In elk gebied werken multidisciplinaire teams van onderzoekers, infrastructuurspecialisten en databeheerders samen om bestaande data en applicaties te cureren, te verrijken en aan elkaar te koppelen.
Hoewel CLARIAH (2015-2019) zich richt op deze drie focusgebieden, kunnen ook andere disciplines uit zowel de geestes- als de sociale wetenschappen participeren. Zij kunnen hun data en applicaties in CLARIAH inbrengen en bij het uitvoeren van hun taak.
Duurzame opslag
De data en applicaties worden beheerd en duurzaam opgeslagen bij de verschillende Nederlandse CLARIN/CLARIAH centra. Op dit moment zijn dat de volgende centra:
Betrekken van gebruikers
Een belangrijk onderdeel van CLARIAH is het betrekken van zoveel mogelijk onderzoekers uit de geesteswetenschappen (en sociale Wetenschappen) die gebruik kunnen en willen maken van de beschikbare digitale data en tools. Deze betrokkenheid wordt gestimuleerd via cursussen, workshops en demonstratiebijeenkomsten om te laten zien wat er allemaal kan, hoe het werkt en hoe de onderzoeker er mee aan de slag zou kunnen gaan. Tegelijkertijd wil CLARIAH graag van de onderzoekers horen waar zij behoefte aan hebben, tegen welke problemen ze aanlopen en wat ze nog missen in de reeds bestaande applicaties.