< Terug naar vorige pagina

Project

Naar een KBR Data Science Lab met gebruikmaking van kennis en data-gestuurde kunstmatige intelligentie voor digitalisering, informatica, iconografie en communicatie in de sector cultureel erfgoed (FEDTWIN4)

Het KBR Data Science Lab (DSL) heeft tot doel een samenwerking op lange termijn tot stand te brengen tussen de Koninklijke Bibliotheek van België (KBR) en de onderzoeksgroep Digitale Wiskunde (DIMA) van het Departement Wiskunde en Data Wetenschappen (WIDS) van de Vrije Universiteit Brussel (VUB) inzake onderzoek en ontwikkeling op het gebied van data science, in het bijzonder Artificiële Intelligentie (AI), toegepast opRT-1: Data Science voor bibliotheek informatica en iconografie;RT-2: Data Science voor automatisering/optimalisering van digitalisering workflows in de cultureel erfgoed sector;om de waarde van de enorme hoeveelheid gedigitaliseerde of born-digital collecties in de cultureel erfgoed sector (CHS) te benutten. De toegewijde overheidsinvesteringen in de digitalisering van de collecties van de Federale Wetenschappelijke Instellingen in België bieden onderzoekers en het publiek waardevolle bronnen van erfgoedcollecties (historische maar ook artistieke). Als vlaggenschipproject heeft de digitalisering van de Belgische Pers 1830-1950 door de KBR rijke bronnen opgeleverd in de vorm van documentbeelden van historische kranten. Dit heeft reeds geleid tot het succesvolle gezamenlijke KBR- en DIMA Belspo-project ADOCHS (zie punt 3.8).In de nabije toekomst zal de systematische digitalisering door de KBR van haar collectie van ongeveer 4.500 middeleeuwse codices en haar collectie van ongeveer 1 miljoen prenten en tekeningen een enorme reeks bronnen in termen van iconografie opleveren, die een sterk potentieel vormen voor verder onderzoek binnen de KBR-DSL en voor de ontsluiting van het materiaal.Systematische onderzoeksinspanningen om het potentieel van deze bronnen te benutten, ontbreken echter nog steeds. Enerzijds moet de informatie die in de digitale collecties is opgesloten, nog op zinvolle wijze worden geëxtraheerd, georganiseerd en gemanipuleerd. Het is bijvoorbeeld moeilijk om de digitale collecties semantisch te bevragen (b.v. door automatisch alle nummers van "Le Patriote" op te vragen die verhalen over criminele activiteiten bevatten). Anderzijds moeten nieuwe methoden worden ontwikkeld om bestaande digitaliseringsworkflows te automatiseren/verbeteren. Een voorbeeld hiervan is image quality assessment (IQA), waarbij bestaande IQA-modellen inhoudspecifiek zijn en daarom geen betrouwbare supervisie kunnen bieden aan digitaliseringsprocessen die verschillende soorten beelden of beelden met gemengde inhoud (bv. tekst en foto's van natuurlijke scènes) bevatten. Het doel van de KBR DSL is beide uitdagingen op een systematische manier aan te pakken door gebruik te maken van kennis- en datagestuurde AI. Dit verbindt zowel KBR als DIMA op een wederzijds voordelige manier. Enerzijds zijn de twee onderzoekspaden van de KBR DSL afgestemd op de ontwikkeling en vooruitgang van de bibliotheek. Anderzijds zal DIMA ook veel baat hebben bij de KBR DSL om zijn deskundigheid op het gebied van data science verder te ontwikkelen en bijdragen te leveren, niet alleen aan de ontwikkeling van nieuwe instrumenten voor CHS, maar ook aan het academische veld.De KBR DSL zal een voortzetting zijn van de sterke samenwerking tussen KBR en DIMA (cfr. DSPH-algoritme, punt 3.5) en zal worden ontwikkeld over een periode van 10 jaar. De voortgang van het lab zal in dialoog worden gebracht met belanghebbenden (bv. het KBR Senior Management Team en de digitaliseringsafdeling), domeinexperts (bv. andere CHS & data scientists) en het grote publiek.
Datum:1 nov 2021 →  Heden
Trefwoorden:Data science, Data-driven & knowledge-driven AI, Information harvesting, iconography in libraries, digitization workflows in libraries
Disciplines:Computerwetenschappen