Alignement et enrichissement des données de l’inventaire d’un fonds d’archives en Linked Open Data: le cas du Montreux Jazz Digital Project
DOI :
https://doi.org/10.55790/journals/ressi.2019.e2005Mots-clés :
Montreux Jazz Digital Project, Alignement, Linked Open Data, Wikidata, Collaborative Knowledge GraphRésumé
L’évaluation du fonds des archives audiovisuelles du Montreux Jazz Digital Project (MJDP) a permis d’établir une liste de critères quantifiables et non quantifiables, en vue du transfert d’un jeu de données vers un collaborative knowledge graph. 5 critères différents sur les 27 initialement envisagés ont été appliqués avec succès sur ce fonds. Le volume des jeux de données transférables représente 5% des tables du modèle de données de la base de données relationnelle du MJDP.
La preuve de concept présentée a été adaptée, à partir d’un exemple similaire décrit dans la littérature. Les résultats obtenus ont souligné l’importance de la qualité des données et du facteur humain dans l’alignement vers Wikidata en Linked Open Data (LOD). Les identifiants de propriétés Wikidata ont permis d’effectuer une recherche fédérée vers d’autres bases de données musicales. Les limitations introduites par les outils client/serveur employés pour l’alignement ont montré l’incidence d’une recherche approximative et exacte sur les résultats de recherche.
The evaluation of the Montreux Jazz Digital Project (MJDP) audiovisual archive establishes a list of quantifiable and non-quantifiable criteria for select and transfer data sets to a collaborative knowledge graph. 5 different criteria among the 27 initially planned were successfully applied to the archive. The volume of transferable data sets concerns 5% of the data model of the MJDP relational database tables.
The proof of concept has been adapted from an example previously described in the literature. The results show the impact of data quality and human factor in a successful alignment to Wikidata with Linked Open Data (LOD). Wikidata’s identifiers of properties has been used in a federated search to external music databases. The limitations introduced by client/server tools during the alignment show the impact of an approximate search in comparison with accurate search on results.

