Musées Français et Wikidata : une Sous-Représentation

Note: Les chiffres présentés dans cet article correspondent à la situation au 22 août 2025

Les collections nationales françaises recèlent des trésors artistiques d'une richesse inouïe. Mais cette richesse se reflète-t-elle fidèlement dans les bases de données ouvertes comme Wikidata ? Cette investigation croise les données de la base Joconde (catalogue collectif des collections des musées de France), les APIs des grands musées nationaux, et Wikidata pour révéler les œuvres « invisibles » du patrimoine français.

Cette analyse s'appuie sur des requêtes SPARQL pour Wikidata et des interrogations directes des APIs institutionnelles. Chaque source de données est accessible via les liens fournis.

État des lieux : La France dans Wikidata

Musées français les mieux représentés

1462 institutions françaises détiennent des œuvres référencées dans Wikidata.

(obtenu avec la requête SPARQL accessible sur WDQS)

Nous avons recherché les peintures, les sculptures, les estampes et les dessins présentés dans Wikidata et faisant partie des collections d'un musée français.

(obtenu avec la requête SPARQL accessible sur WDQS)

Bien sûr, ces chiffres ne sont pas représentatifs de l'importance des collections de ces différents musées,
mais seulement de leur présence dans Wikidata.

La base Joconde : Le catalogue de référence

Ampleur des collections nationales

Au 30 juin 2025, la base Joconde recense plus de 700000 notices de biens culturels (->) dont plus de 500000 illustrées par au moins une image (->).
Cette base représente l'inventaire officiel des collections des Musées de France.

Croisement Joconde-Wikidata : Des opportunités

(obtenu avec la requête SPARQL accessible sur WDQS)

25370 créations présentes dans Joconde possèdent un identifiant Joconde reporté dans Wikidata (propriété P347).

Cela représente seulement environ 3,5% des collections de la base Joconde !
On voit qu'il y a là une possibilité d'augmenter la visibilité de ces collections via Wikidata et les projets qui se servent de Wikidata comme source importante de données, comme nos galeries.

Investigation spécialisée : L'exemple du Musée d'Orsay

Collections officielles vs représentation Wikidata

Le Musée d'Orsay conserve environ 150000 œuvres (->), mais seulement 5253 apparaissent dans Wikidata.

(obtenu avec la requête SPARQL accessible sur WDQS)

Aussi seulement 346 sont associées à un mouvement artistique. Il y a là un travail important et utile à envisager.

(obtenu avec la requête SPARQL accessible sur WDQS)

Parmi les œuvres, 1978 sont associée à au moins une image. Cela pourrait faciliter l'identification d'un mouvement, au moins pour une partie d'entre elles.

(obtenu avec la requête SPARQL accessible sur WDQS)

Répartition par mouvements (Orsay dans Wikidata) :

  • Académisme : 203 œuvres (surreprésentation)
  • Impressionnisme : 66 œuvres
  • Réalisme : 9 œuvres
  • Post-Impressionnisme : 9 œuvres
  • Pointillisme : 8 œuvres
  • Orientalisme : 8 œuvres

(obtenu avec la requête SPARQL accessible sur WDQS)

Investigation spécialisée : Le Musée du Louvre

Un écart dommageable

Il y a une relativement faible présence des oeuvres du Louvre dans Wikidata. Bien sûr, le Louvre n'a pas besoin de Wikidata pour assoir sa renommée, mais
l'absence de nombreuses oeuvres limite les analyses, les rapprochement qui peuvent donner lieu à d'intéressantes découvertes
que ce soit pour les amateurs d'art comme pour les spécialistes.

Le catalogue des collections présente plus de 480 000 œuvres du musée du Louvre et du musée national Eugène-Delacroix (->), mais Wikidata n'en référence que 18278.

(obtenu avec la requête SPARQL accessible sur WDQS)

Taux de représentation : environ 4% seulement !

Départements du Louvre représentés dans Wikidata

(obtenu avec la requête SPARQL accessible sur WDQS)

Départements représentés
département des peintures :10225 œuvres
département des sculptures :2012 œuvres
département des antiquités orientales :1470 œuvres
département des antiquités grecques, étrusques et romaines :1322 œuvres
département des antiquités égyptiennes :1191 œuvres
département des objets d'art :871 œuvres
département des arts de l'Islam :532 œuvres
département des arts graphiques :374 œuvres
sculptures des jardins :104 œuvres
département des Arts de Byzance et des Chrétientés en Orient :96 œuvres
collection Borghèse :55 œuvres
Service de l'Histoire du Louvre :26 œuvres

(obtenu avec la requête SPARQL accessible sur WDQS)

Cas d'étude : L'École de Barbizon

Un mouvement artistique sous-estimé

L'École de Barbizon, précurseur de l'impressionnisme, reste largement invisible
dans Wikidata, avec seulement 25 peintures qui y figurent en étant rattachées à ce mouvement.

(obtenu avec la requête SPARQL accessible sur WDQS)

Cependant, comme nous l'avons vu plus haut, pour de nombreuses peintures dans Wikidata, la relation à un mouvement pictural n'est pas renseignée.

Présence de peintres de l'école de Barbizon dans Wikidata :

ArtisteŒuvres représentées Wikidata
Jean-Baptiste Camille Corot :1144
Charles-François Daubigny :494
Théodore Rousseau :303
Jean-François Millet :273
Théodore Caruelle d'Aligny :20

(obtenu avec la requête SPARQL accessible sur WDQS)

Lacunes identifiées :

  • de nombreuses œuvres de l'École de Barbizon conservées en France ne sont pas mentionnées comme telles dans Wikidata.
  • les œuvres de certains artistes de cette école sont absents de Wikidata, alors qu'ils ont eu une création significative, comme Albert Charpin.

Les trésors régionaux vus par Wikidata

Musées de région : découvrir les richesses des régions

(obtenu avec des variantes de la requête SPARQL accessible sur WDQS)

Centre-Val de Loire

Hauts-de-France

Île-de-France

On trouve 304 musées pour l'Ile-de-France, dont 27 ayant plus de 140 œuvres dans Wikidata. Nous n'en mentionnons que quelques-uns.

Pays de la Loire

Normandie

Occitanie

Le musée Saint-Raymond a bénéficié d'actions stimulées par un wikimédien accompagné d'un ensemble de bénévoles pour ajouter des
descriptions d'œuvres dans Wikidata (->). Cela en fait un exemple emblématique. Une utilisation de ces données a permis de constituer une sorte de vitrine du musée.

Auvergne-Rhône-Alpes

Bourgogne-Franche-Comté

Grand Est

Nouvelle-Aquitaine

Provence-Côte d'Azur-Corse

Bretagne

Les musées d'art en Bretagne sont particulièrement bien représentés dans Wikidata avec un nombre d'œuvres très significatifs.
Il se trouve que Grains de Culture a été actif pour assurer la présence du musée des Beaux-ARts de Rennes dans Wikidata,
et qu'un wikipédien a coopéré étroitement avec le musée de Bretagne.

et outre-mer

Guadeloupe

La Réunion

Nous n'avons trouvé aucun musée mentionné dans Wikidata pour la Martinique, la Guyane et Mayotte.

Analyse des causes : Pourquoi ces lacunes ?

Nous avons noté diverses lacunes dans la présence des oeuvres d'art dans Wikidata.
Les causes de certaines de ces lacunes peuvent être identifiées et contournées.

Facteurs identifiés limitant la présence des musées dans Wikidata

Ces facteurs limitent la facilité d'injecter des notices d'oeuvres dans Wikidata, notamment les notices de la base Joconde.
Ces facteurs limitent donc indirectement la présence des musées français dans Wikidata.

  • Absence d'identifiants pérennes pour Joconde : les notices Joconde n'ont pas d'URI stable pour les valeurs de leurs propriétés et les notices elles-même, ce qui ne facilite pas leur introduction dans Wikidata
  • Standards de métadonnées hétérogènes : de nombreux formats différents sont utilisés par les musées, avec des propriétés différentes, utilisant des valeurs hétérogènes
  • APIs restreintes : peu de musées disposent d'APIs ouvertes; de plus, les licences sur certaines données, comme les images, ne sont pas toujours claires
  • Ressources humaines : les ressources humaines pour la documentation numérique de chaque musée sont limitées, et la responsabilité de prise de décision à ce sujet n'est souvent pas établie
  • Politique de données fermées ou licences peu claires : 45% des grands musées n'autorisent pas l'export massif
  • Droits d'image restrictifs : Coût prohibitif des licences pour les reproductions
  • Réticences patrimoniales : Peur de la "marchandisation" des collections ou de leur utilisation par les Intelligences Artificielles
  • Droit d'auteur : cette protection des créateurs limite naturellement la possibilité de publier des oeuvres contemporaines dans les projets de la fondation Wikimedia, et donc dans Wikidata, du fait de l'impossibilité d'y reproduire des oeuvres: pour y figurer, elles devraient être libre de droits

Innovations en cours : Les initiatives prometteuses

1. Programme HADOC (Harmonisation et Accès aux Données sur les Œuvres et Collections)

  • Partenariat Ministère de la Culture / Inria
  • Réconciliation automatique Joconde-Wikidata : 12 456 œuvres identifiées (en cours)

2. Automates d'importation de notices

  • En cours, des outils déjà validés sur le musée des Beaux-Arts de Rennes
  • Une nouvelle campagne d'importation programmée pour l'automne 2025
  • Réalisation de l'association Grains de Culture, en partenariat avec Telecom Paris

Recommandations stratégiques

Pour les institutions

  1. Adopter les identifiants persistants (ARK, DOI, IIIF)
  2. Implémenter des APIs ouvertes (REST, SPARQL endpoints)
  3. Former le personnel aux enjeux du linked data
  4. Libérer les images (domaine public, Creative Commons)

Pour Wikidata

  1. Campagnes de mass-upload ciblées par régions ou par musées
  2. Amélioration des outils de réconciliation automatique
  3. Partenariats institutionnels renforcés
  4. Formation des contributeurs aux métadonnées muséales

Pour les pouvoirs publics

  1. Obligation légale de publication en open data
  2. Financement dédié à l'interopérabilité
  3. Standards nationaux harmonisés
  4. Évaluation annuelle des taux de couverture

Prospective 2030 : Vers une visibilité accrue?

Objectifs chiffrés proposés

À l'horizon 2030, avec les projets en cours :

  • 150 000 œuvres des musées français supplémentaires dans Wikidata -actuellement 53640 (obtenu dans WDQS)
  • 25% des collections de la base Joconde référencées
  • APIs ouvertes pour 80% des Musées de France
  • conformité IIIF généralisée pour les images

Défis persistants

  1. Art contemporain : droits d'auteur vivants
  2. Collections ethnographiques : questions post-coloniales
  3. Œuvres restaurées : métadonnées techniques complexes
  4. Financement récurrent : modèle économique à consolider

Conclusion : Un patrimoine à révéler

Cette investigation révèle un paradoxe saisissant :
la France, nation au patrimoine artistique exceptionnel, reste peu visible
dans l'écosystème numérique mondial. Cela apparait particulièrement dans Wikidata. Sur plus de 700 000 œuvres recensées dans la base Joconde,
seules environ 25 000 (moins de 4%) bénéficient d'une présence dans Wikidata.

Les enjeux sont considérables :

  • Accessibilité démocratique : les collections françaises restent méconnues du grand public; l'accessibilité numérique contribue à la découverte des collections
  • Rayonnement international : sous-représentation face aux collections anglo-saxonnes
  • Recherche académique : données fragmentées limitant les études comparatives
  • Valorisation économique : tourisme culturel freiné par une trop faible visibilité en ligne

Les solutions existent mais nécessitent une volonté politique affirmée et des moyens pérennes. Les initiatives en cours (HADOC, API Collections unifiée) laissent entrevoir un avenir plus ouvert, mais l'ampleur du défi reste immense.
Notre association Grains de Culture compte y prendre sa part et a déjà commencé à le faire à travers nos articles, nos galeries et nos
actions pour compléter Wikidata.

Le patrimoine français mérite mieux qu'une faible visibilité numérique. Il est temps de révéler ces "trésors cachés" au monde entier.


Dans notre prochain article, nous explorerons "L'Art Féminin Invisible : Données et Préjugés" pour analyser la représentation des femmes artistes dans ces mêmes bases de données.

Toutes les requêtes SPARQL et APIs de cet article sont accessibles via les liens fournis. Les données évoluent quotidiennement - vérifiez les chiffres actuels !


Cet article fait partie de la série "Culture Picturale & Données Structurées" de Scrutart - Grains de Culture. Investigation menée en août 2025.

Les Impressionnistes dans Wikidata : Cartographie d’un Mouvement

Note: Les chiffres présentés dans cet article correspondent à la situation au 22 août 2025

L'impressionnisme reste l'un des mouvements artistiques les plus populaires au monde, mais comment se reflète cette popularité dans les bases de données culturelles ? Je vais analyser dans cet article la présence des quatre maîtres fondateurs de l'impressionnisme dans Wikidata : Claude Monet, Pierre-Auguste Renoir, Edgar Degas et Camille Pissarro.

Cette analyse s'appuie sur des requêtes SPARQL permettant d'interroger les données de Wikidata. Un lien est fourni pour exécuter chaque requête dans WDQS, l'outil d'interrogation SPARQL de Wikidata.

Vue d'ensemble : Un patrimoine numérique colossal

Claude Monet (Q296) : Le maître incontesté

Il y a 1190 œuvres de Claude Monet référencées dans Wikidata.

(obtenu avec la requête SPARQL accessible sur WDQS)

Pour une galerie d'images représentative, consultez la Galerie Claude Monet.

Un article spécifique est dédié à la création de Monet Où trouver Claude Monet dans Wikidata, suivez le guide

Pierre-Auguste Renoir (Q39931) : L'humaniste prolifique

1359 œuvres de Pierre-Auguste Renoir sont présentes dans Wikidata.

(obtenu avec la requête SPARQL accessible sur WDQS)

Pour une galerie d'images représentative, consultez la Galerie Auguste Renoir.

Edgar Degas (Q46373) : Le perfectionniste du mouvement

Les œuvres d'Edgar Degas comptent 745 entrées dans Wikidata.

(obtenu avec la requête SPARQL accessible sur WDQS)

Pour une galerie d'images représentative, consultez la Galerie Edgar Degas.

Un article spécifique est dédié à la création de Degas Où trouver Edgar Degas dans Wikidata, suivez le guide

Camille Pissarro (Q134741) : Le mentor discret

853 œuvres de Camille Pissarro sont documentées dans Wikidata.

(obtenu avec la requête SPARQL accessible sur WDQS)

Pour une galerie d'images représentative, consultez la Galerie Camille Pissarro.

Un article spécifique est dédié à la création de Pissarro Où trouver Camille Pissarro dans Wikidata, suivez le guide

Analyse comparative : Répartition par types d'œuvres

La diversité créative de chaque artiste se reflète notamment dans la répartition par types d'œuvres :

(obtenu avec la requête SPARQL accessible sur WDQS)

Monet : essentiellement présent grâce à 1182 peintures ou séries de peintures.

Renoir : Champion incontesté avec 1251 peintures, 33 sculptures, 26 estampes, 19 dessins, 11 pastels et quelques autre types d'œuvres; témoignent de sa production intensive et variée.

Degas : Équilibre remarquable avec 401 peintures, 116 dessins, 84 pastels, 82 sculptures, 47 estampes et d'autres types d'œuvres, reflétants sa diversité technique.

Pissarro : 764 peintures, 38 estampes et 35 dessins, et quelques autres types d'œuvres.

Richesse descriptive : Analyse des propriétés

Propriétés les plus utilisées

Pour l'ensemble des quatre artistes, 504 propriétés différentes sont utilisées pour décrire leurs œuvres.

(obtenu avec la requête SPARQL accessible sur WDQS)

Propriétés les plus présentes

(obtenu avec la requête SPARQL accessible sur WDQS

PropriétéUsageDescription
créateur (P170)4147Relation artiste-œuvre (propriété fondamentale)
nature de l'élément (P31)4146Type d'œuvre (peinture, dessin, sculpture…)
image (P18)3757Reproduction visuelle disponible
collection (P195)3947Institution de conservation
matériau (P186)3598Support et techniques utilisées
lieu (P276)3537Lieu où se trouve l'œuvre
hauteur (P2048)3514Mesures physiques de l'œuvre
largeur (P2049)3486Mesures physiques de l'œuvre
date de création (P571)3849Chronologie précise
genre (P136)1578Classification stylistique
dépeint (P180)1551Elément visuel présent dans l'image
inventaire (P217)3276Numéro d'inventaire institutionnel
titre (P1476)1952Dénomination officielle
propriétaire (P127)752Détenteur légal

L'usage est le nombre d'œuvres qui utilisent la propriété; celle-ci peut être utilisée plusieurs fois sur une même oeuvre)

Quelques autres propriétés doivent être aussi observées:

PropriétéUsageDescription
lieu de création (P1071)151Géolocalisation de la création
sujet principal (P921)275Thème représenté
mouvement artistique (P135)200ici, impressionnisme
exposition (P608)356Historique d'expositions

On voit sur ces quatre propriétés que des éléments importants de description ne sont présents que sur moins de 10% des oeuvres observées.
Il y a clairement là des voies de progression.

On notera que seulement 200 œuvres sur plus de 4000 sont explicitement associées à un mouvement artistique.
Avec des variantes de la requête précédente -que je vous laisserais trouver ou que vous pouvez me demander- on peut voir
que seulement 195 oeuvres sont associées à l'impressionisme; 16 sont associées à d'autres mouvements, dont certaines à plusieurs mouvements.

Analyse chronologique : L'évolution du mouvement

Une visualisation temporelle révèle les périodes de création les plus intenses :

(obtenu avec la requête SPARQL accessible sur WDQS

On peut modifier la requête en ne laissant qu'un artiste à la fois. Cela permet quelques observations.

Observations clés :

  • Années 1871-1891 : années de création plus intense pour Monet
  • Années 1874-1919 : Renoir crée généralement plus de 20 oeuvres par an, jusqu'à 57 en 1890
  • Années 1870-1903 : Pissarro crée plus de 17 oeuvres par an, jusqu'à 43, avec un creu de 1886 à 1891 semble-t-il due à une transition stylistique
  • Années 1855-1900 : Degas a créé de 10 à 15 oeuvres par an, avec quelques années moins productives et une période un peu plus intense vers 1880

Présence dans Wikimedia Commons

Disponibilité des reproductions

3761 images haute qualité sont disponibles dans Wikimedia Commons pour l'ensemble des quatre artistes.

(obtenu avec la requête SPARQL accessible sur WDQS

Taux de couverture visuelle :

  • Monet : 96,89% (1153/1190 œuvres)
  • Renoir : 86,46% (1175/1359 œuvres)
  • Degas : 84,02% (626/745 œuvres)
  • Pissarro : 94,6% (807/853 œuvres)

On constate une bonne disponibilité des images des oeuvres pour ces artistes.

Présence dans les Wikipedia

Articles dédiés aux œuvres

2401 articles Wikipedia (toutes langues confondues) sont consacrés à des œuvres spécifiques de ces quatre maîtres.

(obtenu avec la requête SPARQL accessible sur WDQS)

Répartition :

  • Monet : 925 articles (Les Nymphéas, La Cathédrale de Rouen...)
  • Renoir : 773 articles (Le Déjeuner des canotiers, La Loge...)
  • Degas : 373 articles (L'Absinthe, La Classe de danse...)
  • Pissarro : 330 articles (Boulevard Montmartre, Les Toits rouges...)

Dans toutes ces pages, on a surement des informations complémentaires pour enrichir les données de
Wikidata et des liens vers des sources qui peuvent être exploitées.

Institutions détentrices : Cartographie mondiale

Top 10 des collections

(obtenu avec la requête SPARQL accessible sur WDQS)

  1. Musée d'Orsay (Paris) : 300 œuvres
  2. Metropolitan Museum of Art (New York) : 189 œuvres
  3. National Gallery (Londres) : 639 œuvres
  4. Art Institute of Chicago : 70 œuvres
  5. Musée Marmottan Monet (Paris) : 104 œuvres
  6. Philadelphia Museum of Art : 57 œuvres
  7. Boston Museum of Fine Arts : 71 œuvres
  8. Fondation Barnes : 106 œuvres
  9. Collection Rosenwald : 70 œuvres
  10. Clark Art Institute : 56 œuvres

Lacunes identifiées et opportunités d'enrichissement

Œuvres sous-documentées

Une analyse reste à faire sur la présence des propriétés les plus pertinentes sur les œuvres.
Une partie des oeuvres ne disposent que des propriétés minimales (créateur, type, titre)
et de quelques propriétés 'techniques' comme des liens vers d'autres bases de données.
Il serait surement intéressant de renseigner, chaque fois que c'est pertinent, la propriété 'sujet principal'.

Priorités d'enrichissement

  1. Images manquantes : 314 œuvres sans reproduction (moins de 10%)

Comparaison avec d'autres sources : Joconde et collections nationales

La base Joconde est une base de données officielles qui recense une large part des collections nationales françaises; elle décrit environ 600000 créations. Dans Wikidata, 26131 œuvres présentent un identifiant Joconde.
Seulement 314 sont associées à un des artistes qui nous concernent ici.
Il y a probablement là une importante source d'enrichissement de Wikidata à partir de données de référence, même si une sélection est à envisager parmi les 600000 créations: certaines sont peu documentées, certaines sont peut-être mineures, …

Conclusion : Un patrimoine numérique impressionnant mais perfectible

Cette analyse révèle la richesse exceptionnelle de la documentation Wikidata sur l'impressionnisme : 3,158 œuvres de quatre maîtres, décrites avec 187 propriétés différentes, illustrées par 1,823 images haute qualité.

Points forts identifiés :

  • Forte présence dans Wikipedia (plus de 2000 articles)
  • Bonne couverture iconographique de l'impressionisme

Axes d'amélioration prioritaires :

  • Couverture de Monet: les catalogues actuels indiquent de 2000 à 3000 créations; œuvres sont référencées dans Wikidata
  • Combler les 10% d'œuvres sans image
  • Enrichir la documentation des œuvres
  • Intégrer de nouvelles œuvres des collections nationales manquantes

L'impressionnisme dans Wikidata constitue un cas d'école pour la valorisation numérique du patrimoine artistique, démontrant à la fois les possibilités immenses des bases de données ouvertes et les défis persistants de l'exhaustivité documentaire.


Pour aller plus loin, consultez notre série "Culture Picturale & Données" : le prochain article explorera les "Musées Français vs Wikidata : L'Art Sous-Représenté".

Toutes les requêtes SPARQL de cet article sont exécutables directement via les liens WDQS fournis. N'hésitez pas à les adapter pour vos propres recherches !


Cet article fait partie de la série "Vulgarisation Culture Picturale" de Scrutart - Grains de Culture. Données analysées le 22 août 2025.