Prototypage rapide d’entités Wikidata

W

ikidata est un projet puissant, mais pour pouvoir en profiter, il faut le remplir. Bien sûr, il est possible d’ajouter des données à la main directement sur le site : ça fonctionne sans souci mais que faire quand on a plusieurs dizaines d’entrées ? Plusieurs centaines ? Avec le temps, quelques outils ont vu le jour permettant d’automatiser un peu ce processus, comme l’indispensable QuickStatements ; là encore, il faut bien lui fournir les données qu’il mange et tout ceci est parfois bien fastidieux. Est-ce qu’on ne peut pas aller plus loin ?

Une entrée wikidatienne sur un être humain, par exemple, possède des champs plus ou moins codifiés :

  • Une nature de l’élément égal à Q5, « être humain »
  • Un genre (masculin, féminin, etc.)
  • Une date et un lieu de naissance
  • Une date et un lieu de décès
  • Un pays de nationalité
  • Une occupation
  • Un prénom et un nom de famille

Toutes ces propriétés ne se rencontrent pas à chaque fois et on peut en rajouter d’autres, mais est-ce que ça ne serait pas intéressant d’avoir une sorte de formulaire où on se contenterait de remplir les cases correspondantes, histoire de créer rapidement un squelette d’entité Wikidata ? Pour voir, j’ai codé l’utilitaire « human » : vous mettez ce qu’il faut dans les champs, vous appuyez sur le bouton et il produit le code à destination de QuickStatements. J’ai le sentiment qu’on peut ainsi gagner du temps et on n’oublie rien.

Histoire d’aller un peu plus loin, je me suis penché sur la base Joconde, qui a le goût d’être remplie avec pas mal de soin. J’en ai sorti un autre utilitaire, baptisé Joconde parce que je suis un gars avec une imagination débordante. Sa fonction : parser une fiche Joconde, en retirer les champs qui vont bien (titre, auteur, sujets représentés, etc.) et présenter le résultat dans un formulaire pour correction avant envoi à QuickStatements. Les champs corrigés sont stockés en base, histoire que si l’utilitaire puisse ressortir la correction s’il retombe dessus (comme ça, « MONET Claude » est automatiquement corrigé en « Claude Monet, peintre français, Q296 »). On y gagne du temps.

Personnellement, je pense que cette idée de formulaires pré-remplis est à creuser, pour Wikidata. Qu’en pensez-vous ?

PS : j’imagine que mon outil pour Joconde doit enfreindre des milliers de lois, de licences et de copyrights. Je laisse le soin aux Wikimédiens que ça intéresse de discuter de la chose et de décider s’il faut supprimer toutes mes contributions. Prévenez-moi juste du résultat final.

(Image d’en-tête : détail de La Joconde, par Léonard de Vinci (domaine public))

Mise à jour du 28 septembre 2016 : j’ai placé le code des outils en question sur GitHub : https://github.com/PoulpyFR. Bien sûr, c’est codé n’importe comment et pas commenté. 🙂

12 réflexions au sujet de « Prototypage rapide d’entités Wikidata »

  1. J’en pense qu’on en parlait hier sur le chan de Wikidata et qu’il y a de la demande ! (Et que j’ai des idées pour d’autres outils comme ça).

  2. Pour ma part, à chaque fois que je clique dans le champs vide Propriété, il me propose par un menu déroulant une propriété en rapport avec la nature de l’élément, qui n’a pas déjà été remplie et par ordre de priorité et c’est très, très efficace.
    Pour moi, bien plus efficace que l’utilitaire human dans lequel je ne retrouve pas image, sport, etc

    1. L’ennui du menu de suggestion, c’est qu’il se base sur les propriétés déjà utilisées sur des éléments de même nature. Donc pour des domaines bien traités (comme les êtres humains) il est bon. Pour des domaines encore peu développés, c’est la croix et la bannière… Même s’il y a déjà eu du progrès par rapport à l’an passé et que l’équipe de développement va sans doute l’améliorer encore.

    2. Danie : oui, c’est sûr que l’utilitaire est limité. Mais d’un autre côté, rien n’empêche de faire les deux : créer une base avec l’outil, puis finaliser sur Wikidata.

      En fait, je pense que tout le monde devrait contribuer comme il préfère.

  3. Poulpy : merci pour ce billet 🙂

    Comme j’ai aussi une imagination débordante, j’ai mis la Joconde en image d’en-tête, j’espère que ça te convient 🙂

  4. C’est excellent ! J’avais pensé faire la même chose pour les livres, où il faut en plus créer deux entrées au moins, une pour l’éditition, une pour le livre.

  5. Bonjour
    Si il y a des wikipédiens qui cherchent un terrain de jeu pour cet outil, les données des musées départementaux de la Haute-Saône sous convention avec wikimédia france peuvent être cool : Coll. sur Joconde ici https://lstu.fr/RrLZ7lmV et un set d’images déjà sur wikimedia commons accessible via la catégorie Musées départementaux de la Haute-Saône.
    Me contacter sur @nicoCG70 éventuellement

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *