Prototypage rapide d’entités Wikidata

Poulpy Wikidata

Wikidata est un projet puissant, mais pour pouvoir en profiter, il faut le remplir. Bien sûr, il est possible d’ajouter des données à la main directement sur le site : ça fonctionne sans souci mais que faire quand on a plusieurs dizaines d’entrées ? Plusieurs centaines ? Avec le temps, quelques outils ont vu le jour permettant d’automatiser un peu ce processus, comme l’indispensable QuickStatements ; là encore, il faut bien lui fournir les données qu’il mange et tout ceci est parfois bien fastidieux. Est-ce qu’on ne peut pas aller plus loin ?

Une entrée wikidatienne sur un être humain, par exemple, possède des champs plus ou moins codifiés :

  • Une nature de l’élément égal à Q5, « être humain »
  • Un genre (masculin, féminin, etc.)
  • Une date et un lieu de naissance
  • Une date et un lieu de décès
  • Un pays de nationalité
  • Une occupation
  • Un prénom et un nom de famille

Toutes ces propriétés ne se rencontrent pas à chaque fois et on peut en rajouter d’autres, mais est-ce que ça ne serait pas intéressant d’avoir une sorte de formulaire où on se contenterait de remplir les cases correspondantes, histoire de créer rapidement un squelette d’entité Wikidata ? Pour voir, j’ai codé l’utilitaire « human » : vous mettez ce qu’il faut dans les champs, vous appuyez sur le bouton et il produit le code à destination de QuickStatements. J’ai le sentiment qu’on peut ainsi gagner du temps et on n’oublie rien.

Histoire d’aller un peu plus loin, je me suis penché sur la base Joconde, qui a le goût d’être remplie avec pas mal de soin. J’en ai sorti un autre utilitaire, baptisé Joconde parce que je suis un gars avec une imagination débordante. Sa fonction : parser une fiche Joconde, en retirer les champs qui vont bien (titre, auteur, sujets représentés, etc.) et présenter le résultat dans un formulaire pour correction avant envoi à QuickStatements. Les champs corrigés sont stockés en base, histoire que si l’utilitaire puisse ressortir la correction s’il retombe dessus (comme ça, « MONET Claude » est automatiquement corrigé en « Claude Monet, peintre français, Q296 »). On y gagne du temps.

Personnellement, je pense que cette idée de formulaires pré-remplis est à creuser, pour Wikidata. Qu’en pensez-vous ?

PS : j’imagine que mon outil pour Joconde doit enfreindre des milliers de lois, de licences et de copyrights. Je laisse le soin aux Wikimédiens que ça intéresse de discuter de la chose et de décider s’il faut supprimer toutes mes contributions. Prévenez-moi juste du résultat final.

Mise à jour du 28 septembre 2016 : j’ai placé le code des outils en question sur GitHub : https://github.com/PoulpyFR. Bien sûr, c’est codé n’importe comment et pas commenté. 🙂

Image d’en-tête:

Détail de La Joconde, par Léonard de Vinci (domaine public)

Mots-clefs :

12 commentaires publiés.

Commentaires

Harmonia Amanda 13 septembre 2016 09:02

J'en pense qu'on en parlait hier sur le chan de Wikidata et qu'il y a de la demande ! (Et que j'ai des idées pour d'autres outils comme ça).

Danie 13 septembre 2016 10:06

Pour ma part, à chaque fois que je clique dans le champs vide Propriété, il me propose par un menu déroulant une propriété en rapport avec la nature de l'élément, qui n'a pas déjà été remplie et par ordre de priorité et c'est très, très efficace. Pour moi, bien plus efficace que l'utilitaire human dans lequel je ne retrouve pas image, sport, etc

Harmonia Amanda 13 septembre 2016 10:14

L'ennui du menu de suggestion, c'est qu'il se base sur les propriétés déjà utilisées sur des éléments de même nature. Donc pour des domaines bien traités (comme les êtres humains) il est bon. Pour des domaines encore peu développés, c'est la croix et la bannière... Même s'il y a déjà eu du progrès par rapport à l'an passé et que l'équipe de développement va sans doute l'améliorer encore.

Poulpy 13 septembre 2016 12:14

Danie : oui, c'est sûr que l'utilitaire est limité. Mais d'un autre côté, rien n'empêche de faire les deux : créer une base avec l'outil, puis finaliser sur Wikidata. En fait, je pense que tout le monde devrait contribuer comme il préfère.

Ash Crow 13 septembre 2016 10:07

Poulpy : merci pour ce billet :) Comme j'ai aussi une imagination débordante, j'ai mis la Joconde en image d'en-tête, j'espère que ça te convient :)

Léna 13 septembre 2016 13:22

C'est excellent ! J'avais pensé faire la même chose pour les livres, où il faut en plus créer deux entrées au moins, une pour l'éditition, une pour le livre.

Ash Crow 13 septembre 2016 18:23

Tiens, j'ai exactement le même projet ^^'

Léna 16 septembre 2016 16:11

Poulpy : Est-ce que ton code est dispo quelque part, qu'on puisse y rajouter d'autres points d'entrée que ceux déjà existants ?

Poulpy 28 septembre 2016 11:01

Tiens, j'ai placé le code pour "human" là : https://github.com/PoulpyFR/human Pour Joconde, je finis un truc dessus et je le mets aussi.

Léna 2 novembre 2016 11:42

Super merci :)

Nico aka tounoki 26 septembre 2016 09:54

Bonjour Si il y a des wikipédiens qui cherchent un terrain de jeu pour cet outil, les données des musées départementaux de la Haute-Saône sous convention avec wikimédia france peuvent être cool : Coll. sur Joconde ici https://lstu.fr/RrLZ7lmV et un set d'images déjà sur wikimedia commons accessible via la catégorie Musées départementaux de la Haute-Saône. Me contacter sur @nicoCG70 éventuellement

Poulpy 28 septembre 2016 11:02

Ah, zut, le lien ne semble pas fonctionner...

Les commentaires sont fermés.