Une base de données historique sur les personnages célèbres dans le monde (de 3500 avant JC à 2018)

23 juillet 2022 by Lyonel Kaufmann

Source : Morgane Laouenan, Palaash Bhargava, Jean-Benoît Eyméoud, Olivier Gergaud, Guillaume Plique, Etienne Wasmer (2022) A cross-verified database of notable people, 3500BC-2018AD, Scientific Data, volume 9, juin 2022.

Les auteurs de cet article paru dans la revue Nature en juin 2022 ont recueilli une quantité massive de données provenant de diverses éditions de Wikipédia et de Wikidata. La base de données contient plus de 2 millions d’individus ; elle peut être utilisée à des fins de recherche. En utilisant des techniques de déduplication des sources qui se chevauchent partiellement, ils ont pu vérifier chaque information. Cette stratégie aboutit à une base de données vérifiée de 2,29 millions d’individus uniques dont 30% proviennent de 6 éditions non anglaises de Wikipédia, une amélioration significative par rapport aux travaux antérieurs qui se concentraient uniquement sur la version anglaise de cette encyclopédie gratuite.

Figure 2 : Part des individus présents dans la base de données, répartition par domaine d’influence.

En recourant à des éditions en 7 langues de Wikipedia et Wikidata pour assembler une liste de 4 678 040 personnes, cela a permis de réduire considérablement le biais anglo-saxon, mais pas entièrement. Deux inconvénients majeurs subsistent pour les auteurs. Premièrement, ils n’ont pas exploité les éditions en langues non occidentales pour vérifier par recoupement les informations sur les caractéristiques des individus. Deuxièmement, ils n’ont pas collecté le nombre de mots au-delà de ces 7 éditions linguistiques : ils entrent dans l’indice de notabilité, mais cet indice ne peut être considéré comme global, ce qui entraîne un biais du monde occidental dans les mesures de notabilité. Ceci est toutefois partiellement compensé par l’utilisation du nombre total d’occurrences pour toutes les éditions de Wikipédia et non seulement 7, dans leur mesure de notabilité agrégée.

La collecte des données est guidée par des questions spécifiques de sciences sociales sur le genre, la croissance économique, le développement urbain et culturel. Les personnages historiques les plus célèbres peuvent par exemple être répartis par période et par sexe, mais aussi par aires géographiques ou domaines d’activités.

L’ensemble complet de données est disponible sur un site web dédié (https://medialab.github.io/bhht-datascape). Les données sont disponibles au format .csv et Stata (.dta). La base de données restreinte a fait l’objet d’une vérification croisée. Elle est soumise à la licence CC-BY-SA. Les fichiers intermédiaires ainsi que la base de données exhaustive n’ont pas fait l’objet d’une vérification croisée et ne doivent pas être utilisés directement ou sous l’entière responsabilité des utilisateurs.

Il est ainsi possible d’explorer en partie la base de données et de faire ses propres recherches pour établir ses propres constats.

Globalement, c’est un exemple intéressant de « big data » mis à la disposition du public et potentiellement des élèves à travers de la lecture de l’article de Nature et de l’ensemble complet des données disponibles, les deux sont sous licence libre.

Repéré via : Cartographie numérique: Une base de données historique sur les personnages célèbres dans le monde (de 3500 avant JC à 2018)

Similaire

À propos Lyonel Kaufmann

Historien & Blogueur

Laisser un commentaireAnnuler la réponse.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Ludovia#CH (21-22-04.2026) : deux jours pour repenser l’apprentissage à l’ère de l’IA et de l’innovation

Les 21et 22 avril 2026, la sixième édition de LUDOVIA#CH revient à Yverdon-les-Bains. Organisé conjointement par la Haute école pédagogique du canton de Vaud et de la Haute école ...

How Teacher Evaluations Broke the University (Rose Horowitch)

Rose Horowitch is a staff writer at The Atlantic. This article appeared September 12, 2025. At the close of the fall semester, professors across the …How Teacher Evaluations Broke the University (Rose ...

Entre-temps : Imaginer au Moyen Âge avec Francesco Montorsi

Chaque mois dans les Entre-vues, Entre-Temps échange avec une ou un invité•e pour discuter et débattre d’un ouvrage, d’un travail en cours, d’une œuvre en général, de la façon dont on fait vivre ...

Exposition : La figure de la Terre. Un débat scientifique franco-anglais (XVIIᵉ-XXIᵉ siècle)

L’Académie des sciences et la Royal Society présentent, du 1er avril au 20 juin 2026, l’exposition « La figure de la Terre. Un débat scientifique franco-anglais (XVIIᵉ-XXIᵉ siècle) », dans ...

Conférence : Racisme et haute école : continuités historiques et stratégies antiracistes. Berne (27.03.2026)

Perspectives antiracistes sur la production de savoir Le 27 mars 2026 de 9h00 à 19h00, l’Université de Berne accueillera en ses murs la conférence Racisme et haute école : continuités historiques ...

Laténium : Exposition L’île de sable (04.10.2025-10.01.2027)

L’exposition L’île de Sable au Laténium de Neuchâtel plonge au cœur de la période coloniale et présente de quelle manière l’archéologie permet d’étudier la thématique de la traite des esclaves et le ...

Table ronde : S’appuyer sur le passé pour former les professionnel·l·es de demain – Hôtel de ville de Lausanne (12.03.2026)

Plus jamais ça! C'est ce que clament les victimes de mesures de coercition à des fins d’assistance. Cette table ronde réunit 4 professeures de Hautes écoles du canton de Vaud autour de 2 ...

Ludovia#CH (21-22-04.2026) : deux jours pour repenser l’apprentissage à l’ère de l’IA et de l’innovation

16 mars 2026 Par Lyonel Kaufmann Laisser un commentaire

Les 21et 22 avril 2026, la sixième édition de LUDOVIA#CH revient à Yverdon-les-Bains. Organisé conjointement par la Haute école pédagogique du canton de Vaud et de la Haute école d’ingénierie et de gestion du canton de Vaud et le soutien du Département de l’enseignement et de la formation professionnelle, l’événement proposera conférences, ateliers, colloque scientifique et dispositifs collaboratifs […]

L'Affaire Farewell : les rapports Est-Ouest des années 1980

4 octobre 2009 Par Lyonel Kaufmann Laisser un commentaire

Ce dernier vendredi, j’ai passé une agréable soirée au cinéma à la projection de L’Affaire Farewell de Christian Carion. La bande-annonce: Ainsi donc, après son film Joyeux Nöel inscrit dans la Première Guerre Mondiale, Christian Carion nous offre un nouveau film de fiction-historique. Comme dans Joyeux Noël, il prend quelques libertés avec l’histoire réelle. Néanmoins, […]

Liens (26.07.2007)

26 juillet 2007 Par Lyonel Kaufmann Laisser un commentaire

Dictionnaire des citations politiques – (c) Damien Bégoc Dictionnaire des citations politiques de Damien Bégoc (version en ligne): 1275 citations de toutes tendances, 400 auteurs français ou étrangers, contemporains ou classiques, index de 720 mots-clés et 4600 entrées. (tags: Histoire Politique Citation)

Easy Timeline intègre ses frises à iBooks Author

8 avril 2012 Par Lyonel Kaufmann Laisser un commentaire

Via Scoop.it – histoire La dernière version d’Easy Timeline permet désormais d’exporter une frise chronologique sous la forme d’un widget HTML à exploiter ensuite directement dans iBooks Author. De quoi ajouter très rapidement et facilement une frise interactive à un manuel sur l’iPad. Via www.macgeneration.com

Problématiser, mais vraiment, en classe d'histoire | Chronique no 145

3 octobre 2013 Par Lyonel Kaufmann Laisser un commentaire

La parution récente de « Didactique et enseignement de l’histoire-géographie au collège et au lycée» de Yannick Mével et Nicole Tutiaux Guillon permet de faire le point sur la question de la problématisation et du problème en classe d’histoire. Préalablement, l’ouvrage de Yannick Mével et Nicole Tutiaux-Guillon propose par chapitre d’aborder une question concrète d’enseignant tels […]

Venise : les 500 ans du Ghetto 29 mars 1516

29 mars 2016 Par Lyonel Kaufmann Laisser un commentaire

Le 29 mars 1516, Venise décrète que les juifs seront regroupés dans le quartier des fonderies : ghetto en dialecte local. Une telle ségrégation, sur fond de mutations, de doutes et de fureurs identitaires, parle de (et à) l’Europe… Quelques articles en relation à cette création du Ghetto et deux ouvrages de référence à nouveau publié. […]

YouTubeurs et institutions : de nouveaux formats pour la médiation scientifique

3 janvier 2019 Par Lyonel Kaufmann Laisser un commentaire

Mikaël Chambru, Université Grenoble Alpes Cet article a été co-écrit avec Julie Polge, chargée d’exposition scientifique à la Communauté Université Grenoble Alpes. En France, les vidéastes sur YouTube – les youtubeurs – spécialisés dans la vulgarisation sont actifs depuis une dizaine d’années déjà. A mesure qu’il a pris de l’ampleur, ce phénomène n’est pas passé […]

Café pédagogique:: liens mars 2006

29 mars 2006 Par Lyonel Kaufmann Laisser un commentaire

Le Café pédagogique propose tous les mois une sélection de liens en rapport avec les différentes disciplines scolaires. Voici une partie des liens en rapport avec l’histoire présente dans son édition du mois de mars.

Partager :

J’aime ça :

Similaire

À propos Lyonel Kaufmann

Interactions du lecteur

Laisser un commentaireAnnuler la réponse.