Tutoriel: télécharger Wikipédia

Skelets numériques

Première publication le 08/02/2025
Dernière modification le 08/02/2025
Temps de lecture estimé: 3 m
Avancement: débuté
Post précédent : Avoir un Enfant
Tags liés à cet article: technique outil tuto

Tutoriel: télécharger Wikipédia

Depuis l’investiture de Donald Trump, ses séides ont fait irruption au sein du Département d’Océanographie Américain (NOAA) pour lutter contre les mesures d’inclusivité à l’emploi. Le centre de prévention et contrôle des maladies (CDC) a vu plusieurs de ses pages portant sur la vaccination des IST ou des recommandations de santé pour personnes trans purgées (certaines partiellement restaurées). Ça s’accompagne d’une purge massive de jeux de données cruciaux pour la recherche scientifique. Il y en a quantité d’autre: la stratégie de saturation des médias mise en place par Trump semble fonctionner pour l’instant.

Cette attaque faciste est actuellement combattue par des actions juridiques, et des scientifiques du CDC qui font ce qu’iels peuvent pour lutter contre la suppression du savoir (qui est équivalent à augmenter l’exposition au danger des plus précaires).

Je vous propose ici de suivre un petit tutoriel pour sauvegarder un commun de connaissance irremplaçable: le projet d’encyclopédie Wikipédia.

Consulter Wikipédia hors-ligne avec Kiwix

Il existe une page dédiée à la consultation hors-connexion sur Wikipédia.

La méthode la plus simple consiste à télécharger un logiciel auxilliaire, qui permettra de parcourir Wikipédia en hors-ligne.

Le logiciel Kiwix est disponible sur toutes les bonnes distributions Linux, Windows et MacOS. Il permet de lire des contenus web hors connexion. Pour ajouter du contenu à Kiwix, il faut passer une archive au format ZIM. On se procurer une telle archive directement sur Wikipédia.

Comme l’archive est très grosse, il est recommandé de la télécharger via le protocole Torrent. J’utilise Transmission sur Linux et il semble fonctionner sous MacOS; on me recommande Qbittorent sous Windows. L’avantage du Torrent, c’est qu’il vous permet de partager vous-même des morceaux de Wikipédia, ce qui rendra beaucoup plus difficile sa disparition effective.

De là, on peut télécharger une version de Wikipédia directement depuis l’encyclopédie. Voilà par exemple la version française, j’en garde une copie sur mon site ici juste au cas où.

Télécharger Wikipédia en Français

→→→→→→→ Cliquez ici (source Wikipédia) ou là (sur mon blog) ←←←←←←

Ensuite, on charge l’archive dans kiwix. Quelques images valent mieux que plusieurs mots (ne pas hésiter à clic-droit -> ouvrir dans un autre onglet les images)!

Capture d'écran du logiciel kiwix avec une flèche pointant vers le dossier

Cliquer sur l’icône de dossier

Capture d'écran du logiciel kiwix montrant une fenêtre de sélection de fichier

Sélectionner le fichier téléchargé

Capture d'écran d'une page wikipédia rendue dans le logiciel kiwix.

Parcourir Wikipédia!

Et la collaboration?

Cette méthode ne permet qu’une consultation hors-ligne de l’encyclopédie. Mais la plus grande force de Wikipédia, c’est son aspect collaboratif. Et ça demande donc d’installer le logiciel dédié qui fait tourner Wikipédia, de le faire marcher sur les données de Wikipédia et de servir ça à l’extérieur. Tout cela induit un tas d’autres complexités dont il n’est pas question ici.

Citons qu’il est possible de récupérer des dumps de la base de donnée de Wikipedia. Ces données brutes ne sont pas utilisables en soit, et nécessitent un traitement via une base de donnée pour être exploitables.

Étonnemment, il est possible de récupérer des dumps de fichier directs dans wikipedia mais les derniers datent de 2008.

On pourrait se donner comme objectif de décrire comment installer Médiawiki sur sa machine et tenter de restaurer Wikipédia.