Comment restaurer un site grâce à la Wayback Machine ?

Parfois, la vie arrive. Là où il y avait un site web, tout ce que vous avez maintenant est une page d’erreur. Votre hébergement a expiré, il n’y a pas de sauvegardes et vous paniquez.

Alors comment récupérer votre ancien site Web ? La Wayback Machine !

Pour ceux d’entre vous qui ne le savent pas, la Wayback Machine (également connue sous le nom d’Internet Archive) est une archive numérique de l’ensemble de l’Internet public. L’Internet Archive est en fait une organisation à but non lucratif basée à San Francisco qui existe depuis près de 25 ans.

Elle pourrait bien être votre dernier espoir de récupérer votre site Web.

Si vous avez de la chance, la Wayback Machine a exploré votre site Web dans certains de ses derniers jours et en a une copie qui attend que vous la restauriez. Si vous êtes un peu malchanceux, cette version sera ancienne. Si vous êtes vraiment malchanceux, elle n’existera pas, sera ancienne ou totalement incomplète.

Avant d’aborder ces instructions, je tiens à ce que vous compreniez que, malheureusement, même si vous parvenez à restaurer votre site Web, il est peu probable qu’il soit identique à ce qu’il était. En effet, la Wayback Machine ne peut archiver que ce qu’elle peut voir. Les scripts côté serveur comme le PHP (sur lequel fonctionne WordPress) lui sont invisibles et ne peuvent pas être restaurés.

Donc, si vous espérez pouvoir restaurer l’intégralité de votre backend WordPress, détrompez-vous ! Ce n’est pas possible.

Vous pouvez, cependant, faire en sorte qu’il soit identique à celui des autres utilisateurs.

Si cela vous suffit pour le moment, ou si votre site n’est qu’un simple HTML, alors cela devrait vous convenir !

Le Wayback Machine Downloader

Nous allons utiliser un excellent petit outil de Hartator, le bien nommé « Wayback Machine Downloader ». C’est un outil simple et facile à utiliser et il fait le travail.

Toutes les instructions pour son installation peuvent être trouvées sur ce lien, donc je n’ai pas besoin de reproduire toutes les instructions de configuration ici.

En gros, vous devez installer Ruby si vous ne l’avez pas déjà, puis installer le téléchargeur, et enfin exécuter une commande simple pour le télécharger.

Une fois qu’il est installé, vous pouvez littéralement exécuter une commande aussi simple que celle-ci pour télécharger votre site :

				
					wayback_machine_downloader http://example.com

				

Il télécharge automatiquement chaque fichier de l’archive la plus récente de votre site sur la Wayback Machine.

Et la beauté de la chose : tous les fichiers doivent être les fichiers « originaux », et non ceux qui contiennent des URL de la Wayback Machine. La structure du répertoire doit être intacte et il doit être facile de s’y déplacer.

N’oubliez pas de jeter un coup d’œil à la section « Utilisation avancée » pour obtenir des paramètres supplémentaires, comme la spécification de l’endroit où le site doit être téléchargé.

J’ai tout de même constaté que je devais remplacer certaines URL. Il semblerait que les liens externes soient toujours acheminés par la Wayback Machine, et je devais donc les corriger.

J’ai découvert que j’avais des URL qui ressemblaient à ceci :

				
					https://web.archive.org/web/20190316040039/http://www.example.com/

				

De toute évidence, nous voulons que ces liens aillent directement à http://www.example.com/. Il y avait donc du travail à faire !

J’ai ouvert le logiciel gratuit Notepad++ et j’ai effectué une recherche et un remplacement pour supprimer la partie supplémentaire du lien. Voici comment procéder :

  1. Affichez vos fichiers et trouvez l’URL exacte qui est utilisée dans ces liens (la partie complète avant le lien réel et souhaité). Vous en aurez besoin à l’étape 4.
  2. Ouvrez le logiciel et appuyez sur ctrl+f pour ouvrir les écrans de recherche et de remplacement.
  3. Cliquez sur « Rechercher dans les fichiers ».
  4. Pour « Rechercher quoi : », indiquez l’URL complète de archive.org, par exemple : https://web.archive.org/web/20190316040039/.
  5. Pour « Remplacer par : », ne mettez rien. Nous ne faisons que le supprimer entièrement, il ne doit donc pas être remplacé par un autre contenu.
  6. Indiquez le répertoire où se trouvent les fichiers de votre site.
    Cliquez sur « Remplacer dans les fichiers » pour effectuer les remplacements.

Cela devrait être fait ! Vos URL devraient fonctionner parfaitement.

Dans notre cas, nous avons compressé l’ensemble du site, puis nous l’avons déplacé vers le nouveau serveur d’hébergement où le site devait se trouver et nous avons extrait l’archive.

Les fichiers devraient être prêts !

Il ne vous reste plus qu’à faire pointer vos paramètres DNS vers votre nouveau serveur d’hébergement, et vous devriez être opérationnel.

Les limitations

Comme évoqué précédemment, il y a de sérieuses limitations. Il n’y aura pas de scripts côté serveur disponibles, ce qui pourrait casser beaucoup de choses. D’autres limitations, plus spécifiques, incluent :

  • Les formulaires de contact ne fonctionneront probablement pas
    Si vous avez un système de gestion de contenu (CMS) comme WordPress, aucune des fonctionnalités du backend ne fonctionnera.
  • Tout ce qui nécessite une requête de base de données ne fonctionnera pas.
  • La plupart des requêtes, quelles qu’elles soient, ne fonctionneront probablement pas.
  • Il ne sera pas vraiment possible de produire du contenu dynamique.
  • Il peut être difficile d’apporter des modifications, en particulier au contenu répétitif comme l’en-tête et le pied de page.
  • Vous pourriez finir par devoir reconstruire l’ensemble de votre site.
  • Ce n’est donc pas parfait, mais cela peut faire l’affaire. N’hésitez pas à nous contacter si vous souhaitez que nous nous en chargions pour vous.

Il se peut que vous deviez encore reconstruire le site après cette opération. Vous avez au moins le contenu de votre site, donc si vous voulez simplement le reconstruire de la même manière ou si vous voulez profiter de cette occasion pour redessiner votre site, c’est peut-être le bon moment pour le faire.

Nous serions ravis de connaître votre avis

Laisser un commentaire