0
Cet article est une traduction brouillonne de celui-là : https://darcynorman.net/2011/12/24/archiving-a-wordpress-website-with-wget/ écrit par D’Arcy Norman.
La commande
wget --mirror -p --html-extension --convert-links -e robots=off -P . https://url-to-site
Les paramètres
-
--mirror
: active la récursivité -
-p
: télécharge également les fichiers liés (scripts, feuilles de styles…) -
--html-extension
: ajoute.html
aux fichiers pour qu’ils soient bien associés à l’ouverture dans un navigateur après téléchargement -
--convert-links
: réécrit les URLs vers les fichiers téléchargés au lieu des URLs absolues en live. Attention ça n’est pas infaillible, un rechercher-remplacer reste nécessaire (notamment pour les commentaires conditionnels, le path des images dans les CSS, etc) -
-e robots=off
: demande à wget de ne pas tenir compte du fichier robots.txt du site (et c’est mal !) -
-P .
: indique dans quel répertoire enregistrer les fichiers (« . » correspond au dossier courant) -
https://url-to-site
: adresse du site 🙂
DATE 11 Mar 2014