Dans le prochain article, nous allons jeter un œil à Wget. Il faut dire que GNU Wget est un outil gratuit qui permet le téléchargement de contenu à partir de serveurs Web de manière simple et rapide. Son nom dérive du World Wide Web (w) et le mot get (en anglais obtenez). Ce nom vient à signifier: obtenir de WWW.
Aujourd'hui, il existe des dizaines d'applications pour télécharger des fichiers très efficacement. La plupart d'entre eux sont basés sur des interfaces Web et de bureau et sont développés pour tous les systèmes d'exploitation. Cependant sur Gnu / Linux (il existe également une version pour Windows) il y a le gestionnaire de téléchargement puissant des fichiers wget. Il est considéré comme le téléchargeur le plus puissant qui existe. Prend en charge les protocoles tels que http, https et ftp.
Télécharger des fichiers avec wget
Téléchargez un fichier
La façon la plus simple d'utiliser cet outil est de télécharger indiquant le fichier ce que nous voulons:
wget http://sitioweb.com/programa.tar.gz
Télécharger en utilisant différents protocoles
En tant que bon gestionnaire de téléchargement, il est possible demander plus d'un téléchargement à la fois. On peut même utiliser différents protocoles dans le même ordre:
wget http://sitioweb.com/programa.tar.gz ftp://otrositio.com/descargas/videos/archivo-video.mpg
Télécharger par extension
Une autre façon de télécharger plusieurs fichiers qui utilisent la même extension, il utilisera l'astérisque générique:
wget<code class="language-bash" data-lang="bash">-r -A.pdf</code>http://sitioweb.com/*.pdf
Cette commande ne fonctionne pas toujours, car certains serveurs peuvent avoir bloqué l'accès à wget.
Télécharger une liste de fichiers
Si nous voulons télécharger les fichiers que nous trouvons, nous n'aurons plus qu'à sauvegarder leur URL dans un fichier. Nous allons créer une liste appelée files.txt et nous indiquerons le nom de la liste à la commande. Il faut placer une seule URL par ligne à l'intérieur de files.txt.
La commande que nous utiliserons pour télécharger la liste créée et que nous enregistrons dans des fichiers .txt sera la suivante:
wget -i archivos.txt
Redémarrez un téléchargement
Si pour une raison quelconque le téléchargement a été interrompu, nous pourrons continuez le téléchargement là où il s'est arrêté en utilisant le option c avec la commande wget:
wget -i -c archivos.txt
Ajouter un journal sur le téléchargement
Si nous voulons obtenir un journal sur le téléchargement, afin de contrôler tout incident dessus, nous devrons ajouter le option -o comme indiqué dans ce qui suit:
wget -o reporte.txt http://ejemplo.com/programa.tar.gz
Limiter la bande passante de téléchargement
Dans de très longs téléchargements, nous pouvons limiter la bande passante de téléchargement. Avec cela, nous empêcherons le téléchargement de prendre toute la bande passante pendant la durée du téléchargement:
wget -o /reporte.log --limit-rate=50k ftp://ftp.centos.org/download/centos5-dvd.iso
Télécharger avec nom d'utilisateur et mot de passe
Si nous voulons télécharger à partir d'un site où un nom d'utilisateur / mot de passe est requis, nous n'aurons qu'à utiliser ces options:
wget --http-user=admin --http-password=12345 http://ejemplo.com/archivo.mp3
Tentatives de téléchargement
Par défaut, ce programme fait 20 tentatives pour établir la connexion et lancez le téléchargement, dans les sites très saturés, il est possible que même avec 20 tentatives, cela n'ait pas été réalisé. Avec la option t augmente à plus de tentatives.
wget -t 50 http://ejemplo.com/pelicula.mpg
Téléchargez un site Web avec wget
Aide de l'homme Wget
Wget ne se limite pas aux téléchargements de fichiersNous pourrons télécharger une page complète. Nous devrons juste écrire quelque chose comme:
wget www.ejemplo.com
Téléchargez un site Web et ses éléments supplémentaires
Avec option p nous téléchargerons également tous les éléments supplémentaires nécessaires sur la page comme les feuilles de style, les images en ligne, etc.
Si nous ajoutons le option r se téléchargera récursivement jusqu'à 5 niveaux depuis le site:
wget -r www.ejemplo.com -o reporte.log
Convertir les liens en local
Par défaut, les liens dans le site pointent vers l'adresse de l'ensemble du domaine. Si nous téléchargeons le site de manière récursive, puis l'étudions hors ligne, nous pouvons utiliser le option convert-links qui les transformera en liens locaux:
wget --convert-links -r http://www.sitio.com/
Obtenez une copie complète du site
Nous aurons la possibilité d'obtenir une copie complète d'un site. La Option –mirror équivaut à utiliser le options -r -l inf -N qui indique la récursion à un niveau infini et l'obtention de l'horodatage d'origine de chaque fichier téléchargé.
wget --mirror http://www.sitio.com/
Transformer les extensions
Si vous téléchargez l'intégralité du site pour une consultation hors connexion, plusieurs fichiers téléchargés risquent de ne pas s'ouvrir en raison d'extensions telles que .cgi, .asp ou .php. Ensuite, il est possible d'indiquer avec le Option –html-extension Tous les fichiers sont convertis en une extension .html.
wget --mirror --convert-links --html-extension http://www.ejemplo.com
Ce ne sont que des directives générales que ce que vous pouvez faire avec Wget. Qui veut peut consulter le manuel en ligne pour consulter toutes les possibilités que nous offre ce merveilleux gestionnaire de téléchargement.