Comment installer et utiliser l'outil wget sur le système macOS

wget est un utilitaire de ligne de commande non interactif pour télécharger des ressources à partir d'une URL spécifiée. Comme il n'est pas interactif, wget peut s'exécuter en arrière-plan ou avant que l'utilisateur ne se connecte. L'outil est spécialement conçu pour les connexions faibles, ce qui le rend particulièrement résistant dans des conditions inégales. Bien que wget ne soit pas livré avec macOS, il peut être facilement téléchargé et installé à l'aide de Homebrew, où se trouve le meilleur gestionnaire de packages Mac disponible.

Comment installer et utiliser wget sur macOS - Mac

1. Téléchargez et installez Homebrew

Comment installer et utiliser wget sur macOS - Mac

Pour installer le programme Homebrew, ouvrez la fenêtre Terminal et exécutez la commande suivante prise à partir de Site Web Homebrew:

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Vous remarquerez peut-être que la commande intitulée boucle Un autre utilitaire de ligne de commande permettant de télécharger des fichiers à partir de l’URL fournie dans l’installation de Ruby incluse dans macOS.

2. Installer wget

Comment installer et utiliser wget sur macOS - Mac

Une fois installé, nous utiliserons le programme Homebrew pour installer wget. Dans Terminal, exécutez la commande suivante pour télécharger et installer wget:

brew install wget

Vous recevrez des mises à jour en direct sur l'avancement du téléchargement et de l'installation des dépendances (configuration logicielle requise) nécessaires à l'exécution de wget sur votre système.

Si vous avez déjà installé Homebrew, assurez-vous qu'il est activé mise à jour de la bière Obtenez les dernières versions de toutes vos versions.

3. Utiliser wget

Comment installer et utiliser wget sur macOS - Mac

Wget a pour but de télécharger du contenu à partir d'URL. C'est un outil simple et rapide, non interactif, permettant de télécharger des fichiers à partir de n'importe quelle URL accessible au public.

Télécharger un fichier

Comme la commande curl de la même commande, wget retire une ressource de l’URL et l’enregistre dans un emplacement spécifique de votre ordinateur. La structure de contrôle fonctionne comme suit:

wget -O path/to/local.copy http://example.com/url/to/download.html

Cela enregistre le fichier spécifié dans l'URL à l'emplacement spécifié sur votre appareil. Si un tag est exclu -O , L’URL spécifiée sera téléchargée dans le répertoire de travail en cours.

Télécharger un répertoire fréquemment

Pour télécharger une arborescence de répertoires complète à l'aide de wget, vous devez utiliser des balises -r / --recursive et -np / - pas de parent , Tels que:

wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/

Wget suivra ainsi tous les liens dans les documents du répertoire spécifié et répétera le téléchargement du chemin d’URL complet spécifié.

Cette commande comprend également -e robots = éteint , Ce qui ignore les restrictions de votre fichier robots.txt. En général, il est utile de désactiver un fichier robots.txt pour empêcher les téléchargements courts.

Autres utilisations pour wget

En plus des indicateurs ci-dessus, ces choix de wget sont très utiles:

Contrôle de téléchargement

wget -X / absolute / path / to / directory  Un répertoire spécifique sera exclu sur le serveur distant.

wget-nH Supprime les répertoires de noms d'hôte. Rappelez-vous que le nom d'hôte fait partie de l'URL contenant le nom de domaine et se termine par un TLD tel que ".com". Par exemple, le dossier nommé "www.w3.org" sera ignoré. Dans l'exemple précédent, démarrez le téléchargement avec le répertoire "date".

wget --cut-dirs = # Le nombre spécifié de répertoires passe en dessous de l'URL avant de commencer à télécharger des fichiers. Par exemple, cela peut changer -nH --cut-dirs = 1 Le chemin spécifié pour "ftp.xemacs.org/pub/xemacs/"Pour simplement"/ xemacs /", Ce qui réduit le nombre de sous-répertoires vides dans le téléchargement local.

wget -R index.html / wget --reject index.html Tous les fichiers correspondant au nom de fichier spécifié seront ignorés. Dans ce cas, tous les fichiers d'index seront exclus. Le code peut être utilisé * En tant que caractère générique, tel que "* .png", Qui peut ignorer tous les fichiers avec une extension PNG.

Spécifie un fichier wget -je URL cibles à partir d'un fichier d'entrée. Le fichier d'entrée doit être un fichier HTML ou être analysé au format HTML --force-html

wget-nc/wget --no-clobber  - Il n'écrase pas les fichiers qui se trouvent déjà dans la destination.

Va continuer wget-c/wget --continuer Télécharger des fichiers partiellement téléchargés.

Va essayer wget -t 10 Téléchargez la ressource jusqu'à l'heure 10 avant l'échec.

Ajuster le niveau d'enregistrement

Peut wget-d Sortez le patch.

Peut wget -o chemin / vers / log.txt Envoie le registre dans le répertoire spécifié au lieu d’afficher la sortie standard pour la journalisation.

Travaux wget-q Désactivez toutes les sorties wget, y compris les messages d'erreur.

Facile wget-v Définition explicite du wget par défaut pour la production prolixe.

wget - non verbeux Il désactive les messages de journal mais affiche des messages d'erreur.

Conclusion

Bien que cela devrait couvrir la majorité des cas d'utilisation de wget, le programme de téléchargement est capable de beaucoup plus. Pour une description complète des possibilités wget, vous pouvez consulter Une page de manuel fonctionne sur wget dans GNU en ligne.

source
Aller au bouton supérieur