briefly about wget

briefly about wget


Команда wget linux имеет очень простой синтаксис:

$ wget опции аддресс_ссылки

Опции:

  • -V (–version) - вывести версию программы

  • -h (–help) - вывести справку

  • -b (–background) - работать в фоновом режиме

  • -o файл (–out-file) - указать лог файл

  • -d (–debug) - включить режим отладки

  • -v (–verbose) - выводить максимум информации о работе утилиты

  • -q (–quiet) - выводить минимум информации о работе

  • -i файл (–input-file) - прочитать URL из файла

  • –force-html - читать файл указанный в предыдущем параметре как html

  • -t (–tries) - количество попыток подключения к серверу

  • -O файл (–output-document) - файл в который будут сохранены полученные данные

  • -с (–continue) - продолжить ранее прерванную загрузку

  • -S (–server-response) - вывести ответ сервера

  • –spider - проверить работоспособность URL

  • -T время (–timeout) - таймаут подключения к серверу

  • –limit-rate - ограничить скорость загрузки

  • -w (–wait) - интервал между запросами

  • -Q (–quota) - максимальный размер загрузки

  • -4 (–inet4only) - использовать протокол ipv4

  • -6 (–inet6only) - использовать протокол ipv6

  • -U (–user-agent)- строка USER AGENT отправляемая серверу

  • -r (–recursive)- рекурсивная работа утилиты

  • -l (–level) - глубина при рекурсивном сканировании

  • -k (–convert-links) - конвертировать ссылки в локальные при загрузке страниц

  • -P (–directory-prefix) - каталог, в который будут загружаться файлы

  • -m (–mirror) - скачать сайт на локальную машину

  • -p (–page-requisites) - во время загрузки сайта скачивать все необходимые ресурсы


Загрузка файла

  • Команда wget linux скачает один файл и сохранит его в текущей директории. Во время загрузки мы увидим прогресс, размер файла, дату его последнего изменения, а также скорость загрузки:

wget http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Сохранить файл с другим именем

  • Опция -О позволяет задать имя сохраняемому файлу, например, скачать файл wget с именем wget.zip:

wget -O wget.zip http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Скачать несколько файлов

  • Вы можете скачать несколько файлов одной командой даже по разным протоколам, просто указав их URL:

wget http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz ftp://ftp.gnu.org/gnu/wget/wget-1.10.1.tar. gz.sig

Взять URL из файла

  • Вы можете сохранить несколько URL в файл, а затем загрузить их все, передав файл опции -i. Например создадим файл tmp.txt, со ссылками для загрузки wget, а затем скачаем его:

wget -i /wget/tmp.txt

Продолжить загрузку

  • Утилита wget linux рассчитана на работу в медленных и нестабильных сетях. Поэтому если вы загружали большой файл, и во время загрузки было потеряно соединение, то вы можете скачать файл wget с помощью опции -c.

wget -c http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Загрузка файлов в фоне

  • Опция -b заставляет программу работать в фоновом режиме, весь вывод будет записан в лог файл, для настройки лог файла используются специальные ключи wget:

wget -b -o ~/wget.log http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Ограничение скорости загрузки

  • Команда wget linux позволяет не только продолжать загрузку файлов, но и ограничивать скорость загрузки. Для этого есть опция –limit-rate. Например ограничим скорость до 100 килобит:

wget –limit-rate=100k ftp://ftp.iinet.net.au/debian/debian-cd/8.4.0/amd64/iso-dvd/debian-8.4. 0-amd64-DVD-1.iso

Загрузить и выполнить

  • Вы, наверное, уже видели такие команды. wget позволяет сразу же выполнять скачанные скрипты:
wget -O - http://сайт/скрипт.sh bash
  • Если опции -O не передать аргументов, то скачанный файл будет выведен в стандартный вывод, затем мы его можем перенаправить с интерпретатор bash, как показано выше.

Сохранить файл в папке

  • По умолчанию wget сохраняет файл в текущую папку, но это поведение очень легко изменить с помощью опции -P:

wget -P ~/Downloads/ http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Скачать сайт

  • Wget позволяет не только скачивать одиночные файлы, но и целые сайты, чтобы вы могли их потом просматривать в офлайне. Использование wget, чтобы скачать сайт в linux выглядит вот так:

wget –mirror -p –convert-links -P ./ аддресс_сайт