Polecenie Wget w systemie Linux/Unix

Wget to nieinteraktywny downloader sieciowy, który służy do pobierania plików z serwera nawet wtedy, gdy użytkownik nie jest zalogowany do systemu i może działać w tle, nie zakłócając bieżącego procesu.

  • GNU wget to bezpłatne narzędzie do nieinteraktywnego pobierania plików z Internetu. Obsługuje protokoły HTTP, HTTPS i FTP, a także pobieranie za pośrednictwem serwerów proxy HTTP.
  • wget jest nieinteraktywny, co oznacza, że ​​może pracować w tle, gdy użytkownik nie jest zalogowany. Dzięki temu możesz rozpocząć pobieranie i odłączyć się od systemu, pozwalając wget zakończyć pracę. Natomiast większość przeglądarek internetowych wymaga stałej obecności użytkownika, co może być dużym utrudnieniem przy przesyłaniu dużej ilości danych.
  • wget może podążać za łączami na stronach HTML i XHTML oraz tworzyć lokalne wersje zdalnych witryn internetowych, w pełni odtwarzając strukturę katalogów oryginalnej witryny. Nazywa się to czasem pobieraniem rekurencyjnym. Robiąc to, wget przestrzega standardu wykluczania robotów (/robots.txt). Wget może zostać poinstruowany, aby przekonwertować łącza w pobranych plikach HTML na pliki lokalne w celu przeglądania w trybie offline.
  • wget został zaprojektowany z myślą o odporności na wolne lub niestabilne połączenia sieciowe; jeśli pobieranie nie powiedzie się z powodu problemu z siecią, próba będzie kontynuowana, aż do pobrania całego pliku. Jeśli serwer obsługuje wznawianie, poinstruuje serwer, aby kontynuował pobieranie od miejsca, w którym zostało przerwane.

Podstawowa składnia:

Podstawowa składnia polecenia Wget jest następująca:

wget [option] [URL] 

Tutaj

[options]> reprezentuje różne opcje wiersza poleceń, które modyfikują zachowanie Wget

[URL]> to adres pliku lub strony internetowej do pobrania.

Opcje:

Oto opcje dostępne w poleceniu wget w systemie Linux.

Opcja Opis Składnia
-v / –wersja Wyświetl wersję Wget zainstalowaną w twoim systemie. $ wget -v
-h / –pomoc Wydrukuj komunikat pomocy wyświetlający wszystkie dostępne opcje wiersza poleceń dla Wget. $ wget -h [URL]
-o plik dziennika Kieruj wszystkie komunikaty generowane przez system do określonego pliku dziennika. Jeśli nie określono żadnego pliku dziennika, komunikaty są przekierowywane do domyślnego pliku dziennika („wget-log”). $ wget -o plik dziennika [URL]
-b / –tło Wyślij proces do tła zaraz po jego uruchomieniu, umożliwiając kontynuację innych procesów. Jeśli nie określono żadnego pliku wyjściowego, dane wyjściowe są domyślnie przekierowywane do „wget-log”. $ wget -b [URL]
-A Dołącz komunikaty wyjściowe do bieżącego pliku dziennika wyjściowego bez jego nadpisywania. Zachowuje to dziennik poprzednich poleceń, z bieżącym dziennikiem dołączonym po nich. $ wget – plik dziennika [URL]
-I Odczyt adresów URL z pliku. Jeśli określono jako plik, adresy URL są odczytywane ze standardowego wejścia. Jeśli adresy URL występują zarówno w wierszu poleceń, jak i w pliku wejściowym, pierwszeństwo mają adresy z wiersza poleceń. Plik nie musi być dokumentem HTML. $ wget -i plik wejściowy
$ wget -i plik wejściowy [URL]
-t liczba / –próby=liczba Ustaw liczbę ponownych prób. Określ „0” lub „inf”, aby nieskończone ponawianie prób było możliwe. Wartość domyślna to 20 ponownych prób, z wyjątkiem błędów krytycznych, takich jak odmowa połączenia lub nie odnalezienie łącza. $ wget -t liczba [URL]
-C Wznów częściowo pobrany plik, jeśli plik obsługuje wznawianie. Jeśli wznawianie nie jest obsługiwane, pobierania nie można wznowić. $ wget -c [URL]
-w Ustaw system tak, aby czekał przez określoną liczbę sekund pomiędzy pobraniami. Ta opcja pomaga zmniejszyć obciążenie serwera poprzez rozmieszczenie żądań. Czas można określić w sekundach, minutach (m), godzinach (h) lub dniach (d). $ wget -w liczba_w_sekundach [URL]
-R Włącz rekurencyjne pobieranie określonych linków, nawet w przypadku błędów krytycznych. Ta opcja rekurencyjnie podąża za linkami w podanym adresie URL. $ wget -r [URL]

Przykład :

1. Aby po prostu pobrać stronę internetową:

Aby pobrać pojedynczy plik z adresu URL, po prostu określ adres URL w następujący sposób:

wget http://example.com/sample.php 

2. Aby pobrać plik w tle

Uruchom proces pobierania w tle za pomocą pliku -b> Lub --background> opcja:

wget -b http://www.example.com/samplepage.php 

3. Aby nadpisać dziennik komendy wget

Przekieruj komunikaty wyjściowe do pliku dziennika za pomocą metody -o> opcja:

wget http://www.example.com/filename.txt -o /path/filename.txt 

4. Aby wznowić częściowo pobrany plik

Jeśli pobieranie zostanie przerwane, wznów je za pomocą przycisku -c> opcja:

wget -c http://example.com/samplefile.tar.gz 

5. Aby spróbować określoną liczbę razy

Określ liczbę ponownych prób za pomocą --tries> opcja:

wget --tries=10 http://example.com/samplefile.tar.gz 

6. Ustaw czas oczekiwania pomiędzy pobraniami:

Ustaw czas oczekiwania pomiędzy pobraniami za pomocą -w> opcja (w sekundach, minutach, godzinach lub dniach):

wget -w 10 http://example.com/large_file.zip 

7. Włącz pobieranie rekurencyjne:

Włącz pobieranie rekurencyjne, aby pobrać całą witrynę internetową za pomocą -r> opcja:

wget -r http://example.com/ 

8. Przeczytaj adresy URL z pliku:

Odczytaj adresy URL z pliku i pobierz je za pomocą -i> opcja:

wget -i urls.txt 

Polecenie Wget – często zadawane pytania

Do czego służy polecenie wget?

Polecenie wget to potężne narzędzie wiersza poleceń używane w systemach Linux i Unix do pobierania plików z Internetu za pośrednictwem protokołów HTTP, HTTPS i FTP. Jest to szczególnie przydatne w przypadku nieinteraktywnych pobrań, kopii lustrzanych stron internetowych i pobrań rekursywnych.

Jak pobrać plik za pomocą wget?

Aby pobrać pojedynczy plik za pomocą wget, możesz po prostu uruchomić polecenie, a następnie podać adres URL pliku, który chcesz pobrać.

Na przykład:

wget https://example.com/file.zip 

Jak mogę pobrać całą witrynę za pomocą wget?

Aby rekursywnie pobrać całą witrynę, użyj metody -m> Lub --mirror> opcja wraz z -p> Lub --page-requisites> możliwość pobrania wszystkich niezbędnych plików.

Na przykład:

wget -m -p https://example.com 

Jak ograniczyć prędkość pobierania lub przepustowość podczas korzystania z wget?

Możesz skorzystać z --limit-rate> opcja ograniczenia prędkości pobierania lub wykorzystania przepustowości.

Na przykład: Aby ograniczyć prędkość pobierania do 500 KB/s, możesz uruchomić:

wget --limit-rate=500k https://example.com/file.zip 

Jak mogę kontynuować przerwane pobieranie za pomocą wget?

Jeśli pobieranie zostanie przerwane, możesz użyć -c> Lub --continue> opcję wznowienia pobierania od miejsca, w którym zostało przerwane.

Na przykład:

wget -c https://example.com/file.zip 

Wniosek

W tym artykule omówiliśmy polecenie Wget, które jest przydatnym narzędziem w systemie Linux do pobierania plików z Internetu bez konieczności interakcji użytkownika. Działa cicho w tle, co oznacza, że ​​możesz rozpocząć pobieranie i robić inne rzeczy, gdy działa. Wget może obsługiwać różne typy adresów internetowych, a nawet kopiować całe strony internetowe. Jest to pomocne w przypadku wolnych lub zawodnych połączeń internetowych, ponieważ próbuje pobrać, dopóki się nie powiedzie. Ponadto oferuje przydatne funkcje, takie jak wznawianie przerwanego pobierania i ustawianie czasu oczekiwania między pobraniami. Poznając proste polecenia i opcje, użytkownicy mogą efektywnie zarządzać swoimi plikami do pobrania i oszczędzać czas.