div.main {margin-left: 20pt; margin-right: 20pt}
WGET как достойная альтернатива
всем
О непосредственно предмете разговора можно сказать одно — это шедевр.
Потому как если бы я сказал, что wget многим лучше и удобнее, чем, к примеру,
Teleport Pro, то мне с опаской бы пришлось выходить на улицу. Или же нанимать
телохранителя, что с моим скромным бюджетом не реально. wget — есть
бесплатное, удобное, поставляемое с исходными текстами мощное средство для
выкачивания сайтов. Это не единственное, но основное его применение.
Рассмотрим данный инструмент поподробнее. Если у вас стоит операционная
система Linux, то в основном wget устанавливается по умолчанию вместе с
дистрибутивом и нет необходимости в ее поиске. Это, в частности, относится к
дистрибутивам Red Hat, Caldera, Mandrake и пр. Если ваш дистрибутив не
позаботился об установке wget, то наверняка на инсталляционном поиске
находится установочный пакет либо архив tar.gz(tgz). Если вы пользуетесь
операционными системами фирмы Microsoft, то вам следует скачать http://www.
interlog.com/ ~tcharron/wgetwin-1_5_3_1-binary.zip. Размер архива ~106Kb.
Распакуйте архив в директорию, где вы предполагаете разместить wget. Теперь
пришло время научиться пользоваться этим маленьким монстром. wget не имеет GUI
и вообще какого-либо пользовательского интерфейса. Все операции осуществляются
через командную строку. Сперва не искушенному пользователю Windows это может
показаться совсем не удобным, однако со временем, поработав с wget, он придет
к выводу, что это намного лучше самого крутого GUI. Что ж, преступим
непосредственно к навыкам работы с wget. Для начала наберите в командной
строке (shell) строчку: wget --help На экран вывелась подсказка по
использованию программы. Информации довольно много, и на один экран она не
уместится, посему пользователям Linux надо использовать либо скроллинг(xterm),
либо нажимать Shift-PgUP, либо последовать изложенному ниже совету.
Windows-пользователи выполняют следующее: wget --help >
wget_usage.txt Теперь можно спокойно читать wget_usage.txt. Формат
командной стоки прост: wget [options] [URL], где URL — адрес выкачиваемого
сайта, и options — параметры выкачки. Если вы хотите, чтобы при старте wget
выполнялся на фоне, то следует использовать опцию —background. Рассмотрим
основные параметры. — input-file=FILE — имя файла, откуда будут браться
URL'ы для выкачивания. Параметры журналирования: — output-file=FILE —
создается новый лог FILE — append-output=FILE — записи добавляются в лог
FILE — quiet — не выводить сообщений Параметры скачивания: —
tries=NUMBER — устанавливает количество попыток (0 — неограниченное количество
попыток) — continue — продолжить закачку — server-response — выводить
ответы сервера — wait=SECONDS — задержка между попытками — proxy=on/off
— включить/выключить прокси Параметры директорий: — no-directories — не
создавать директории — force-directories — создавать Параметры
HTTP: — http-user=USER — подставить имя пользователя — http-passwd=PASS
— подставить пароль — user-agent=AGENT — подставить User Agent (имя
приложения) — save-headers — сохранять HTTP-заголовки в файлах Параметры
шаблонов выкачки: — accept=LIST — список принимаемых расширений —
reject=LIST — список запрещенных расширений — domains=LIST — список
принимаемых доменов — exclude-domains=LIST — список отвергаемых
доменов. Это ничтожная часть опций, доступных пользователям wget. Было
опущено огромное количество настроек, в том числе ограничение на директории,
запрещение DNS, рекурсивные опции, работа с ftp и многое другое. А сейчас
давайте попробуем просто скачать сайт www.linuxprogramming.com (для примера,
естественно, не целиком;). Для этого в командной строке напишем: wget —
force-directories http://www.linuxprogramming.com wget — быстрый, небольшой
по размерам, мощный и гибкий инструмент для выкачивания из Интернет различной
информации. Он прост в использовании и может запросто заменить кучу софта.
Того больше, вы получаете полностью готовые к компиляции исходные тексты и, в
соответствии с лицензией GNU GPL, можете вносить изменения в код программы для
своих нужд.
Алексей Литвинюк, litvinuke@tut.by Fido
2:454/2.110
|