div.main {margin-left: 20pt; margin-right: 20pt}
Что такое
CYGWIN
После статьи Криса Касперски "Как из Windows сделать Unix" в КГ №3 от
23.01.01 я загорелся желанием чуть подробнее рассказать пользователям Windows
о том, что такое Cygwin. Пользуюсь я им достаточно давно и уже не могу
эффективно работать в Windows без установленного Cygwin.
Слово Cygwin складывается из двух составляющих: Cygnus — это имя компании,
и Windows, но было бы неверно сказать, что все в Cygwin написано ребятами из
Cygnus. Cygwin — это порт утилит Gnu под Windows, а Gnu (www.gnu.org) — это
проект Фонда Свободного Программного Обеспечения (Free Software Foundation,
или просто FSF), ставящий своей целью создание некоммерческой Unix системы, не
принадлежащей никому в отдельности и свободной от ограничивающих свободу
распространения и модификации ПО лицензий. В рамках этого проекта были
переписаны заново практически все стандартные утилиты UNIX. Три самых
значительных вклада FSF — это gcc (Gnu C Compiler, или Gnu Compiler
Collection), Bash (командный интерпретатор Bourne Again Shell) и Emacs. Без
gcc не было бы Линукса, а Bash — стандартная командная оболочка для многих
современных Unix-систем. Люди с опытом говорят, что первое, что делают
сисадмины после установки коммерческих Unix'ов, — это доинсталлируют Gnu
утилиты. В принципе, GNU и FSF сами по себе — тема обширная и заслуживающая
отдельной подробной статьи.
Весь набор Gnu-утилит представляет собой набор маленьких (как правило)
программок, которые покрывают большинство задач, с которыми ежедневно
сталкивается пользователь Unix системы (и не только Unix), каждая такая
программка выполняет одну задачу, и выполняет ее хорошо. Эти программки могут
затем комбинироваться для решения различных задач.
Попытки перенести Gnu на другие, не Unix платформы осуществлялись не раз,
что, кстати, свидетельствует об их популярности.
Стоит упомянуть проект портирования утилит под DOS — DJGPP. Сходите на сайт
http://www.delorie.com/djgpp/, это действительно интересно.
Cygnus не стал компилировать каждую утилиту в отдельности, мучаясь каждый
раз для решения одних и тех же проблем, вместо этого была написана некая
'прокладка' между GNU утилитами и операционной системой. Эта прокладка —
cygwin1.dll (1 — номер версии) — обеспечивает эмуляцию системных вызовов UNIX,
что позволяет компилировать и исполнять Unix программы без или почти без
изменения исходного кода. В принципе, эта dll и есть сам Cygwin, а все
остальное — программные пакеты GNU, скомпилированные для работы с Cygwin.
Наличие gcc и библиотек дает возможность переносить под Windows самые
различные приложения и делает Cygwin полноценной платформой — вы можете иногда
найти выражение "Cygwin platform". Со времени первых бета-версий Cygwin
различные люди компилировали под Cygwin то, чего им не хватало под Windows,
рос постепенно и стандартный дистрибутив Cygwin, в том числе и за счет этих
самопальных компиляций. К примеру, во время версии Beta 20 мне приходилось
отдельно скачивать редактор vim, а сейчас он ставится вместе со всем
набором.
Как это все инсталлировать
В Cygnus написали удобную программку для управления пакетами, слегка
напоминающую некоторые аналогичные программы из дистрибуций ОС Линукс. Первый
шаг — это скачать ее с сайта Cygnus
http://sources.redhat.com/cygwin/setup.exe. Запустив ее, Вы сможете скачать
стандартный набор пакетов с одного из многочисленных зеркал, причем Вы можете
желать это выборочно, пропуская отдельные пакеты.
На будущее — запуская эту программку позже из этой же директории, Вы
сможете увидеть, какие появились новые пакеты или новые версии уже имеющихся
пакетов.
Эта же программа и поставит Вам Cygwin, опять предлагая самому
распорядиться, что устанавливать, а что нет. Инсталляция создаст Вам
директории, обычные для файловой иерархии Unix — bin, usr, sbin, и т.д.,
поэтому удобно поместить их все в какую-то одну директорию, дабы они не
путались с Вашими виндозными папками.
И как этим всем пользоваться
Когда Вы запустите Cygwin, вы увидите окошко с консолью, подобное обычной
виндозной консоли, command.com в Win9x или cmd.exe в NT. Но нет! У Вас на
Windows запустился славный потомок юниксовых командных интерпретаторов,
который и пыталась имитировать command.com со своими BAT файлами. Bash и его
старший брат sh — это тот клей, который связывает в одно целое Unix систему,
он может вполне полноправно называться языком программирования, то есть на нем
можно писать.
Несколько основных команд и их аналоги в Windows
ls = dir — просмотреть содержание директории; cd = chdir — перейти в
другую директорию; cp = copy — скопировать файл; mv = mv —
переместить/переименовать файл; rm = del — удалить файл; mkdir = mkdir —
создать директорию; pwd — вывести текущую директорию.
Запомните — большое “A” уже не равно маленькому “a”, символ теперь должен
быть заменен на /. Команда cd / в Cygwin приведет Вас в ту директорию, где
находятся bin, usr и т.д. В Unix выше / уже ничего нет, а в Cygwin для того,
чтобы путешествовать по виндозным партициям, можно пользоваться командой cd
//c/ (cd //d/MyDir и т.д.).
Одна из удобнейших особенностей Bash — это автодополнение (autocompletion).
Создадим командой cat несколько файлов:
cat > first_file ENTER
введите что-то, затем Ctr-C,
и то же самое для другого файла:
cat > second_file ENTER.
Убедитесь, что файлы существуют:
ls
Теперь наберите любую команду, например, ls, и первую букву первого файла.
Нажмите TAB. Bash сам допишет имя файла. Если файлы начинаются одинаково,
например, file_one и file_two, Bash допишет только file_ и подождет, пока Вы
введете еще одну букву, чтобы устранить многозначность.
ПРИМЕРЫ
Несколько примеров использования некоторых утилит.
Допустим, у Вас есть текстовый файл in.txt. Посчитать количество слов в нем
Вы можете так:
wc -w in.txt
Количество строк:
wc -l in.txt
Найти строки, содержащие последовательность символов Larry:
grep 'Larry' in.txt
Разбить строки на слова, заменяя пробелы на символы конца строки:
cat in.txt | gawk 'gsub(" +","n")'
Команда gawk 'gsub(" +","n")' значит — заменить один или больше пробелов
(" +") на символ конца строки ("n").
Сделать то же самое, но с возможностью удобного просмотра (PageUp,
PageDown, выйти — q)
cat in.txt | gawk 'gsub(" +","n")' | less
Отсортировать строки (слова):
cat in.txt | gawk 'gsub(" +","n")' | sort | less
Убрать одинаковые строки (слова):
cat in.txt | gawk 'gsub(" +","n")' | sort | uniq | less
Подсчитать количество уникальных строк (слов):
cat in.txt | gawk 'gsub(" +","n")' | sort | uniq | wc -l
Убрать одинаковые строки (слова), считая их количество:
cat in.txt | gawk 'gsub(" +","n")' | sort | uniq --count | less
Опять отсортировать, получив, таким образом, частотный словник текста:
cat in.txt | gawk 'gsub(" +","n")' | sort | uniq --count | sort -r |
less
То же самое, с выводом результатов в текстовый файл:
cat in.txt | gawk 'gsub(" +","n")' | sort | uniq --count | sort -r >
out.txt
То же самое, с сохранением промежуточных результатов в файле
intermediate.txt:
cat in.txt | gawk 'gsub(" +","n")' | tee intermediate.txt | sort | uniq
--count | sort -r | less
Теперь, используя возможности Bash, можно повторить эту команду для
нескольких файлов. Набирайте скрипт прямо в консоли, переходя на новую строку
так, как это напечатано в статье, — Bash поймет, что команда не закончена и
сменит приглашение на '>':
for file in *.txt; do
cat $file | gawk 'gsub(" +","n")' | sort | uniq --count | sort -r >
$file.out
echo $file done
done
Вот так. Простые задачи — простые решения.
Чтобы узнать, как работает та или иная команда, можно запустить ее с ключом
--help либо воспользоваться командой man (manual) — man awk, man grep. Выйти
из man можно с помощью q.
ЧТО ЕЩЕ ЕСТЬ В CYGWIN
GCC
Компилятор
GDB
Gnu Debugger
AWK и GAWK
Простой (люди говорят — 1 день обучения) язык программирования для
обработки текстов, один из предков Perl
SED
Потоковый редактор
YACC
Генератор парсеров на С
BISON
Генератор парсеров на С
TCL/TK
Язык программирования. Собственно к утилитам Gnu прямого отношения не
имеет, некоторое время поддерживался корпорацией Sun. Можно сделать cd
/usr/share/tk8.0/demos и запустить программку widget —./widget. Вы увидите
демонстрацию возможностей Tk — расширения Tcl для создания GUI.
GZIP
Архиватор
BZIP2
Мощный архиватор
DIFF
Программа для сравнения файлов
И очень много другого. Просто зайдите в bin и посмотрите, что у Вас там
лежит. Залежи пакетов можно найти на сайте
http://www.hirmke.de/software/develop/gnuwin32/cygwin/porters/Hirmke_Michael/GNUWin32-contents.html.
Также много информации и линков по теме есть на сайте Cygnus
http://sources.redhat.com/cygwin/.
Как настроить CYGWIN
Во-первых, Вам совсем не обязательно запускать Bash, если Вас пугает
консоль. Вы можете пользоваться всеми программками из Far'а, Windows
Commander'а и т.д., нужно только прописать пути к директории bin. В Windows 9x
это делается в файле autoexec.bat, в NT в My Computer / Properties /
Environment к переменной окружения PATH нужно добавить дорожку к bin.
Для более удобной работы в Bash советую сделать следующее: если директории
Cygwin у Вас находятся в c:cygwin, создать директорию c:cygwinroot (mkdir
/root) и внести строку в файл cygwin.bat, что лежит в c:cygwin:
HOME=d:cygwinroot
В директории root следует создать 2 файла, начинающихся с точки: .inputrc и
.bashrc. Оба файла исполняются Bash при запуске, .inputrc отвечает за то,
чтобы правильно работали все клавиши, а .bashrc содержит различную информацию.
Как пример приведу свой .bashrc:
#!/bin/bash
export PS1='w > '
export PATH=".:$PATH"
alias ls="ls --color"
alias untar="tar xvf"
cd //d/
echo Welcome to CygWin!
Первая строка указывает путь Bash. Так в Юниксе поступают со всеми
интерпретаторами. К примеру, если у вас есть скрипт hello.pl на Perl, а сам
perl в /usr/bin, Вы можете написать в первой строке:
#!/usr/bin/perl
и запускать его так:
./hello.pl
вместо
perl hello.pl
Таким образом, можно запускать программы, не заботясь о том, на чем они
написаны.
PS1 — это переменная, в которой хранится Bash prompt, приглашение к работе,
как его еще называют. w — это текущая директория.
Далее я добавляю к переменной окружения PATH точку, что символизирует
текущий каталог. Обычно в Unix, чтобы запустить программу из текущего
каталога, надо явно его указать:
./hello.pl
После такого добавления к PATH можно делать так, как это привыкли делать
Windows пользователи:
hello.pl
Далее я использую синонимы, или alias'ы. К примеру, команда ls по умолчанию
не раскрашивает свой вывод в зависимости от того, чем являются файлы, для
этого ее нужно запустить с ключом --color. Это неудобно. Командой alias ls="ls
--color" я решаю эту проблему. Теперь ls значит ls --color. Не обязательно
использовать то же имя команды, можно сделать ll="ls --color" — и пользоваться
новой командой ll. Примерно так я делаю, создавая команду untar для распаковки
tar архивов, вместо того, чтобы каждый раз набирать tar xvf. В alias можно
помещать и pipes (трубы, конвейеры): alias sort_un_sort=" sort | uniq --count
| sort -r ".
В действительности простор для обустройства рабочего места здесь
безграничен, и мои примеры примитивны и просты. Есть еще функции,
интерактивные команды в .bashrc, функции, запускающиеся из приглашения
(prompt)...
Надеюсь, у Вас появилось желание поэкспериментировать с Cygwin. Ваши
комментарии присылайте на yurleik@tut.by.
Юрий Лейкинд
(c)компьютерная
газета
|