Гномы серверов Часть 1
Дмитрий Рамодин Журнал "Мир ПК" (Издательство "Открытые Системы")
Если вам необходимо раcширить функциональные возможности сервера Web, можно написать CGI-сценарий. А можно разработать и установить расширение на основе ISAPI. Да мало ли чего еще можно придумать! А если нравится писать программы на Java, считайте, что вам повезло. Ознакомьтесь с несколькими классами из набора Java Servlet Development Kit (JSDK) - и вперед. С помощью JSDK можно разрабатывать так называемые сервлеты - специальные программы, выполняющиеся в рамках серверов, способные обрабатывать сложные клиентские запросы и динамически генерировать ответы на них. Примером использования сервлетов может служить расширение, читающее запрос на языке SQL, анализирующее его и делающее выборку данных из хранилища, а также пересылающее клиенту HTML-страницу, сгенерированную автоматически на основе полученных данных (рис. 1).
Преимуществом сервлетов можно считать то, что они пишутся на объектно-ориентированном языке высокого уровня, к которому имеется масса дополнений и программных интерфейсов, а это значительно увеличивает область применения расширений на основе сервлетов. Если у вас есть готовая серверная логика, написанная на Java, то превратить ее в сервлет легче легкого. Вся библиотека классов языка Java у вас в руках! Подключать и настраивать сервлеты также несложно.
Наибольшее распространение получили сервлеты, обрабатывающие запросы по протоколу HTTP - стандартному протоколу обмена данными WWW.
Как устроен сервлет
Главным родителем всех сервлетов является интерфейс Servlet. Следующий уровень иерархии - абстрактный класс GenericServlet, частично реализующий методы Servlet и служащий базой для создания экзотических сервлетов. Скорее всего, вам никогда не доведется обращаться к нему. Разумнее будет воспользоваться в качестве базового абстрактным классом HttpServlet. Таким образом, главное, что нужно сделать для получения работоспособного сервлета, - это создать класс, наследующий HttpServlet. А уже потом следует заняться написанием логики работы. На рис. 2 представлена иерархическая диаграмма, показывающая взаимосвязь классов в Java Servlet Development Kit. Пунктирной рамкой отмечено место, отведенное сервлету пользователя.
Базовая часть классов JSDK помещена в пакет javax.servlet. Однако класс HttpServlet и все, что с ним связано, располагаются на один уровень ниже в пакете javax.servlet.http. Это следует учитывать при разработке. Также не забывайте, что основные сервлетообразующие классы находятся в архивном файле jsdk.jar, поэтому этот архив должен упоминаться в переменной среды CLASSPATH или же должен быть задан вручную в параметре командной строки -classpath при запуске компилятора javac.
Последовательность работы сервлета проста: инициализация, обслуживание запросов и завершение существования. В каждой из этих фаз сервер, на котором выполняется сервлет, вызывает соответствующий метод интерфейса Servlet.
Первым вызывается метод init. Он дает сервлету возможность инициализировать важные данные и подготовиться для обработки запросов. Чаще всего в этом методе программисты помещают исходный текст, кэширующий данные фазы инициализации и промежуточные результаты различных вычислений.
После этого сервер находится в ожидании запросов от клиентов. Появившийся запрос немедленно преобразуется в вызов метода service сервлета, а все параметры запроса упаковываются в объект класса ServletRequest, который передается в качестве первого параметра метода service. Второй параметр метода - объект класса ServletResponse. Туда упаковываются выходные данные в процессе формирования ответа клиенту. Каждый новый запрос приводит к новому вызову метода service. В соответствии со спецификацией JSDK, метод service должен уметь обрабатывать сразу несколько запросов, т. е. быть синхронизирован для выполнения в многопоточных средах. Это особенно критично, когда в нем происходит обращение к разделяемым данным. Если же нужно избежать множественных запросов, сервлет должен реализовать интерфейс SingleThreadModel. Последний не содержит ни одного метода и служит лишь меткой, говорящей серверу об однопоточной природе сервлета. При обращении к такому сервлету каждый новый запрос будет стопориться в очереди и ожидать, пока не завершится обработка предыдущего запроса.
Завершив выполнение сервлета, сервер вызывает его метод destroy, предполагая, что в нем сервлет "почистит" занятые ранее ресурсы. Программируя этот метод, разработчик должен помнить, что в многопоточных средах сервер может вызвать метод destroy в любой момент, даже когда еще не завершился метод service. Поэтому на передний план выходит обязательная синхронизация доступа к разделяемым ресурсам.
Интерфейсом Servlet предусмотрена реализация еще двух методов: getServletConfig и getServletInfo. Первый возвращает объект типа ServletConfig, содержащий параметры конфигурации сервлета, а второй - строку, кратко описывающую назначение сервлета, и прочую полезную информацию.
Сервлет HttpServlet, отвечающий за обработку запросов HTTP, устроен несколько сложнее. Он уже имеет реализованный метод service, служащий диспетчером для других методов, каждый из которых обрабатывает методы доступа к ресурсам. В спецификации HTML определены следующие методы: GET, HEAD, POST, PUT, DELETE, OPTIONS и TRACE. Наиболее часто употребляются GET - универсальный запрос ресурса по его универсальному адресу (URL) - и POST, с помощью которого на сервер передаются данные, введенные пользователем в поля интерактивных Web-страниц. Полное описание протокола HTTP 1.1 можно найти в Internet по адресу http://info.internet.isi.edu/in-notes/rfc/files/ rfc2068.txt.
Возвратимся к методу service HttpServlet. В его задачу входит анализ полученного через запрос метода доступа к ресурсам и вызов соответствующего метода, имя которого сходно с названием метода доступа к ресурсам, но в начале имени добавляется префикс do: doGet, doHead, doPost, doPut, doDelete, doOptions и doTrace. От разработчика же требуется переопределить нужный метод (чаще всего это doGet), разместив в нем функциональную логику.
Вспомогательные классы
Чтобы успешно использовать сервлеты, необходимо ознакомиться с рядом вспомогательных классов. Для начала узнаем, какие методы предлагает интерфейс ServletRequest, передающий сервлету запрос от клиента. Конечно же, запрос поступает не в том виде, в котором он приходит на сервер. Поток данных от клиента сортируется и упаковывается. Далее, вызывая методы интерфейса ServerRequest, можно получать определенный тип данных, посланных клиентом. Так, метод getCharacterEncoding определяет символьную кодировку запроса, а методы getContentType и getProtocol - MIME-тип пришедшего запроса, а также название и версию протокола соответственно. Информацию об имени сервера, принявшего запрос, и порте, на котором запрос был "услышан" сервером, выдают методы getServerName и getServerPort. Интересные данные можно узнать и о клиенте, от имени которого пришел запрос. Его IP-адрес возвращается методом getRemoteAddr, а его имя - методом getRemoteHost.
Если вас интересует прямой доступ к содержимому полученного запроса, самый надежный способ получить его - вызвать метод getInputStream или getReader. Первый возвращает ссылку на объект класса ServletInputStream, а второй - на BufferedReader. После этого можно читать любой байт из полученного запроса, используя технику работы с потоками Java.
Если, обращаясь к серверу, клиент помимо универсального адреса задал параметры, сервлету может понадобиться узнать их значение. Примером может служить электронная анкета, выполненная в виде Web-страницы с формой ввода, значения полей и кнопок которой автоматически преобразуются в параметры URL. Три специальных метода в интерфейсе ServletRequest занимаются разбором параметров и "выдачей на-гора" их значений. Первый из них, getParameter, возвращает значение параметра по его имени или null, если параметра с таким именем нет. Похожий метод, getParameterValues, возвращает массив строк, если задан сложный параметр, скажем, значения полей формы. И еще один метод, getParameterNames, возвращает энумератор, позволяющий узнать имена всех присланных параметров.
В классе HttpServletRequest имеются различные дополнительные методы, обеспечивающие программисту доступ к деталям протокола HTTP. Так, вы можете запросить массив cookies, полученный с запросом, используя метод getCookies. Узнать о методе доступа к ресурсам, на основе которого построен запрос, можно с помощью вызова getMethod. Строку запроса HTTP можно получить методом getQueryString. Даже имя пользователя, выполнившего запрос, не укроется от сервлета, если применить метод getRemoteUser.
Это, разумеется, лишь малая толика тех возможностей, которыми обладают вышеупомянутые классы ServletRequest и HttpServletRequest. Поэтому следует внимательно прочитать документацию по Servlet API.
Генерируемые сервлетами данные пересылаются серверу-контейнеру с помощью объектов, наследующих интерфейс ServletResponse, а сервер, в свою очередь, пересылает ответ клиенту, инициировавшему запрос. У интерфейса ServletResponse всего несколько методов, причем полезными оказываются не все. Чаще всего приходится задавать MIME-тип генерируемых данных методом setContentType и находить ссылки на потоки вывода двумя другими методами: getOutputStream возвращает ссылку на поток ServletOutputStream, а метод getWriter вернет ссылку на поток типа PrintWriter. Вы увидите, как ими пользоваться, когда мы будем рассматривать практический пример.
В классе HttpServletResponse, реализующем интерфейс ServletResponse, обнаруживаются еще несколько полезных методов. Например, вы можете переслать cookie на клиентскую станцию, вызвав метод addCookie. О возникших ошибках сообщается вызовом sendError, которому в качестве параметра передается код ошибки и при необходимости текстовое сообщение. Кроме того, по мере надобности в заголовок ответа можно добавлять параметры, для чего служит метод setDateHeader.
Ранее уже упоминался метод getServletConfig, но не было сказано об объекте ServletConfig, у которого имеются очень полезные методы. Инсталлируя сервлет на сервере, вы можете задавать параметры инициализации, о которых будет сказано в следующей части. Имена этих параметров можно получить через энумератор, возвращаемый методом getInitParameterNames. Значение же конкретного параметра получают вызовом getInitParameter. Также важен метод получения контекста сервлета getServletContext, через обращение к которому можно узнать много полезного о среде, в которой запущен и выполняется сервлет.
Контекст выполнения сервлета интересен тем, что дает примитивные средства для общения с сервером. Скажем, для выполнения задачи требуется узнать MIME-тип того или иного файла. Всегда пожалуйста, вызовите метод getMimeType контекста. Или нужно узнать истинный маршрут файла относительно каталога, в котором сервер хранит документы. Тоже нет проблем, метод getRealPath к вашим услугам. Информация же о самом сервере предоставляется по вызову getServerInfo().
Отдельно стоят метод, загружающий сервлет по имени getServlet, и метод, возвращающий энумератор с именами всех установленных сервлетов getServletNames. Однако не рекомендуется пользоваться ими, так как в будущей версии Java Servlet Development Kit их может уже и не быть.
И напоследок самый важный метод log. С его помощью нужные текстовые данные пишутся в протокол работы сервлетов.
Мы рассмотрели наиболее часто используемые программистами классы и методы JSDK. Однако, если ваши задачи сложны и требуют тонкого подхода, внимательно изучите справочник по API, имеющийся в составе Java Servlet Development Kit. Последний можно бесплатно загрузить с сервера http://www.javasoft.com.
[Вперед]
|