Базы данныхИнтернетКомпьютерыОперационные системыПрограммированиеСетиСвязьРазное
Поиск по сайту:
Подпишись на рассылку:

Назад в раздел

Конфигурационные файлы Яndex.Site
Руководство по системе Яndex.Site : Настройка системы : Конфигурация (WINDOWS) : Конфигурационные файлы Яndex.Site
Previous: Настройки поисковой странички
Next: Язык запросов Яndex

3.2.3. Конфигурационные файлы Яndex.Site

Для настройки параметров системы необходимо отредактировать входящие в состав дистрибутива файлы Yandex.ini и Default.ini . Формат конфигурационных файлов Яndex.Site является стандартным для MS Windows форматом конфигурационных файлов.

1. Работа Яndex.Site управляется конфигурационным файлом YANDEX.INI, который должен находиться в корневом каталоге Яndex.Site (в каталоге, в котором находится программа YANDEX.EXE). Если этот файл отсутствует, то программа YANDEX.EXE после запуска выдает соответствующее сообщение и завершает свою работу.

Файл содержит одну секцию - [Servers], в которой находится один или несколько ключей вида:

< имя поисковой машины > = < имя конфигурационного файла > [, auto]

где < имя поисковой машины > - произвольное имя, которое присваивается поисковой машине. Это имя в дальнейшем будет использоваться для управления этой поисковой машиной, в том числе для поиска с ее помощью. Имя может состоять из латинских букв и цифр. Если используется только одна поисковая машина, рекомендуется имя Default.

< имя конфигурационного файла > - полное имя (включая имя устроиства и полный путь) конфигурационного файла описываемой поисковой машины. Если используется только одна поисковая машина, то удобно описать ее конфигурацию в файле YANDEX.INI. В этом случае < имя конфигурационного файла > должно совпадать с полным именем YANDEX.INI.

auto - необязательный флажок, при наличии которого поисковая машина автоматически запускается при запуске Яndex.Site.

2. Файл(ы), описывающий конфигурацию поисковых машин, состоит из следующих секций: [Main], [Parsers], [Virtual Robots], [Special Folders], [Protocol] . Секция [Special Folders] является необязательной.

3.2.3.1. Секция [Main]

Эта секция содержит основные параметры настройки Яndex.Site и должна присутствовать обязательно. Некоторые ключи секции имеют значение по умолчанию и могут отсутствовать, все остальные - обязательны.

Обязательные ключи:

1. Имя сервера: Host

Ключ определяет имя хоста, который обслуживает поисковая машина.

Пример: Host = www.comptek.ru

2. Имя поискового приложения: Script

Ключ задает полное имя на WEB-сервере поискового приложения, ссылки на которое поисковая машина помещает в выходные формы. Дополнительный путь определяет имя поисковой машины.

Пример: Script=/Scripts/QueryCGI.exe/Default

В этом примере /Scripts/QueryCGI.exe - имя приложения, а Default - имя поисковой машины.

3. Каталог хранения результатов: CacheFolder

Ключ задает каталог, в котором поисковая машина будет хранить результаты запросов и выходные формы. Указанный каталог должен существовать. Нельзя назначать один и тот же каталог для разных поисковых машин.

Пример: CacheFolder = c:/yandex/cache

4. Каталог хранения индекса: DBaseFolder

Ключ задает каталог, в котором поисковая машина создает индекс документов. Указанный каталог должен существовать. Нельзя назначать один и тот же каталог для разных поисковых машин.

Пример: DBaseFolder = c:/yandex/dbase

5. Каталог картинок: Images

Ключ задает имя каталога на WEB-сервере, в котором находятся картинки, используемые поисковой машиной при генерации выходных форм.

Пример: Images = Images

6. Если в качестве WEB-сервера используется Baikonur Web App Server(r) компании Epsylon Technologies, то дополнительно должен быть определен ключ

Baikonur.Section

Ключ задает имя секции Baikonur, обслуживаемой поисковой машиной.

Остальные ключи:

7. Пропуск файлов: FileFilter

Ключ предназначен для борьбы с некоторыми HTML-редакторами, оставляющими после себя мусор в рабочем каталоге. Файлы, удовлетворяющие < регулярному выражению > (значению ключа), не будут индексироваться.

Пример: FileFilter = _.*|.*tmp.*[.]htm

Приведенный в примере фильтр исключает из процесса индексирования файлы, имена которых начинаются с подчеркивания, и файлы с расширением .HTM, содержащие в имени строку "TMP".

8. Пропуск каталогов: FolderFilter

Ключ исключает из процесса индексирования каталоги (со всеми их подкаталогами), имя которых удовлетворяет поисковому выражению.

Пример: FolderFilter = _.*|temp

Приведенный в примере фильтр исключает из процесса индексирования каталоги, имена которых начинаются с подчеркивания, и каталоги с именем TEMP.

9. Стоп-Слова: StopList

Ключ задает полное имя файла, содержащего список стоп-слов. Параметр может отсутствовать.

Пример: StopList = c:/yandex/stopword.lst

10. Порт: Port

Значение по умолчанию: 80

Ключ определяет номер порта, который используется WEB-сервером.

Пример: Port = 80

11. Время существования запроса: UserTimeout

Значение по умолчанию: 30

Ключ указывает, через сколько минут после последнего обращения удаляется запрос пользователя. Если запрос удален, то пользователю вместо выходной формы посылается соответствующее сообщение("Результат предыдущего запроса уже удален").

Пример: UserTimeout = 10

3.2.3.2. Секция [Parsers]

Секция определяет типы документов, которые должны быть проиндексированы, и имена интерпретаторов для каждого типа документов. Ключами секции являются имена интерпретаторов, значением ключей - список соответствующих им расширений файлов документов, разделенных запятыми. С текущей версией Яndex.Site поставляются интерпретаторы HTML и текстовых документов. Их имена - PRSHTML и PRSTEXT соответственно.

Пример: PRSHTML = .htm,.html

3.2.3.3. Секция [Virtual Roots]

Если в качестве WEB-сервера используется Baikonur Web App Server(r) компании Epsylon Technologies, то данная секция игнорируется. Для остальных WEB-серверов секция является обязательной и описывает структуру каталогов WEB-site'а. Ключами секции являются имена каталогов site'а, а значениями ключей - соответствующие им каталоги файловой системы. Таким образом, записи секции имеют вид:

< каталог site'а > = < каталог файловой системы >

Пример:

/ = c:/webshare/wwwroot
/OurCompany/products = u:/doc/current/products
В приведенном примере корневым каталогом site'а является каталог c:/webshare/wwwroot, а каталогом /OurCompany/products является каталог u:/doc/current/products.

При заполнении этой секции нужно быть предельно внимательным, поскольку неправильное определение ключей может привести к тому, что не все документы site'а будут находиться поисковой машиной и наоборот, документы, доступ к которым через WEB-сервер запрещен, могут стать доступными через поисковую машину.

3.2.3.4. Секция [Special Folders]

Секция является необязательной. В ней описываются каталоги, алгоритм индексирования которых отличается от стандартного. Стандартный алгоритм индексирования обходит все каталоги site'а (описанные в секции [Virtual Roots] ), удаляет из индекса документы, удаленные со времени последнего индексирования, и индексирует измененные и вновь появившиеся документы. При этом для чтения документов используется файловая система и предполагается, что кодировкой документов является WIN 1251.

Чтобы изменить этот алгоритм для некоторых каталогов в секцию включаются записи, ключом которых является имя каталога site'а, а значением - список описанных далее флажков. Такая запись действует как на сам каталог, так и на все его подкаталоги, для которых явно не указаны другие значения флажков. Флажки в списке разделяются запятыми. Имя флажка может быть сокращено до минимального числа букв, по которым его однозначно можно отличить от других флажков (одной буквы). При описании флажков такое сокращенное имя выделяется квадратными скобками.

Все флажки делятся на три группы, каждая состоит из взаимоисключающих флажков. Если в записи, соответствующей каталогу, встречается более одного флажка из группы, то все кроме последнего игнорируются. В описании в каждой группе флажок по умолчанию выделен значком *.

Группа 1. Флажки, определяющие доступ к документам

[h]ttp - использовать для чтения документов WEB-сервер.

Флажок применяется для каталогов, содержащих документы, которые изменяются при передаче WEB-сервером (например, активные (ASP) документы).

[f]ile* - использовать для чтения документов файловую систему.

Группа 2. Флажки, определяющие алгоритм обновления индекса

Действие флажков группы приведено в следующем списке:

[r]eindex - убирать из индекса удаленные документы и индексировать все существующие документы, даже если дата изменения осталась прежней. Обычно флажок используется совместно с флажком http (группа 1) для индексации активных документов. Если вся активность документов заключается только в использовании операторов типа include, то для каталогов, содержащих такие документы, устанавливается флажок update (см. ниже), и только для индексации после изменения включаемых документов устанавливается флажок reindex .

[e]xclude - исключить каталог из пути индексирования. Флажком помечаются каталоги, документы которых Вы не хотите индексировать.

[u]pdate* - удалять из индекса отсутствующие документы и переиндексировать документы с измененной датой.

[s]kip - пропускать каталоги при индексировании, не удаляя из индекса лежащие в них документы. Флажок применяется для каталогов, документы в которых не меняются (например, архивов), и для временно недоступных каталогов.

Группа 3. Флажки, определяющие кодировку документов

[w]in* - стандартная кодировка; [a]lt - альтернативная кодировка; [k]oi - код КОИ-8

Группа 4. Флажки задания раздела

[t]opic: - включить каталог (и все подчиненные)в раздел ( -[t]opic: - исключить каталог из раздела)

Синтаксис: t:[имя_атрибута]=[значение_атрибута]

Пример: /our_company=skip,koi,t:subtree=ourcompany,t-:subtree=news

При изменении конфигурации разделов необходимо переиндексировать базу.

3.2.3.5. Секция [Protocol]

Секция определяет имена файлов, в которые поисковая машина записывает протокол работы и сообщения об ошибках. Секция содержит следующие ключи:

1. Протокол индексирования: Index

Ключ определяет полное имя файла, в котором ведется протокол индексирования.

Пример: Index = c:/yandex/default_i.txt

2. Протокол поиска: Search

Ключ определяет полное имя файла, в котором ведется протокол поиска.

Пример: Search = c:/yandex/default_s.txt


Руководство по системе Яndex.Site : Настройка системы : Конфигурация (WINDOWS) : Конфигурационные файлы Яndex.Site
Previous: Настройки поисковой странички
Next: Язык запросов Яndex


  • Главная
  • Новости
  • Новинки
  • Скрипты
  • Форум
  • Ссылки
  • О сайте




  • Emanual.ru – это сайт, посвящённый всем значимым событиям в IT-индустрии: новейшие разработки, уникальные методы и горячие новости! Тонны информации, полезной как для обычных пользователей, так и для самых продвинутых программистов! Интересные обсуждения на актуальные темы и огромная аудитория, которая может быть интересна широкому кругу рекламодателей. У нас вы узнаете всё о компьютерах, базах данных, операционных системах, сетях, инфраструктурах, связях и программированию на популярных языках!
     Copyright © 2001-2024
    Реклама на сайте