Краткий обзор DeviceLock : Сервер DeviceLock Content Security Server : Как работает поисковый сервер
  
Как работает поисковый сервер
Поисковый сервер выполняет следующие функции:
Индексирует данные DeviceLock Enterprise Server.
Выполняет полнотекстовые запросы после операции индексирования.
Более подробное описание этих функций представлено ниже.
Индексирование данных DeviceLock Enterprise Server
Индексирование - это процесс, в результате которого текстовые данные на DeviceLock Enterprise Server становятся доступными для поиска и просмотра.
Поисковый сервер начинает индексирование автоматически, как только будут указаны экземпляры сервера DeviceLock Enterprise Server. В результате процесса индексирования создается или обновляется полнотекстовый индекс. Каждый поисковый сервер создает только один полнотекстовый индекс, что делает управление более эффективным. В полнотекстовом индексе хранятся данные о существенных для поиска словах и их позициях. В процессе создания или обновления индекса поисковый сервер отбрасывает неучитываемые слова (такие, как предлоги, артикли и т.п.), которые не повышают эффективность поиска.
Поисковый сервер индексирует все текстовые данные из следующих источников: журнал аудита, журнал теневого копирования, журнал удаленных данных теневого копирования, внутренний журнал сервера DeviceLock Enterprise Server, журнал мониторинга и журнал политик сервера DeviceLock Enterprise Server.
Процесс индексирования выполняется в два этапа. На первом этапе поисковый сервер извлекает ключевые слова из теневых копий и записей в журналах и сохраняет их во временные индексы для каждого указанного DeviceLock Enterprise Server. Для каждого временного индекса поисковый сервер обрабатывает 1000 записей из каждого журнала. На втором этапе, когда число временных индексов становится равным 50 или проходит 10 минут, инициируется процесс объединения всех временных индексов в один главный полнотекстовый индекс, который используется для поисковых запросов. Процесс объединения временных индексов в главный полнотекстовый индекс называется слиянием (merging).
Процесс создания главного полнотекстового индекса требует много времени. Скорость индексирования может значительно изменяться в зависимости от типа индексируемых данных и используемого оборудования. Скорость индексирования обычно находится в диапазоне от 30 до 120 MB/мин. Рассмотрим следующий пример:
Данные: 170 GB, состоящие из 4 373 004 файлов разного типа (HTML, офисные документы, текстовые файлы)
Время индексирования: 24.7 часов (6.8 GB/час)
Размер индекса: 12% от исходного размера документов
Оборудование: Pentium® 4 Processor 550 (3.40GHz, 800 FSB), 2GB RAM, встроенный SATA RAID-0.
Выполнение поисковых запросов
После того, как данные на DeviceLock Enterprise Server будут проиндексированы, можно выполнять полнотекстовые запросы. Эти запросы могут выполнять поиск по заданным словам или фразам.
При выполнении запроса поисковый сервер обрабатывает его и извлекает из индекса список результатов поиска, соответствующих критериям поискового запроса. Чтобы ограничить количество возвращаемых по поиску результатов, можно использовать фильтрование. Например, результаты поиска могут быть отфильтрованы по типу журнала или дате.
Запросы к полнотекстовому индексу выполняются очень быстро. Операция поиска, в ходе которой находятся и возвращаются совпадения, удовлетворяющие критериям поиска, занимает лишь несколько секунд. Для получения подробной информации о странице результатов поиска и результатах поиска см. раздел Работа с результатами поиска далее в этом документе.