Сервер DeviceLock Content Security Server : Использование поискового сервера : Выполнение поиска
  
Выполнение поиска
Поисковый сервер позволяет найти все записи во всех журналах сервера DeviceLock Enterprise Server, где встречается определенное слово или текстовый фрагмент. Поскольку поисковые запросы обычно возвращают большое количество результатов, предусмотрен ряд параметров для точной настройки и оптимизации поиска. Эти параметры позволяют указать, какие именно результаты должен возвращать поиск.
С помощью параметров поиска можно:
Фильтровать результаты поиска по дате, журналу, отправителю, получателю, типу файла, источнику и т.п. Например, фильтр позволяет ограничить результаты поиска определенными журналами и заданным диапазоном дат.
Задать количество результатов поиска на страницу.
Описание параметров поиска, а также инструкцию по настройке и выполнению поиска, см. в разделе Действия по выполнению поиска.
После завершения поиска сервер возвращает страницу результатов, состоящую из нескольких областей:
Область запроса - Отображает заданные критерии поиска.
Строка статистики - Показывает количество результатов поиска, отображённых на текущей странице результатов.
Область результатов поиска - Отображает нумерованный список найденных результатов, соответствующих заданным критериям поиска.
Навигатор результатов - Показывает количество страниц с результатами поиска и позволяет переходить с одной страницы на другую.
Подробнее о странице результатов поиска см. в разделе Работа с результатами поиска.
При использовании полнотекстового поиска важно учитывать следующее:
Возможен поиск по отдельным полям, которые представлены в разделах Параметры журнала и Параметры документа результата поиска. Для этого используется следующий синтаксис: <Имя поля>::<Значение>. Пример: Имя файла::Prices.docx.
Для поиска можно использовать несколько пар имя-значение поля, взяв каждую такую пару в скобки. Например, результатом поиска (Имя файла::secret) (Тип файла::Excel) будут файлы Excel, содержащие слово secret в имени файла.
 
Внимание: Имена полей следует указывать с учетом регистра. Строчные и прописные буквы в имени поля различаются.
При поиске в журнале активности пользователей выполняется также поиск в записях ввода с клавиатуры. Возможен поиск фрагментов текста и паролей, которые вводил пользователь. Поиск паролей выполняется по значению поля Пароли записи активности пользователей: Пароли::<Значение>. Например, для поиска записей, содержащих какие-либо пароли, используйте следующий синтаксис: Пароли::?* (звездочка без вопросительного знака соответствовала бы любому паролю или отсутствию пароля).
В строке поискового запроса можно указывать логические операторы, такие как AND (И) и OR (ИЛИ). Пробел между словами трактуется как AND. Точка с запятой (;) трактуется как OR. Логические операторы необходимо печатать большими буквами. Подробнее см. в разделе Обзор логических операторов.
При выполнении поиска не учитывается регистр букв в строке поискового запроса, за исключением поиска по значению поля. Имена полей чувствительны к регистру.
Стемминг (морфологический поиск) включен по умолчанию. Стемминг обеспечивает поиск вариантов заданного слова по его грамматической основе. Поддерживается для английского, испанского, итальянского, немецкого, португальского, русского и французского языков. Например, запрос applied обнаружит также слова applying, applies и apply.
В строке поискового запроса можно использовать знаки подстановки звездочка (*) и вопросительный знак (?). Звездочка обозначает произвольный набор символов или их отсутствие. Вопросительный знак обозначает произвольный одиночный символ. Знаки подстановки можно использовать в любом месте строки и в любом количестве.
Для поиска определенной фразы необходимо заключить ее в двойные кавычки в строке поискового запроса. Для поиска нескольких слов необходимо разделить их пробелами.
В следующей таблице приводятся примеры и результаты различных вариантов поиска.
 
Вариант поиска
Пример
Результаты поиска
Отдельное слово
price
Все результаты, содержащие слово price. Будут найдены также различные грамматические формы слова, такие как prices, priced и т.п.
Фраза
confidential information
Все результаты, содержащие оба слова confidential и information в любом сочетании.
“confidential information”
Все результаты, содержащие точное совпадение фразы confidential information.
Поиск с использованием знаков подстановки
te?t
Все результаты, содержащие слова test, text и т.п.
mone*
Все результаты, содержащие слова money, monetary и т.п.
*air
Все результаты, содержащие слова air, fair, impair, affair и т.п.
“* assets”
Все результаты, содержащие фразы, которые заканчиваются словом assets, например: monetary assets, liquid assets, fixed assets, current assets.
Булевский поиск
price AND quality
Все результаты, содержащие оба слова price и quality.
price quality
price OR quality
Все результаты, содержащие слово price или quality, или оба этих слова.
price; quality
Поиск по полям
(Действие::Message) (Получатель:: john.smith@domain.com) (Вложения::.doc) (Вложения::.pdf)
Все сообщения электронной почты с вложенными .pdf и .doc файлами, отправленные на адрес john.smith@domain.com.
(Действие::Chat) (Имя файла::Mike)
Все мгновенные сообщения, отправленные для/от пользователя Mike.
(Имя файла::secret) (Тип файла::Excel)
Файлы Excel, содержащие слово secret в имени файла и переданные по любому поддерживаемому каналу.
(Тип файла::Acrobat) (Источник::File Sharing) (Размер файла::100~~200 MB)
Файлы PDF размером от 100 до 200 МБ, загруженные на сайты обмена файлами или скачанные с таких сайтов.
Поисковый сервер поддерживает также расширенный синтаксис поисковых запросов.
 
Символ
Значение
Описание
=
Любая цифра
Выражение N=== будет соответствовать выражению N123, но не выражению N1234 или Nabc.
-
Исключается
Поместите символ - (черточка) в начале любого слова или выражения, которое должно быть исключено из результата поиска. Пример: -“monetary assets”
%
Нечеткий поиск
Нечеткий поиск позволяет находить слова, даже если они написаны с ошибкой. Количество символов % определяет количество различий, игнорируемых при поиске слова. Позиция символов % определяет, сколько символов в начале слова должно точно соответствовать поисковому запросу. Нечеткий поиск может быть полезен при поиске в тексте, содержащем слова с опечатками. Например, поисковый запрос inf%%ormation возвратит все слова, начинающиеся с inf и написанные не более чем с двумя отличиями от слова information.
#
Фонетический поиск
Фонетический поиск возвращает слова, звучащие подобно заданному слову и начинающие с той же буквы. Такой поиск несколько медленнее других видов поиска. Поддерживается только для английского языка. Например, поисковый запрос #smith возвратит результаты smithe и smythe.
&
Поиск синонимов
Синонимический поиск возвращает слова-синонимы заданного слову. Поддерживается только для английского и русского языков. Например, поисковый запрос fast& возвратит также результат quickly.
~~
Числовой диапазон
Поиск в числовом диапазоне служит для поиска любых чисел в пределах указанного диапазона. Для задания такого запроса следует указать нижнюю и верхнюю границы диапазона, разделенные символами ~~. Значения, указанные как нижняя и верхняя границы, также включаются в результаты поиска. Разделители, такие как десятичная точка и запятая, заменяются на пробелы, знак минуса игнорируется. Например, поисковый запрос 500~~1000 возвратит текст, содержащий числа в промежутке между 500 и 1000.
:
Вес выражения
По умолчанию все слова в результатах поиска имеют одинаковый вес при подсчете. Данное условие поиска позволяет задать относительный вес для каждого выражения в поисковом запросе. Например, поисковый запрос money:5 information:1 возвратит те же документы, что и поисковый запрос money information, но вес слова money будет оцениваться поисковым сервером при сортировке результатов в пять раз выше, чем вес слова information.
##
Регулярное выражение
Регулярные выражения позволяют выполнять поиск сложных сочетаний различных символов. Регулярное выражение в поисковом запросе должно быть заключено в двойные кавычки и начинаться с оператора ##. Поисковый сервер использует реализацию регулярных выражений на базе TR1 (подробнее см. в статье msdn.microsoft.com/ru-ru/library/bb982727.aspx). Регулярное выражение может соответствовать только одному слову или группе цифр, поиск нескольких слов невозможен. Преобразование регистра (заглавные/ прописные буквы) не производится, так что регулярное выражение должно соответствовать регистру строковых данных, хранимых в индексе. Скорость поиска зависит от размещения регулярного выражения в поисковом запросе: чем ближе выражение к началу слова, тем больше времени занимает поиск.
Обзор логических операторов
Поисковый сервер позволяет использовать “булевские” поисковые запросы, в которых слова или выражения объединяются логическими операторами, такими как AND или OR. Примеры:
price AND quality - Должны присутствовать оба слова.
price OR quality - Должно присутствовать хотя бы одно из указанных слов.
price W/3 quality - Слово “price” должно присутствовать на расстоянии не более 3-х слов от слова “quality”.
price NOT W/3 quality - Слово “price” должно присутствовать на расстоянии более 3-х слов от слова “quality”.
price AND NOT quality - Слово “price” должно присутствовать, в то время как слова “quality” быть не должно.
В случае нескольких операторов используйте скобки, чтобы избежать неоднозначности поискового запроса. Например, запрос price AND quality OR quantity может означать (price AND quality) OR quantity либо price AND (quality OR quantity). Для достижения наилучших результатов выражения с логическими операторами всегда следует заключать в скобки.
Поддерживаются следующие логические операторы:
Операторы AND/OR
Операторы W/N и PRE/N
Операторы NOT и NOT W/N
Операторы AND/OR
Оператор AND используется для объединения двух слов или выражений, оба из которых должны присутствовать в каждом результате поиска.
Оператор OR используется для объединения двух слов или выражений, хотя бы одно из которых должно присутствовать в каждом результате поиска.
Операторы W/N и PRE/N
Оператор W/N используется, чтобы указать, что одно слово или выражение должно встречаться на расстоянии не более N слов от другого. Например, запрос price W/3 quality вернет результаты, содержащие слово “price” в пределах 3-х слов от слова “quality”.
Оператор PRE/N действует аналогично оператору W/N, но этот оператор также указывает, что первое выражение должно предшествовать второму. Например, запрос price PRE/3 quality вернет результаты, содержащие слово “price” на расстоянии не более 3-х слов перед словом “quality”.
Во избежание неоднозначной интерпретации поискового запроса по крайней мере одно из двух выражений, объединенных оператором W/N или PRE/N, должно быть одним словом или фразой, либо группой слов и фраз, объединенных оператором OR.
Для обозначения первого слова элемента поиска предусмотрен идентификатор xfirstword. Совместно с оператором W/N этот идентификатор позволяет выполнять поиск определенных слов или выражений вблизи начала элемента. Например, запрос price W/3 xfirstword вернет результаты, содержащие слово “price” в пределах 3-х слов от первого слова в сообщении или файле.
Операторы NOT и NOT W/N
Оператор NOT используется в начале выражения, чтобы изменить значение выражения на противоположное. Это позволяет исключить из результатов поиска те элементы, которые соответствуют данному выражению.
Оператор NOT можно поместить в начало поискового запроса. В этом случае он изменяет значение всего запроса на противоположное. Например, запрос NOT (price W/3 quality) вернет результаты, не содержащие слово “price” в пределах 3-х слов от слова “quality”.
Если оператор NOT используется в промежутке между выражениями, его необходимо дополнить другим оператором (например, оператором AND или OR). Так, запрос price AND NOT quality вернет результаты, которые содержат слово “price” и не содержат слова “quality”.
Сочетание операторов NOT и W/N (что означает “not within”) можно использовать для поиска слова или выражения в отдалении от другого слова или выражения. Например, запрос price NOT W/3 quality вернет результаты, содержащие слово “price” на расстоянии более 3-х слов от слова “quality”. Обратите внимание, что в отличие от оператора W/N оператор NOT W/N не является симметричным, так что, например, запрос price NOT W/3 quality не совпадает с запросом quality NOT W/3 price.