Какие инструменты мы используем для работы и общения с пользователями. Развитие поисковых систем на русском языке


Изучив эту тему, вы узнаете и повторите:

Для чего нужны поисковые серверы;
- назначение основных частей поисковых серверов;
- какие виды поиска информации существуют в Интернете;
- основные правила формирования запроса в поисковой системе Яндекс.

Поиск по адресам URL

Самый быстрый и надежный вид поиска информации в Интернете - поиск по адресам URL. Многие из них приводятся в печатных изданиях, специальных справочниках, звучат в эфире популярных радиостанций и с экранов телевизора.

♦ Фанаты футбольного клуба «Зенит» наизусть знают адрес www.fc-zenit.ru.
♦ Поклонникам группы «Король и шут» хорошо известен официальный сайт этой группы www.korol.spb.ru.
♦ Любители телеканала НТВ без труда найдут его сайт по адресу www.ntv.ru. Для быстрого доступа к вышеназванным ресурсам достаточно запустить программу-браузер, например Internet Explorer, и набрать знакомый адрес URL в строке адреса.

Поисковые системы

В Интернете сосредоточено огромное количество документов. Чтобы облегчить поиск нужной информации, создаются специальные поисковые машины.

Поисковые машины - это автоматические системы, опрашивающие серверы, подключенные к глобальной сети, и сохраняющие в своей базе информацию об имеющихся на серверах данных. По специальным образом сформулированному запросу поисковые машины предоставляют информацию о том, где можно получить необходимые данные.

Как правило, поисковые машины состоят из трех частей: робота, индекса и программы обработки запроса .

Робот (Spider, Robot или Bot) - это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое. Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.
Индекс поисковой системы - это хранилище поисковых образов, посещенных роботами страниц. Поисковый образ документа (в том числе и веб-страницы) - это описание содержания документа на специальном информационно-поисковом языке. Это описание содержит коды ключеных слов документа, отражающих его смысл и содержание. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.

Программа обработки запроса - это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности у то есть от наибольшей степени соответствия ссылки запросу к наименьшей.

В настоящее время самыми популярными для российских пользователей Интернета являются три крупные поисковые системы индексного типа:

Эти системы учитывают грамматические особенности русского языка, поэтому результаты их поиска в русскоязычных ресурсах отличаются более высоким качеством, чем у западных систем.

Поисковые машины различаются по охвату информационных ресурсов:

♦ поисковые машины общей тематики имеют базу данных по всем направлениям знаний и отличаются обширным индексом и большим объемом накапливаемой информации;
♦ поисковые машины специального назначения просматривают только сайты по определенной тематике, например музыкальные или музейные.

Основными характеристиками поисковых машин являются:

♦ объем документов в индексе;
♦ частота обновления информации;
♦ информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация;
♦ скорость обработки запроса;
♦ критерий определения релевантности (соответствия найденного документа поисковому запросу);
♦ возможность детализации и уточнения запроса.

Поиск по рубрикатору поисковой системы

Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, представляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.

Приведем в качестве примера структуру поискового интернет- каталога Яндекс. Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. Б этом каталоге выделены следующие темы:

♦ Бизнес и экономика;
♦ Справочники и ссылки;
♦ Общество и политика;
♦ Дом и семья;
♦ Наука и образование;
♦ Развлечения и отдых;
♦ Компьютеры и связь;
♦ Культура и искусство.

Каждая тема включает множество подразделов, а они, в свою очередь, содержат рубрики и т. д.

Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом: Яндекс Каталог Культура и искусство Музыка Авторская песня.

Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего 5 ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.

Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога: Яндекс Каталог Компьютеры и связь Мобильная связь Мобильные телефоны.

Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.

Поиск по ключевым словам

Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска. Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Поиск. Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.

Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме.

На первый взгляд самое простое - это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет более 460000 страниц на 3500 сайтах - огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.

Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.

Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.

Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Результатом поиска будут немногим более 20 ООО страниц и около 650 сайтов. Как видим, количество ссылок уменьшилось более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров.

Очевидно, что следует продолжить движение в направлении уточнения условий поиска.

Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.

Приведем десять простых правил формирования запроса в поисковой системе Яндекс.

1. Ключевые слова в запросе следует писать строчными (маленькими) буквами. Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

2. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.

3. Для поиска устойчивого словосочетания следует заключить слова в кавычки, например «фарфоровая посуда».

4. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября». 

5. Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &: «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

6. Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки «+» и «-» надо писать через пробел от предыдущего и слитно со следующим словом. Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».

7. При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

8. Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки, например «(ребенок | малыш | дети | младенец) +(уход | воспитание)».

9. Знак *~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе. Например, по запросу «книги ~ магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

10. Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&, -) задает поиск в пределах документа. Например, по запросу «рак - астрология» будут найдены документы со словом «рак», не относящиеся к астрологии.

Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. На рис. 3.3 показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.

Рис. 3.3. Пример расширенного поиска в системе Яндекс

При условии правильного выбора желательных и обязательных слов и исключения нежелательных терминов такой поиск может дать неплохие результаты.

Вернемся к примеру с аквариумными рыбками. После прочтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум - сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

Для поиска литературы или полнотекстовых документов возможен следующий запрос:

«+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) -(цена | магазин | доставка | каталог)».

После обработки запроса поисковой машиной получен следующий результат: страниц - 195, сайтов - не менее 43.

Как видно из статистики поиска, результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам:

Размещение аквариума > Советы начинающему аквариумисту >
Статьи > Aq uascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32КБ) - строгое соответствие.
СОВЕТЫ НАЧИНАЮЩИМ АКВАРИУМИСТАМ. Как выбрать и установить аквариум, как...
http://www.aquariums.ru/sovna.htm (2КБ) 23.07.2002 - нестрогое соответствие.

Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:

♦ Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.
♦ Прочитать предлагаемые статьи и приступить к устройству аквариума.
♦ Поискать материалы о хомячках или волнистых попугайчиках.

Профессиональный поиск

Для научных работников и специалистов придется более продуманно подойти к организации поиска. При профессиональном поиске информации в Интернете должны соблюдаться следующие требования:

♦ высокая скорость проведения поиска;
♦ достоверность получаемой информации;
♦ полнота охвата ресурсов при поиске.

Скорость. Скорость проведения поиска зависит в основном от двух факторов: от грамотного планирования поиска (выбора поисковых сервисов и инструментов) и навыков работы с уже выбранным ресурсом (умения быстро разобраться в его структуре и способах навигации). Для обеспечения скорости поиска поисковых индексов недостаточно. Помимо них в Интернете существует еще целый ряд поисковых ресурсов, использование которых обеспечивает выполнение профессионального поиска.

Достоверность. Вопрос достоверности информации, получаемой из Интернета, очень актуален, так как любой человек может разместить там любую информацию без какого-либо контроля ее соответствия действительности. Это, в свою очередь, приводит к большому количеству недостоверных источников, каковыми являются, например, рефераты и курсовые работы, наводнившие Интернет.

Существуют специальные поисковые сервисы, позволяющие оценить надежность источника информации в Интернете.

Полнота. Необходимым условием успешного полномасштабного сбора информации является знание основных существующих на сегодняшний день типов ресурсов и использование различных поисковых сервисов. Ни одна поисковая система не может охватить все ресурсы Интернета.

Как правило, для достижения положительного результата пользователь должен прибегнуть к услугам нескольких поисковых систем. Можно сделать это самостоятельно, переходя из системы в систему, а можно поручить эту работу одной из метапоисковых систем (meta - первая составная часть сложных слов, обозначающая системы для описания и исследования других систем).

Рис. 3.4. Окна метапоисковых систем

Метапоисковые системы не имеют собственных поисковых баз данных и при поиске используют ресурсы множества других поисковых систем. За счет этого вероятность нахождения нужной информации оказывается очень высокой. Работа в метапоис- ковых системах проводится по тем же правилам, что и работа в поисковых системах. Это вызвано тем фактом, что метапоисковые системы являются своеобразной надстройкой к поисковым системам и используют в своей работе их индексные базы. Внешний вид метапоисковых систем напоминает внешний вид известных поисковых машин. На рис. 3.4 представлены окна метапоисковых систем myweb.ru и metabot.ru.

Опыт показывает, что в большинстве случаев лучший результат достигается при использовании нескольких независимых поисковых индексов, чем при использовании одной метапоисковой системы.

Контрольные вопросы и задания

1. Каково назначение программы-браузера?

2. Какие программы-браузеры вам известны?

3. Где пользователь, планирующий поиск в Интернете, может найти адреса URL?

4. Какова технология поиска по рубрикатору поисковой системы?

5. Какова технология поиска по ключевым словам?

6. Какие требования должны соблюдаться при профессиональном поиске информации в Интернете?

7. Когда в критерии поиска надо задавать знаки «+» или «-»?

8. Какие критерии поиска в Яндексе заданы следующей фразой:

(няня | воспитатель | гувернантка) ++(уход | воспитание | присмотр).

9. Что означает удвоение знака (∼∼ или ++) при формировании сложного запроса?

10. Что такое релевантность поиска?

11. Каково назначение метапоисковых систем?

Технологии поиска

Законы трения и тепломассообмена в турбулентном пограничном слое

Существует несколько разновидностей представления ʼʼзакона тренияʼʼ (для эталонного случая), приводящие практически к тождественным результатам. Сообразно понятию ʼʼлогарифмическогоʼʼ пограничного слоя (при значении первой константы турбулентности χ = 0,4 ) закон трения для предельно развитой турбулентности с ʼʼисчезающей вязкостьюʼʼ хорошо аппроксимируется простой формулой Кармана:

При степенном представлении профиля скорости должна быть предложена формула:

где: ; n – степенной показатель профиля скорости;

– полуэмпирический коэффициент;

А – эмпирический коэффициент;

δ – толщина пограничного слоя.

Используя соотношения для чисел Рейнольдса, построенных на разных линœейных величинах:

Важно заметить, что для случая развития турбулентного погранслоя с передней кромки (х кр = 0 ) закон трения должна быть представлен также в виде:

Значения параметрических величин представленных формул для различных профилей скоростей сведены в таблицу

Параметр n
1/7 1/8 1/9 1/10
А 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
m 0,250 0,222 0,200 0,182
B 0,0252 0,0206 0,0190 0,0148
m 1 0,200 0,182 0,167 0,154
B 1 0,0576 0,0450 0,0362 0,0308

Известны и используются также другие формы представления закона трения, приводящие практически к одним и тем же результатам. Так В.М. Иевлевым предложена аппроксимация:

Формулы для законов тепло-и массообмена получаются из ʼʼзаконов тренияʼʼ для стандартных условий (эталонный случай) посредством известного принципа тройной аналогии Рейнольдса.

где: S – корректирующий множитель – фактор аналогии Рейнольдса на не соблюдение условий эталона (и), фактор S в первом приближении удовлетворительно аппроксимируется соотношением:

Важно заметить, что для случая использования интегральных параметров ʼʼзаконыʼʼ тепло-и массообмена хорошо описываются зависимостями:

Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: ʼʼКак сориентироваться в столь огромном и масштабном информационном пространстве -ʼʼ В решении данной проблемы на помощь приходят поисковые инструменты.

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователœей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определœенную функцию:

1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.

2. Поиск информации по запросу пользователя.

3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователœем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.

2. Индекс поисковой системы - ϶ᴛᴏ информационная база, содержащая результат анализа веб-страниц, составленная по определœенным правилам.

3. Запрос - ϶ᴛᴏ ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, -).

Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определœенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, в случае если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины.

К примеру, AltaVista удобно использовать для произвольных запросов, ʼʼSomething about online degrees in information technologyʼʼ, тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.

Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всœего, увеличить эффективность поиска Вы можете за счёт использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Простой запрос дает неĸᴏᴛᴏᴩᴏᴇ количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросœе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены всœе ключевые слова. Тем не менее, количество документов должна быть всœе еще велико, и их просмотр займет достаточно времени. По этой причине в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. К примеру, получим список документов, содержащих слова, начинающиеся на "gov", в случае если в строке запроса запишем "gov*". Это бывают слова government, governor и т.д.

Наиболее развитый сервис поиска русскоязычной информации предоставляет поисковый сервер Яndex. В Яndex можно просто написать по-русски фразу, описывающую то, что Вы хотите найти, и система проанализирует и обработает Ваш запрос, а затем постарается найти всœе, что относится к заданной теме. Вы можете, используя специальные операторы, составить строку, поясняющую поисковой системе, каким Вашим требованиям должна отвечать интересующая Вас информация. Некоторые из операторов языка запросов Яndex можно посмотреть здесь: http://help.yandex.ru/search/ -id=481939

Не менее популярная поисковая система Rambler ведет статистику посœещаемости ссылок из собственной базы данных, поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и -, для увеличения или уменьшения значимости вводимых в запрос слов.

Давайте рассмотрим наиболее популярные технологии поиска информации в Интернет.

Тема 3 Работа с поисковыми системами Интернет

Поисковые инструменты

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.

2. Поиск информации по запросу пользователя.

3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.

2. Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.

3. Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).

Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

Таким образом, если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины.

Например, AltaVista удобно использовать для произвольных запросов, «Something about online degrees in information technology», тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.

Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всего, увеличить эффективность поиска Вы можете за счет использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Формы запросов приведены в таблице 1.

Таблица 1

Простой запрос дает некоторое количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены все ключевые слова. Тем не менее, количество документов может быть все еще велико, и их просмотр займет достаточно времени. Поэтому в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. Например, получим список документов, содержащих слова, начинающиеся на "gov", если в строке запроса запишем "gov*". Это могут быть слова government, governor и т.д.

Наиболее развитый сервис поиска русскоязычной информации предоставляет поисковый сервер Яndex. В Яndex можно просто написать по-русски фразу, описывающую то, что Вы хотите найти, и система проанализирует и обработает Ваш запрос, а затем постарается найти все, что относится к заданной теме. Вы можете, используя специальные операторы, составить строку, поясняющую поисковой системе, каким Вашим требованиям должна отвечать интересующая Вас информация.

Не менее популярная поисковая система Rambler ведет статистику посещаемости ссылок из собственной базы данных, поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и -, для увеличения или уменьшения значимости вводимых в запрос слов.

Давайте рассмотрим наиболее популярные технологии поиска информации в Интернет.

Размещение информационных ресурсов.

Средства поиска информационных ресурсов.

В настоящее время рост информационных ресурсов Интернета происходит высокими темпами. Всемирная сеть напоминает читальный зал библиотеки, где хранятся гигантские объемы текстовых, графических, мультимедийных, архивных и прочих файлов. Этот зал невозможно обойти полностью. Здесь все ежечасно меняется, тело разнообразных документов возрастает каждую секунду. Найти необходимую информацию становится все труднее. Различные печатные справочники устаревают еще до их выхода в свет. Единственным надежным способом поиска информации является использование специальных поисковых систем, которые постоянно отслеживают изменения информации в сети.

Используемые в сети Интернет ресурсы чаще всего размещаются на страницах WWW-серверов (или Web-серверов), в файловых архивах (FTP-архивах) и в информационно-справочной системе Gopher.

WWW (World Wide Web - Всемирная Паутина) - это глобальная гипертекстовая система, использующая для транспортировки информации в сети Интернет протокол HTTP (HyperText Transfer protocol - протокол передачи гипертекста). Гипертекст - это способ представления всех типов информации в виде последовательности узлов, связанных друг с другом ассоциативной (а не последовательной) связью и реализованной в виде гиперссылок. Гиперссылка - выделенная в гипертексте последовательность символов, реагирующая на щелчок мыши и отсылающая пользователя на другой фрагмент гипертекста. Большинство документов, хранящихся на Web-сервере, создано на языке HTML (HyperText Markup Language - язык гипертекстовой разметки документов).

Gopher-сервер - это сервер, содержащий программы, позволяющие найти файлы, программы или другие ресурсы на заданную пользователем тему. URL-адрес такого сервера выглядит следующим образом (если сервер, например, принадлежит фирме «Microsoft»): gopher://gopher.microsoft.com.

Выделяют две группы поисковых инструментов: 1) поисковые системы и 2) поисковые службы.

ИПС (информационно-поисковая система) – это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе ) на основе информационно-поискового языка и соответствующих правил поиска.

В Internet можно выделить следующие поисковые инструменты для WWW: поисковые системы, метапоисковые системы (поисковые службы) и программы ускоренного поиска (поисковые агенты).


Рис.13. Средства поиска в WWW

В зависимости от того, кто создает базы данных, в которых осуществляется поиск необходимой пользователю информации, различают поисковые системы первого и второго рода. В поисковых системах первого рода базы данных создаются людьми, в поисковых системах второго рода этот процесс осуществляет компьютер.


Поисковые системы первого рода, как правило, называют каталогами (предметными или тематическими - subject catalogs). Обычно такие каталоги создаются людьми в виде иерархических деревьев, на верхнем уровне которых стоят наиболее общие понятия: бизнес, политика, образование, спорт, культура и т.д. Элементами нижнего уровня таких деревьев являются ссылки на конкретные Web-страницы и серверы. Обычно поиск в предметных каталогах осуществляется по ключевым словам. В этом случае он проводится не в содержимом Web-серверов, а в их кратких описаниях, хранящихся в каталоге. Запрос на поиск формируется либо ввиде списка ключевых слов («information technology», «computer linguisics» и т.п.) или же путем указания URL-адресов документов, в которых следует проводить поиск. Результаты поиска представляются в виде гипертекста, содержащего вкачестве гипертекстовых ссылок названия или URL-адреса найденных документов.

По ключевым словам можно осуществлять поиск следующей информации:

1) некоторого текста или его части;

2) фактических данных (например, массу солнца или имя президента страны);

3) картин, рисунков, кинофильмов и т.д. по их названиям;

4) технической информации (например, сведения о скорости некоторого автомобиля);

5) биографий людей (писателей, художников и т.п.).

Примерами тематических каталогов являются Yahoo, Galaxy, WWW Virtual Library, WebCrawler, HotBot и др. Подобная русскоязычная система носит название «Следопыт».

Поисковые системы второго рода иногда называют автоматическими индексами, «пауками» или «червями» spiders, crawlers). Они постоянно сканируют Интернет, находят в сети новые документы и из каждого документа извлекают все содержащиеся в нем гиперссылки, которыми пополняют свои базы данных (базы URL-адресов). Чтобы можно было выполнять эти функции, автоматический индекс включает в себя следующие три части: программу-робота, которая постоянно просматривает Интернет; базу данных (множество URL-адресов), которая собирается роботом, и интерфейс пользователя для поиска необходимой информации в этой базе данных. Существует большое число автоматических индексов. Наиболее популярными являются:

Зарубежные поисковые машины:

- Altavista (http://www.altavista.com);

- Go (Infoseek) (http://www.go.com);

- Google (http://www.google.com);

- Excite (http://www.excite.com);

- HotBot (http://www.hotbot.com);

- Nothern Light (http://www.northernlight.com).

Российские поисковые машины:

- Яndex(http://www.yandex.ru);

- Рамблер (http://www.rambler.ru);

- Апорт (http://www.aport.ru).
Популярные белорусские поисковые системы:

- Система ALL.BY (http://all.by);

- Система *.BY (http://search.promedia.minsk.by);

- Регистр белорусских WWW-ресурсов Зубр (http://www.zubr.com);

- Белорусский интернет-каталог Акавiта (http://akavita.kryvia.net);

- Белорусские ресурсы каталог (http://www.belresource.com.by),

Большинство поисковых систем являются одним из компонентов многофункциональных Web-сайтов Internet – так называемых порталов.

Портал – многофункциональный Web-узел Internet, предлагающий разнообразные услуги: поиск информации, бесплатная электронная почта и т.д.

Последнее время во всемирной паутине стали появляться системы, автоматически осуществляющие поиск сразу в двух индексах (индексе каталога и индексе поисковой машины). Подобные системы позволяют использовать преимущества поисковых серверов обоих типов и называются каталогами-машинами.

Поиск информации с помощью различных поисковых инструментов может осуществляться путем формирования простых и сложных запросов. Простой запрос представляет собой слово или словосочетание, которое иногда берется в кавычки. Сложный запрос формируется из слов или словосочетаний, соединяемых операторами типа AND, OR, NOT, NEAR или математическими символами, например "*", "+", "-", "~". Иногда для тех же целей используются специальные термины domain, host, link tide и др.

Видеоурок: Как создать запросы в Microsoft Access за 10 минут

Лекция: Использование инструментов поисковых систем (формирование запросов)

Самыми важными функциями при работе с базами данных являются фильтр информации, поиск и запрос.


Сортировка – это процесс упорядочения информации по некоторому признаку. Бывает возрастающая и убывающая сортировка. Если база данных имеет числовую информацию, то в качестве сортировки используют ранжирование, а если речь идет о текстовой информации, то пользуются сортировкой по алфавиту.


При рассмотрении сортировки системами управления базами данных в MS Access сортировка осуществляется в пределах одного поля. Если используется новая сортировка, то предыдущие её результаты теряются. Если сортировка вложенная, то выполнить её можно с помощью запроса.


Фильтр – это отбор информации, необходимой пользователю. Можно задать сложные условия отбора.

Чтобы найти некоторые данные, можно использовать специальные символы, которые называются маской :


* – означает, что можно выбрать любое количество знаков.

? – вместо данного знака может быть любой символ, который допускается использовать.

# – вместо данного символа может стоять любая цифра.

– любые символы, стоящие в скобках.

- – любой символ, отвечающий выбранному диапазону.

! – любой символ, кроме тех, что заключены в квадратных скобках.

Данный фильтр по знакам можно использовать для всей таблицы, либо к уже отобранной по некоторым критериям части данных.

Запрос – данная функция носит масштабный характер и может заключать в себе как сортировку, так и фильтрацию. Данная функция позволяет производить отбор данных в нескольких полях и таблицах. Можно создавать некую библиотеку запросов, которая сохраняется для будущего использования. Существует специальный язык запросов SQL – структурированный.

Поделиться: