ФЭНДОМ


Нартдинова Р.Ф. Править

Поиск информации в Интернете Сеть Интернет растет очень быстрыми темпами, найти нужную информацию среди сотен миллиардов Web-страниц и сотен миллионов файлов становится все сложнее. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении Web-страниц и файлов на сотнях миллионов серверов Интернета. Прежде, чем рассматривать информационно-поисковые системы, нам надо разобраться с вопросами — что мы можем искать и где, а после — как организовать такой поиск. Хранения информации обычно завершается поиском конкретной информации для дальнейшего использования. Поиск органически связан с процедурой хранения, поэтому он не всегда выделяется отдельно. Служба World Wide Web (WWW) =====Это самая популярная служба современного Интернета. Именно её нередко отождествляют с Интернетом в целом, хотя на самом деле это лишь одна из его многочисленных служб. = Определение WWW =====Основатель сети Тим Бернес-Ли дал такое определение. ===== WWW — это сеть серверов, распределённая гетерогенная информационная мультимедиа-система коллективного пользования. Из определения понятно, какую огромную роль в современном обществе имеет компьютерная информационная среда. Среда WWW не имеет централизованной структуры. Все, кто желает разместить в Интернете свои материалы, не противоречащие законодательству, могут это сделать. Отдельный документ World Wide Web называют Web-страницей. Обычно это комбинированный документ, который может содержать текст, графические иллюстрации, мультимедийные и другие объекты. Отличительной особенностью среды WWW является наличие средств перехода от одного документа к другому, тематически с ним связанному, без явного указания адреса. Связь между документами осуществляется при помощи гипертекстовых ссылок. Огромное число гипертекстовых электронных документов, хранящихся на серверах WWW, образует своеобразное гиперпространство документов, между которыми возможно перемещение. Связь между сотнями миллионов документов, хранящихся на физических серверах Интернета, не могла бы существовать, если бы каждый документ в этом гиперпространстве не обладал своим уникальным адресом. Файл одного локального компьютера обладает уникальным полным именем, в которое входит собственное имя файла с расширением и путь доступа к файлу, начиная от имени устройства, на котором он хранится. Определяя местоположение файла в Глобальной сети, надо расширить представление об уникальном имени файла. Адрес любого файла во всемирном масштабе определяется унифицированным указателем ресурса — URL. URL-адрес представляет собой стандартизованную строку символов, указывающую местонахождение ресурса, документа или его части в Интернете, и состоит из трех частей. mso-bidi-font-family:Symbol;color:#333333;mso-fareast-language:RU">·  </span>имя протокола для доступа к службе Интернет; ·  имя сервера, на котором хранится ресурс и работает сервер-программа службы Интернет; ·  полное имя файла, который хранится на сервере. Для функционирования службы Интернет, необходимо серверное и клиентское программное обеспечение. Работу службы World Wide Web обеспечивают серверные программные средства — Web-серверы, и клиентские программы — Web-браузеры. Информационно-поисковые системы Информационные службы определяют технологию хранения, передачи информационных объектов и, соответственно, алгоритмы поиска.Web-документы хранятся на Web-серверах, файлы и файловые архивы — на файловых серверах. В связи с этим, набор информационных объектов, доступных с помощью каждого сервиса, может рассматриваться как отдельное информационно-поисковое пространство. Теперь, зная, что мы можем искать и где, обратимся к вопросу – как организовать такой поиск.  В настоящее время для поиска конкретной информации существуют так называемые информационно-поисковые системы или, как принято выражаться на языке Интернет,поисковые службы. Поисковая система представляет собой специализированный Web-узел. Принцип работы таких систем прост: пользователь должен объяснить системе, что ему необходимо получить, а задача поисковой службы состоит в том, чтобы найти и выдать список гиперссылок на страницы, на которых упоминаются соответствующие сведения. Классификация поисковых служб: ·         по способу организации и пополнения базы данных о документах в сети на поисковые каталоги и поисковые машины; =====·         по глубине охвата ресурса на глобальные и локальные. ===== =====Особенности поисковых каталогов Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Принципы работы с каталогами достаточно просты. Как правило, главная страница Web-сайта каталога содержит в себе список категорий, или рубрик, каждая из которых представлена гиперссылкой.  Работа с поисковыми каталогами интуитивно проста. В них поиск информации практически всегда завершается более или менее плодотворно. Однако за этой простотой скрывается высочайшая сложность создания и ведения каталога. Важнейшей характеристикой каталогов является объем базы данных, т.е. количество представленных документов. Для глобальных каталогов данная величина составляет примерно 1-2 миллиона документов, что составляет порядка 0,1-0,2% от общего пространства WWW, и степень охвата общего объема ресурсов WWW непрерывно уменьшается из-за лавинообразного увеличения информационных ресурсов в Глобальной сети. Поэтому использование каталогов не может дать результатов, обладающих высокой полнотой.  По сравнению с поисковыми машинами скорость увеличения баз данных каталогов достаточно мала. Дело в том, что поисковые каталоги создаются вручную, коллективом высококвалифицированных редакторов, которых называют также модераторами. Однако это может рассматриваться и как преимущество поисковых систем, поскольку ручной отбор позволяет повысить точность поиска и распределение материалов по соответствующим рубрикам. Другой характеристикой каталогов является количество категорий или рубрик в каталоге. Естественно, чем выше это значение, тем большей точностью характеризуются результаты поиска. Для глобальных каталогов это значение в настоящее время составляет несколько десятков тысяч. ПОИСКОВЫЕ СИСТЕМЫ {C} RAMBLER===== http://www.rambler.ru Rambler является первой российской профессиональной поисковой системой. Ныне осуществляет поиск более чем по 15000 серверов в пределах бывшего СССР (более 2500000 страниц). Имеет приемлемые возможности для составления запроса и хороший механизм вывода результатов поиска. К сожалению не столь резв, как хотелось бы. {C}

ЯNDEX http://www.yandex.ru Поисковая машина последнего поколения, обладающая весьма развернутой, но и достаточно сложной системой формирования запроса. Обладает способностью выделять один документ в различных кодировках, за счет чего кардинально сокращается дублирование результатов поиска. В настоящее время проиндексировано более 30500 российских (домены RU и  SU) и зарубежных русскоязычных серверов.

=====


=====


=====АПОРТ ===== =====http://www.aport.ru ===== =====Индексирует боле 11000 российских серверов и делает это весьма основательно. Имеет богатые возможности формирования запроса, в частности, способен выделять сочетания терминов, если они находятся недалеко друг от друга (на расстоянии нескольких слов или предложений). Система способна переводить запрос с русского на английский язык и наоборот. ===== =====


===== =====


===== =====


=====

{C}Править

=====ALTA VISTA ===== =====http://www.altavista.сom ===== =====Англоязычная поисковая система, наиболее популярная на западе. Поддерживает  она и другие языки, в т.ч. русский. Обращение к ней оправдано в том случае, если вам необходимы зарубежные ресурсы. ===== =====


===== =====РУССКАЯ МАШИНА ПОИСКА ===== =====http://search.interrussia.com ===== =====Система индексирует 1500 серверов стран СНГ. Русский и английский интерфейсы обеспечивает поиск на обоих языках. Можно сформировать структурированные запросы. Количество выдаваемых ссылок можно регулировать от 10 до 1000. В месяц к «Русской машине поиска» обращаются около 200 тыс. человек. ===== =====


===== =====Google                                               {C} ===== =====http://www.google.ru ===== =====  Крупнейшая поисковая система, принадлежащая корпорации Google Inc. Обрабатывает 41 млрд. 345 млн. запросов в месяц (доля рынка 62,4 %) индексирует более 25 миллиардов веб-страниц, может находить информацию на 191 языке (создана 15 октября 2009). В настоящее время занимает 2 место в России среди всех ===== =====Особенности поисковых машин ===== =====В поисковых машинах каталоги Web-ресурсов создаются автоматически специальными программами, называемыми поисковыми роботами или поисковыми указателями (а также “червяками”, “пауками”, “траулерами”, “автоматами”, “агентами” и т.п.). Из процесса наполнения базы данных поисковой системы исключается человеческий фактор. При этом падает качество ссылок, предоставляемых системой по результатам поиска, но одновременно увеличивается их количество. Программа Поисковый робот осуществляет просмотр Сети с целью выявления новых документов для включения их в базу данных поисковой машины — индекс. Процесс занесения информации о документе в индекс называется индексированием. ===== =====Этапы работы поискового робота ===== =====1.       Сбор первичной базы данных. ===== =====2.       Индексация базы данных. ===== =====3.       Создание результирующего списка ссылок. ===== =====Формирование запросов на поиск информации ===== =====Осуществляя поиск информации в Интернете, мы вправе надеяться на полноту, точность и актуальность результатов поиска, к тому же результаты мы хотим получить как можно быстрее. ===== =====На часть из перечисленных факторов пользователь, проводящий поиск, не может повлиять. Например, скорость получения информации зависит от технических характеристик и загруженности каналов связи и серверов поисковых служб, а также особенностями алгоритмов, реализованных в поисковой системе. Однако, пользователь может повлиять на качество результатов поиска, если при проведении поисковых работ будет: ===== =====·                                            делать оправданный выбор информационно-поисковой службы; ===== =====·                                            учитывать особенности информационно-поисковой системы; ===== =====·                                            грамотно формулировать запросы на поиск информации. ===== =====Формирование запроса — это процесс выражения информационной потребности с помощью ключевых слов и комбинирования этих ключевых слов с помощью средств информационно-поискового языка системы. ===== =====На качество запроса оказывают воздействие три фактора: знание пользователем особенностей естественного языка, умение учитывать   языковые особенности документов и знание структуры и особенностей информационно-поискового языка. ===== =====Структуры и особенности информационно-поискового языка ===== =====Для повышения точности результатов поиска, как уже было отмечено, важно грамотно формулировать запросы на поиск информации. Информационно-поисковые языки предоставляют пользователю большое число операторов, т.е. служебных слов, которые используются для комбинирования ключевых слов запроса. Каждая поисковая машина имеет свой состав операторов, однако обычно эти операторы объединены в группы, общие для большинства систем. ===== =====Операторы поисковых систем ===== =====При использовании языков запроса приходится учитывать, что они сильно отличаются в различных поисковых машин. Это становится большой проблемой при использовании сложных запросов в метапоисковых системах. ===== =====Логические операторы ===== =====В поисковых системах обычно имеются три оператора: “логическое И”, “логическое ИЛИ” и “логическое НЕ”. Оператор “логическое И” указывается между ключевыми словами, если необходимо выдать документы, содержащие все искомые слова. “Логическое ИЛИ” используется при необходимости поиска документов, содержащих хотя бы одно из ключевых слов, связанных этим оператором. Оператор “логическое НЕ” необходим для исключения из списка документов, в которых присутствует слово, предваренное в запросе этим оператором. ===== =====Логические операторы для организации поиска по запросу ===== =====


=====

=====Оператор =====

=====RAMBLER =====

=====YANDEX =====

=====APORT =====

=====Логическое И =====

=====And ===== =====& ===== =====пробел =====

=====& пробел ===== =====(в пределах предложения) ===== =====&& ===== =====(в пределах документа) =====

=====AND ===== =====& ===== =====+ ===== =====пробел ===== =====И =====

=====Логическое ИЛИ =====

=====Or ===== =====| =====

=====| =====

=====OR ===== =====| =====

=====Логическое НЕ =====

=====NOT =====

=====~ ===== =====(оператор «И НЕ» в пределах предложения) ===== =====~ ~ ===== =====(оператор «И НЕ» в пределах документа) =====

=====NOT ===== =====~ =====

=====Группировка =====

=====( ) =====

=====( ) =====

=====( ) =====

=====Цитата =====

=====“ “ =====

=====“ “ =====

=====“ “ =====

=====


===== =====   Простая ситуация поясняет изложенное выше. Запрос “автобус и трамвай” или “автобус трамвай” выдаст только документы, в которых одновременно встречаются слова и автобус, и трамвай.  Запрос “автобус или трамвай” выдаст три типа документов: в документе есть только слово автобус, в документе есть только слово трамвай, в документе есть слова автобус и трамвай. Символ “!”, в Яндексе, например, означает закрепление регистра. Если вы ищите название села “Остров”, а не географическое понятие “остров”, следует написать “!Остров”. При поиске информации о фильме “Остров” запрос лучше оформить в виде цитаты: “фильм Остров”. ===== =====Операторы расстояния ===== =====Большинство поисковых машин в настоящее время предоставляют возможность использовать так называемые операторы расстояния, которые задают ограничения на удаленность вхождений ключевых слов друг от друга в тексте документа. Как правило, выделяют три оператора этой группы: оператор поиска фразы, позволяющий находить точные вхождения указанной последовательности слов (фраза задаётся в кавычках), оператор, с помощью которого задаётся расстояние в словах, и оператор, задающий расстояние в предложениях. ===== =====


===== =====Прочие операторы ===== =====Помимо двух указанных групп существуют также операторы: ===== =====·         учета особенностей естественного языка; ===== =====·         выбора части документа, по которой осуществляется поиск; ===== =====·         отбора для поиска страниц, написанных на определенном языке; ===== =====·         ограничения поиска определенным типом файла; ===== =====·         поиска текста в заголовках страниц; ===== =====·         выбора подмножества документов. ===== =====Состав этих групп сильно зависит от поисковой машины. ===== =====


===== =====Ответьте на вопросы, используя поисковые системы:
www.yandex.ru
www.rambler.ru
www.nigma.ru
www.aport.ru

===== =====1.      Место и дата рождения Билла Гейтса – главы фирмы Microsoft. ===== =====2.      В каком году была написана картина Айвазовского «Море. Коктебельская бухта»? ===== =====3.      Настоящая фамилия Кира Булычева. ===== =====4.      Место и дата рождения математика Н.И. Лобачевского. ===== =====5.      В каком году и какую школу окончила Алла Пугачева? ===== =====6.      В каком году и где родился Мишель Нострадамус?
Назвать основателей фирмы Honda и год ее создания.
===== =====7.      Какой король правил Францией во время похода Жанны д'Арк на Орлеан? ===== =====8.      В каком году А.Сахаров стал лауреатом нобелевской премии мира? ===== =====9.      В каком году Алла Пугачева получила Гран-при фестиваля «Золотой Орфей» с песней «Арлекино»? ===== =====10.   Когда и за что Александр Исаевич Солженицин получил Нобелевскую премию? ===== =====11.   Когда и где родился Дж. Р.Р. Толкиен – английский писатель? ===== =====12.   Когда и где родился Владимир Высоцкий? =====

=====13.   Когда и где состоялись первые зарубежные гастроли группы Beatles? =====

Обнаружено использование расширения AdBlock.


Викия — это свободный ресурс, который существует и развивается за счёт рекламы. Для блокирующих рекламу пользователей мы предоставляем модифицированную версию сайта.

Викия не будет доступна для последующих модификаций. Если вы желаете продолжать работать со страницей, то, пожалуйста, отключите расширение для блокировки рекламы.

Также на ФЭНДОМЕ

Случайная вики