Что такое интернет, кто создал всемирную паутину World Wide Web и как работает глобальная сеть. Чем отличается Интернет от Всемирной паутины? Где есть всемирная паутина

По мере развития Internet в его оборот вовлекались все большие и большие объемы информации, и ориентироваться в Internet становилось все труднее. Тогда и встала задача создать простой и понятный способ организации информации, размещаемой на узлах Internet. С этой задачей в полном объеме справилась новая служба www (world wide web - Всемирная паутина).

Всемирная паутина (world wide web) – это система документов с текстовой и графической информацией, размещенных на узлах Internet и связанных между собой гиперссылками. Пожалуй, именно эта услуга – самая популярная и у многих пользователей является синонимом самого слова INTErNET. Часто начинающие пользователи путают два понятия – Интернет и WWW (или Web). Следует напомнить, что WWW – это лишь одна из многочисленных услуг (сервисов), предоставляемых пользователям Интернета.

Основной идеей, которая была использована при разработке системы www, является идея доступа к информации при помощи гипертекстовых ссылок. Суть ее заключается во включении в текст документа ссылок на другие документы, которые могут располагаться как на том же самом, так и на удаленных информационных серверах.

История www начинается с того момента, когда в 1989 году сотрудник известной научной организации CErN Бернерс-Ли предложил своему руководству создать базу данных в виде информационной сети, которая состояла бы из документов, включающих в себя как саму информацию, так и ссылки на другие документы. Такие документы есть не что иное как гипертекст.

Еще одна возможность, которая выгодно отличает www от других видов сервиса, состоит в том, что через эту систему можно получить доступ практически ко всем остальным видам сервиса Internet, таким как FTP, Gopher, Telnet.

WWW является системой мультимедиа . Это означает, что с помощью www можно, например, посмотреть видеофильм об исторических памятниках или узнать информацию о чемпионате мира по футболу. Есть возможность доступа к информации библиотек и к свежим фотографиям земного шара, сделанным пять минут назад метеорологическими спутниками, вместе с.

Идея организации информации в виде гипертекста не нова. Гипертекст "жил" задолго до появления компьютеров. Простейший пример некомпьютерного гипертекста – это энциклопедии. Некоторые слова в статьях помечаются курсивом. Это означает, что вы можете обратиться к соответствующей статье и получить более подробную информацию. Но если в некомпьютерном гипертексте вам нужно листать страницы, то на экране монитора переход по ссылке гипертекста мгновенен. Нужно только щелкнуть мышью на слове-ссылке.

Основная заслуга уже упомянутого выше Тима Бернерс-Ли в том, что он не только выдвинул идею создания информационной системы на базе гипертекста, но и предложил ряд методов, которые легли в основу будущей службы www.

В 1991 году идеи, зародившиеся в CErN, начал активно разрабатывать Центр суперкомпьютерных приложений (NCSA). Именно NCSA создает язык гипертекстовых документов html, а также программу Mosaic, предназначенную для их просмотра. Программа Mosaic, разработанная Марком Андерсеном, стала первым браузером и открыла новый класс программных продуктов.

В 1994 году количество www-серверов начинает быстро расти и новая служба Internet не только получает мировое признание, но и привлекает в Internet огромное количество новых пользователей.

Теперь дадим основные определения.

www – это множество web-страниц, размещенных на узлах Internet и связанных между собой гиперссылками (или просто ссылками).

web-страница – это структурная единица www, которая включает в себя собственно информацию (текстовую и графическую) и ссылки на другие страницы.

web-сайт – это web-страницы, физически находящиеся на одном узле Internet.

Система гиперссылок www основана на том, что некоторые выделенные участки одного документа (которыми могут быть части текста или иллюстрации) выступают в качестве ссылок на другие, логически связанные с ними, документы.

При этом те документы, на которые делаются ссылки, могут находиться как на локальном, так и на удаленном компьютере. Кроме того, возможны и традиционные гипертекстовые ссылки – это ссылки внутри одного и того же документа.

Документы, на которые установлены ссылки, могут, в свою очередь, содержать перекрестные ссылки друг на друга и на другие информационные ресурсы. Таким образом, можно собрать в единое информационное пространство документы на сходные темы. (Например, документы, содержащие информацию по медицине.)

Архитектура www

Архитектура www, как и архитектура многих других видов сервиса Internet, построена по принципу клиент-сервер .

Основной задачей программы-сервера является организация доступа к информации, хранящейся в компьютере, на котором эта программа запущена. После запуска программа-сервер работает в режиме ожидания запросов от программ-клиентов. Обычно в качестве программ-клиентов выступают web-браузеры, которыми и пользуются рядовые пользователи www. Когда такой программе необходимо получить некоторую информацию от сервера (обычно, это хранящиеся там документы), она отправляет серверу соответствующий запрос. При достаточных правах доступа между программами устанавливается соединение, и программа-сервер направляет программе-клиенту ответ на запрос. После чего установленное между ними соединение разрывается.

Для передачи информации между программами используется протокол HTTP (Hypertext Transfer Protocol, Протокол передачи гипертекст).

Функции www-сервера

www-сервер – это программа, которая запускается на хост-компьютере и осуществляет обработку запросов, приходящих от www-клиентов. При получении запроса от www-клиента эта программа устанавливает связь на основе транспортного протокола TCP/IP и обменивается информацией по протоколу HTTP. Кроме этого, сервер определяет права доступа к документам, которые на нем находятся.

Для доступа к той информации, которая не может обрабатываться сервером непосредственно, используется система шлюзов . Используя специальный интерфейс CGI (Common Gateway Interface, Общий интерфейс шлюзов) для обмена информацией со шлюзами, www-сервер имеет возможность получать информацию из таких источников, которые были бы недоступны для других видов сервиса Internet. При этом, для конечного пользователя, работа шлюзов "прозрачна", т.е., просматривая web-ресурсы в своем любимом браузере, неискушенный пользователь даже не заметит, что некоторая информация была представлена ему с помощью системы шлюзов

Функции www-клиента

Можно выделить два основных типа www-клиентов: web-браузеры и служебные приложения.

web-браузеры используются для непосредственной работы с www и получения оттуда информации.

Служебные web-приложения могут общаться с сервером либо для получения некоторых статистических данных, либо для индексирования содержащейся там информации. (Именно так и попадает информация в базы данных поисковых систем.) Помимо этого, также существуют служебные web-клиенты, работа которых связана с технической стороной хранения информации на данном сервере.

Всемирная паутина (англ. World Wide Web) - глобальное информационное пространство, основанное на физической инфраструктуре Интернета и протоколе передачи данных HTTP. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру «WWW».

Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенные по всему миру. Веб-сервер - программа, запускаемая на подключённом к сети компьютере. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически формировать ресурсы в ответ на HTTP-запрос.

Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа-клиент - веб-бра́узер (web-browser) . Основная функция веб-браузера - отображение гипертекста .

Всемирная паутина неразрывно связана с понятиями гипертекста. Гипертекст (Hypertext) – это документ или система документов с перекрестными ссылками (гиперссылками ). По такому документу можно перемещаться не последовательно, а, активируя гиперссылки, переходить по ним к связанным со ссылками текстам или файлам.

Для создания, хранения и отображения гипертекста используется язык HTML (англ. HyperText Markup Language) , язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, специалисты по разметке называются веб-мастерами .

HTML-файл является самым распространённым ресурсом Всемирной паутины. HTML-файл доступный веб-серверу, называют «веб-страницей ». Набор связанных тематикой, дизайном или владельцем веб-страниц образует веб-сайт .

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Гостевые книги,

Wiki-проекты,

Системы управления контентом.

HTML-разметка

HTML (HyperText Markup Language) не является языком программирования, он является языком форматирования, т.е. придания внешнего вида web-странице, при ее присмотре в браузере. Для разметки документа используются теги . Теги заключаются в угловые скобки, и, за редким исключением, являются парными, т.е. существует открывающий и закрывающий тег. Например, чтобы отметить начало нового абзаца в документе ставится тег

(от paragraph ). Тогда в конце абзаца обязательно должен ставиться закрывающий тег

.


При расстановке тегов соблюдается правило: закрываются теги в порядке обратном их появлению. Например, если слово в тексте должно быть выделено жирностью (тег от bold ) и одновременно курсивом (тег от italic ), то это может быть сделано одним из следующих способов: слово , или слово.

Ниже приводится текст некоторого html-документа и результат его отображения в браузере:

Доброе время суток, уважаемый посетитель!

Надеюсь, вы попали как раз туда, куда хотели.

Здесь вы найдете стихи , песни и сценарии для организации любых праздников.

А теперь специальный подарок к 1 сентябряb>

Он к "пятерочкам" привык -

Русский пять и пение.

Мне всегда его дневник

Портит настроение.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

    Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.

    курсовая работа , добавлен 18.06.2010

    Что такое Internet? Internet, как средство массовой информации. Службы Internet. Сетевая пресса. Структура Полит.Ру. Статистика. Рейтинг. Из чего состоит Internet? ICQ – новая возможность общения. Административное устройство Internet.

    реферат , добавлен 10.05.2003

    Интернет - глобальная информационная сеть, его устройство, основные службы, история возникновения. Доступ к информации. Сервер, провайдер, маршрутизаторы. Понятие о протоколах Интернета. Язык форматирования HTML. Программы браузеры. Протоколы URL-адресов.

    реферат , добавлен 23.10.2011

    Характеристика и значение интернет-технологий в современном образовании. Позитивная возможность современных Internet–технологий. Основные преимущества электронного обучения, анализ обучающих программ, характеристика телекоммуникационных технологий.

    дипломная работа , добавлен 23.06.2012

    Роль и значение Интернета в жизни общества. Тенденции развития Интернета в России: проблемы и перспективы, характеристика структуры рынка. Сферы обслуживания, реализующие услуги через Интернет. Использование Интернет-технологий в социокультурной сфере.

    курсовая работа , добавлен 04.02.2011

    Понятие "информация". Интерактивность. Информационный поиск. Интернет как основное средство интерактивного поиска информации. История создания Интернета. Доступ в Интернет. Поисковые ресурсы. Типы поисковых систем. Электронная почта.

    курсовая работа , добавлен 15.02.2007

    Основные факты из истории появления интернета, ключевые принципы и перспективы дальнейшего развития. Языковые сферы Интернета, русскоязычная среда всемирной сети (Рунет). Виды браузеров для просмотра интернет-страниц. Спектры сервисов и услуг Интернета.

    контрольная работа , добавлен 25.02.2012

Уже сегодня количество пользователей Интернета достигает 3,5 миллиарда человек, а это почти половина населения Земли. И, конечно же, всем известно, что Всемирная паутина окончательно окутала нашу планету . Но до сих пор далеко не все могут сказать, есть ли различие между понятиями Интернет и Всемирная паутина. Как ни странно, многие абсолютно уверенны, что это синонимы, но прошаренные ребята могут привести доводы, которые эту уверенность поубавят.

Что такое Интернет?

Не вдаваясь в сложные технические подробности, можно сказать, что Интернет – это система, которая объединяет компьютерные сети по всему миру . Компьютеры подразделяются на две группы – клиенты и серверы.

Клиентами называют обычные пользовательские устройства, куда входят и персональные компьютеры, и ноутбуки, и планшеты, и, конечно же, смартфоны. Они отправляют запрос, получают и отображают информацию.

Всю информацию хранят сервера, которые могут классифицироваться по разным назначениям:

  • веб-сервера,
  • почтовые,
  • чаты,
  • системы трансляции радио и телевидения,
  • обмен файлами.

Серверами являются мощные компьютеры, работающие непрерывно. Кроме хранения информации они получают запросы от клиентов и отправляют необходимый ответ. При этом обрабатывают они сотни таких запросов.

Ещё в нашем кратком ликбезе необходимо упомянуть стоит упомянуть интернет-провайдеров , которые обеспечивают связь клиента и сервера. Провайдер – это такая организация со своим интернет-сервером, к которому подключены все её клиенты. Провайдеры обеспечивают связь по телефонному кабелю, выделенному каналу или беспроводной сети.


Вот таким образом вы попадаете в Интернет

Можно ли обойтись без провайдера и напрямую подключиться к сети Интернет? Теоретически можно! Вам придётся стать самому себе провайдером и потратить за огромную сумму денег, чтобы добраться к центральным серверам. Так что не ругайте сильно своего поставщика интернета за высокие тарифы – этим ребятам тоже нужно оплачивать многие вещи и тратиться на обслуживание оборудования.

Всемирная паутина опутала весь мир

World Wide Web или просто web – «паутина». Фактически она представлена огромным количеством страниц, которые связанны между собой. Эта связь обеспечивается ссылками, посредством которых можно переходить из одной страницы на другую, даже если она расположена другом компьютере, подключённом к .


Всемирная паутина – самая популярная и большая служба Интернета

Всемирная паутина для своей работы использует специальные веб-серверы. На них хранятся веб-страницы (одну из них вы видите сейчас). Страницы, связанные ссылками, имеющие с общую тематику, внешний вид, и обычно расположенные на одном сервере называются веб-сайтом.

Для просмотра страниц и документов паутины используются специальные программы – браузеры.

Именно Всемирная паутина включает в себя форумы, блоги и социальные сети. А вот непосредственно её работу и существование обеспечивает сеть Интернет…

Велико ли различие?

На самом деле разница между Интернетом и Всемирной паутиной достаточно большая. Если Интернет – это огромная сеть, связующая миллионы компьютеров по всей планете для совместного использовании информации, то Всемирная паутина лишь один из способов обмена этой информацией. Кроме обеспечения работы World Wide Web, Интернет позволяет использовать электронную почту и различные мессенджеры, а также передавать файлы по по FTP-протоколу,

Интернет – это то, что связывает многочисленные компьютерные сети.

Всемирная паутина – это все страницы, которые хранятся на специальных серверах Интернета.

Заключение

Теперь вы знаете, что Всемирная сеть Интернет и Всемирная паутина – вещи разные. А самое главное, вы сможете блеснуть умом и объяснить друзьям в чём заключается эта разница.

Всемирная паутина (сокращенно World Wide Web или WWW) - это единство информационных ресурсов, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, разбросанных по всему миру.

Годом рождения Всемирной паутины считается 1989 год. Именно в этом году Тим Бернерс-Ли предложил общий гипертекстовый проект, который получил впоследствии название Всемирной паутины.

Создатель «паутины» Тим Бернес-Ли, работая в лаборатории физики элементарных частиц европейского центра ядерных исследований «CERN» В Женеве (Швейцария), совместно с партнером Робертом Кайо занимались проблемами применения идей гипертекста для построения информационной среды, которая упростила бы обмен информацией между физиками.

Итогом данной работы явился документ, в котором рассматривались понятия, имеющие принципиальное значение для «паутины» в ее современном виде, и были предложены идентификаторы URI, протокол HTTR и язык HTML. Без данных технологий уже нельзя представить современный Интернет.

Бернерс-Ли создал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер. На первом в мире веб-сайте он описал, что такое Всемирная паутина и как установить веб-сервер, как использовать браузер и т.п. Этот сайт являлся и первым в мире Интернет-каталогом.

Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС ), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС: «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети» . WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной.

Поисковые системы: состав, функции, принципы работы.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем :

    Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    URL страницы

    дата, когда страница была скачана

    http-заголовок ответа сервера

    тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

    Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

    Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

    Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

    Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

    Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

    Желательно сужать круг поиска, используя несколько ключевых слов.

    Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра

Название в Яндекс

Название в Rambler

Где искать ключевые слова (заголовок документа, основной текст и т.д.)

Словарный фильтр

Поиск по тексту...

Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение

Словарный фильтр

Искать слова запроса... Исключить документы, содержащие следующие слова...

На каком расстоянии друг от друга должны располагаться ключевые слова

Словарный фильтр

Расстояние между словами запроса...

Ограничение на дату документа

Дата документа...

Ограничение поиска пределами одного или нескольких сайтов

Сайт/Вершина

Искать документы только на следующих сайтах...

Ограничение поиска по языку документа

Язык документа...

Поиск документов, содержащих картинку с определенным именем или подписью

Изображение

Поиск страниц, содержащих объекты

Специальные объекты

Форма представления результатов поиска

Формат выдачи

Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.