Информационно поисковые системы и их классификация: история, характеристики, цифры, факты и многое другое
Содержание:
- Процедура поиска: Алгоритм действий
- История создания
- Поисковик «Майл.ру»
- Структура поисковых систем
- Основные поисковые системы
- Цифры и факты
- Программы для скачивания бесплатных игр
- Языковая панель
- Классификация запросов
- Обзор поисковых серверов
- 10 самых известных поисковых систем в России
- «Гугл» и «Яху» — гиганты поиска
Процедура поиска: Алгоритм действий
Функции поиска в интернете и просмотра сайтов возложены на браузер, называемый также интернет обозревателем. Активация процедуры поиска запускается после введения пользователем соответствующего запроса в поисковой строке.
Поисковая строка в Google
Во всех поисковых системах имеется программный функционал, на котором базируется механизм поиска. Так называемый поисковый движок представляет собой набор программ, отвечающих за поиск данных.
Действия пользователя ограничиваются формулированием поискового запроса с целью его введения в строку поиска. При поступлении обращения поисковая система создает страницу с результатами поиска. Последние предстают перед пользователем в формате перечня. На первых позициях размещаются наиболее релевантные сайты.
Страница Google с результатами поиска
Под релевантностью поиска понимают нахождение материалов/сведений, наиболее полно соответствующих составленному пользователем запросу. При этом гиперссылки с самыми точными результатами располагаются на страничке выдачи выше остальных. Таким образом перечень формируется с учетом приоритетности сайтов. Процесс распределения попавших в выборку результатов получил название ранжирования сайтов.
Функция сбора информации закреплена за роботом (пауком, краулером). Что интересно, идентичных ботов не существует (у каждого поисковика имеется собственный уникальный экземпляр).
Работа, осуществляемая поисковой системой, складывается из трех этапов:
- На первом этапе поисковик сканирует зарегистрированные в интернете сайты с целью сохранения копий веб страниц на имеющихся в его распоряжении серверах. В результате формируется внушительный массив данных, не подвергшихся обработке и не пригодных для поиска.
- В рамках второго этапа (индексации) полученная ранее информация сортируется с учетом возможности выполнения качественного поиска в максимально сжатые сроки. Актуальную базу принято называть индексом. Готовые к выдаче страницы считаются проиндексированными.
- На третьем (завершающем) этапе осуществляется непосредственная выдача запрашиваемых сведений после поступления клиентского запроса. При этом учитываются ключевые либо близкие к ним слова, присутствующие в поисковой строке. Обилие информации предполагает необходимость ее ранжирования на основании алгоритмов, имеющихся в распоряжении поисковика.
Лучшим может быть назван поисковик, способный выдать материал, дающий наиболее развернутый и корректный ответ на пользовательский запрос. Периодически даже такие системы могут выдавать результаты, обусловленные влиянием лиц, заинтересованных в продвижении того или иного сайта. Справедливости ради стоит отметить, что ссылки такого типа в перечнях надолго не задерживаются.
В разных уголках планеты востребованы разные системы поиска. Присущее поисковикам стремление к улучшению качества предоставляемых услуг обусловлено необходимостью расширения целевой аудитории.
История создания
Самые первые поисковики появились в середине девяностых годов прошлого века. Они напоминали информационные указатели, находящиеся в справочниках. В их информационной базе были ключевые слова, собирающиеся всеми возможными способами с востребованных сайтов в виртуальной сети. Информационные технологии были тогда не совершенны. Отбор осуществлялся только по ключевым словам в информационно-поисковых справочных системах. Позднее был разработан специальный поиск словосочетаний, предложений и текстов, облегчающий нахождение требуемых пользователю данных. Система делала фиксацию слов, содержащих ключи. Благодаря этому пользователи могли делать требуемые запросы по ключевым словам и различным словосочетаниям в интернете.
Информационно-поисковая система Wandex была придумана программистом Мэтью Греэмом в конце прошлого века. Позже возникла Aliweb, которая и сегодня успешно функционирует. Однако они имели многогранную иерархическую структуру и не обладали технологиями современности.
Одна из первых появилась система WebCrawler. Ее уникальной особенностью и главным плюсом, выгодно выделяющим ее среди прочих поисковиков, явилась способность находить любые ключевые слова на той или иной странице в интернете. Она стала своего рода образцом для всех остальных поисковых систем.
Значительно позже появились и другие поисковики, соревнующиеся за внимание пользователя между собой. Пользователи интернета в нашей страны стали работать с Рамблером
В 1997 году был создан «Яндекс», ставший аналогом Google. Сегодня он является одним из лидеров по поисковым запросам среди систем в нашей стране.
На сегодняшний день имеются специальные поисковики, созданные для решения поставленных задач. Например, информационно–поисковая система базы данных «Патрон». Она разработана для хранения и поиска данных по патронам для разнообразного вида оружия и сейчас используется в органах МВД Российской Федерации, спецслужбах. Имеются разработанные правовые информационно-поисковые системы для нотариусов, юристов, медицинских сотрудников и инженеров. Они ими пользуются на ежедневной основе и не представляют современную деятельность без них. Существуют документальные информационно поисковые системы для научных сотрудников институтов.
Поисковик «Майл.ру»
В 1998 году в городе Санкт-Петербург благодаря талантливым программистам родилась одна из самых мощных почтовых служб — «Майл.ру». Сегодня это почтовая и поисковая система имеет оперативную электронную почту, разветвленный каталог интернет-ресурсов и удобные информационные разделы как в современной библиотеке. Информационно-поисковая система «Майл.ру» имеет еще ряд специально разработанных проектов, весьма популярных и жизненно необходимых современным пользователям виртуальной сети интернета.
Аудиторию своих верных подписчиков и пользователей «Майл.ру» обрел достаточно давно благодаря мощным сервисам, генерирующим трафик, а вот уникальным разработанным движком поиска смог похвастаться относительно недавно.
Все история развития «Майл.ру» началась с предоставления всем желающим пользователям сети бесплатных почтовых ящиков. Получив огромную популярность и востребованность, «Майл.ру» начал превращаться в огромный портал. Сейчас компании принадлежат «Одноклассники», «Облако@Майл.ру» и еще огромное количество других сервисов, имеющих популярность у активных пользователей виртуальной сети. Поисковая система является совладельцем социальных сетей «Вконтакте» и Facebook.
Общая аудитория гиганта виртуальной сети составляет сейчас около восьмидесяти миллионов посетителей каждый месяц. Аудитория пользователей «Майл.ру» растет вместе с компанией. Больше трети поклонников данного поисковика приходится на активных пользователей сервиса «Почта@Майл.ру», четверть — на «Одноклассники» и «Мой мир». Количество посетителей, использующих активно поисковую систему, подбирается к цифре в двадцать миллионов человек.
В процентном соотношении это составляет около десяти процентов от общей доли поиска в русскоязычной части интернета. Это позволяет «Майл.ру» занимать почетное третье место после таких гигантов, как «Яндекс» и «Гугл». Если бы этого результата достиг поисковый сервис без учета социальных сетей, крупнейших в русскоязычной части интернета, рейтинга сайтов, то это был бы просто феноменальный результат.
Однако говорить о поисковике «Майл.ру» в отрыве от всего того, что принадлежит компании, как минимум было бы не совсем корректно. Качество выдачи запрашиваемой информации не блещет результатами по сравнению с результатами поисковых запросов у основных конкурентов.
Официальная страница поисковой системы находится по адресу go.mail.ru и представляет сплав Google и «Яндекса», имеет возможности подключения картинки. Строка поисковика «Майл.ру» присутствует на основной странице портала, которая сравнительно недавно изменила дизайн.
Выше были представлены основные информационно-поисковые системы, которые существуют в современном интернете.
Структура поисковых систем
Различные
поисковые системы содержат одинаковый состав входящих в них основных элементов,
а именно, поле поиска, кнопка поиска, список найденных
результатов.
Структура
поисковой системы представлена комплексом следующих программ.
-
Робот spider (паук), целью которого является
просмотр страниц сайтов, предназначенных для индексации. -
Робот crawler (путешествующий
паук). Его
функция заключается в поиске новых и неизвестных системе ссылок и
добавление их в список индексации. -
Индексатор обрабатывает страницу очереди,
стоящей на индексацию. -
База данных хранит различную информацию
необходимую для выведения результатов поиска. -
Система обработки запросов и
выдачи результатов. Алгоритм ее работы сводится к следующему: во-первых, принять от
пользователя запрос на поиск какой-либо информации, во-вторых, обратиться
с этим запросом к базе данных, в-третьих, вывести пользователю полученный
результат.
Основные поисковые системы
На заре
своего существования Интернет еще не обладал большим объемом информации.
Количество пользователей Сетью было тоже совсем невелико. Однако со временем
возникла необходимость в оптимизации доступа к информации, содержащейся в
Интернете, благодаря чему в 1994 году на свет появился проект под названием
Yahoo. Данный проект подразумевал создание каталогов сайтов, в которых ссылки
на сайты были сгруппированы по различным темам. Однако этот проект еще совсем мало
был похож на современные поисковые системы. Первой поисковой системой в
привычном для нас понимании стала WebCrawler.
На
сегодняшний день основными мировыми поисковиками являются Google, Yahoo, MSN
Search.
В российском
Интернете этот список представлен следующими поисковыми системами: Яндекс,
Google, Mail.ru, Aport, Rambler, KM.ru.
Бесспорно,
самыми популярными из них являются Яндекс и Google.
Цифры и факты
А какой поисковик предпочитаете Вы? Не нужно быть пророком, чтобы предсказать, что большинство читателей назовут всемирно признанный Google или безусловного лидера российского лидера – Яндекс. Пользуетесь чем-то другим? Тогда вас можно смело назвать пользователем с оригинальным вкусом. Для подтверждения приведу немного статистики.
- Google – 69,24%. Несомненный лидер, ни одна другая ПС пока не может даже приблизится к этому результату. Единственный мировой лидер, пользующийся успехом и в России.
- Bing – 12,26%. Как видите, разрыв между первой и второй позицией огромен. В России эта ПС почти неизвестна (примерно 0,7% всех запросов в Рунете обрабатывается с её помощью).
- Yahoo! – 9,19%. В России его результат ещё скромнее, всего 0,2% поисковых запросов Рунета в месяц.
Другие зарубежные поисковики имеют ещё более скромные результаты.
А что же в России? Здесь лидирующие позиции у Яндекса, который выбирают чуть более 50% пользователей, у нас немного отстаёт – его предпочитают немногим более 40% пользователей. При этом многие пользователи используют каждый из этой победной двойки для решения конкретных задач. В частности, с помощью Google удобнее осуществлять поиск во всемирной паутине, если вас интересует именно глобальная выборка, если же нужны в первую очередь русские сайты, Yandex лучше справится с этой задачей.
Среди систем, ориентированных именно на русскоязычный сектор интернета (русские, украинские, белорусские сайты, другие страны СНГ), разрыв в показателях ещё выше, чем у зарубежных:
- Яндекс – 50%
- Mail – чуть больше 6%
- Рамблер – всего полпроцента.
(За данные спасибо Википедии).
Согласно данным Statcounter за май 2019 года, Google занимает 92.04% рынка поисковых систем. Эти данные не включают социальные сети (Facebook, YouTube, Twitter и т.д.).
Google старается дать наилучший ответ на запрос пользователя. Именно с этой целью и происходит регулярная эволюция его алгоритмов. Но этот процесс завел Google к интересному результату.
Часто факторы связанные с авторитетом домена, трастом сайта, количеством обратных ссылок имеют большее значение, чем ценность информации для пользователя. Как результат, сайты, которые лучше отвечают на запрос пользователя, но не обладают большим «авторитетом» в глазах поисковой системы, остаются вне внимания пользователя. Удивительно, но одна из самых инновационных компаний в мире делает свои алгоритмы консервативнее. Продвинутые пользователи (как читатели, так и авторы контента) замечают это и их всё больше раздражает монополия Google среди поисковых систем.
Кроме того, многие знают, что Google детально отслеживает каждый шаг пользователя. Кроме понимания, как улучшать свои продукты, это также дает возможность Google создавать лучшие условия для таргетинга в рекламной системе Google Ads. Кто-то из нас не обращает на это внимания. Но все больше растет количество пользователей, которые хотят использовать поисковые системы без рекламных объявлений, или же искать информацию по другим алгоритмам. К счастью, существует множество альтернатив для Google. Каждая из них имеет определенные преимущества и особые сферы применения.
Важно уточнить, что данная статья создана не для того, чтобы занизить значение гугла в глазах активных пользователей всей сети. Её цель, лишь показать большое количество инструментов и вариантов поиска информации, которые сейчас существуют
Google не был первопроходцем на рынке поисковых систем, но он (а именно Сергей Брин и Ларри Пейдж) создал самый совершенный для своего времени алгоритм ранжирования сайтов. И на протяжении всей истории развития рынка поисковых систем, он определял и определяет правила игры на этом рынке.
Программы для скачивания бесплатных игр
Языковая панель
Классификация запросов
По назначению поисковые запросы можно разделить на:
Информационные запросы – вводятся, когда пользователю требуется получить ответ на свой запрос в виде необходимой ему информации.
Транзакционные запросы – направлены на поиск предложений о продаже различных товаров, о предоставлении услуг или же каких-либо других действий, связанных с использованием денег и проведением транзакций.
Навигационные запросы – чаще всего запрашивают, чтобы найти конкретный адрес сайта, адрес учреждения, организации или иного материала в интернете.
Частотность запросов
В зависимости от частоты использования запросы разделяют на:
- низкочастотные,
- среднечастотные и
- высокочастотные (от нескольких сотен и более).
Запрос можно отнести к низкочастотным, если небольшое количество пользователей (например, не более 100-150 пользователей в месяц) вводили такой запрос в поисковую строку.
Сезонность запросов
Имеются сезонные запросы, которые имеют ярко выраженный спрос и являются высокочастотными в период сезона.
К примеру, запросы дачного характера «как посадить картофель», «как вырастить георгины» популярны среди пользователей ближе к лету (это «высокий сезон» для таких запросов) и практически не используются ими в зимний период («не сезон»).
События и запросы, связанные с ними
Событийные запросы связаны с происходящими «здесь и сейчас» событиями.
К таким можно отнести, например, запросы, связанные с чемпионатом мира по футболу, который проходил в России летом 2018 года.
Обзор поисковых серверов
Поисковая система обрабатывает сотни гигабайт информации и выдаёт пользователю нужные сайты в удобном формате списка найденных страниц. Этот список может состоять из сотен тысяч страниц, где встречаются эти слова. Из этого всего вы уже можете найти нужную информацию, это временами может быть и проблематично. А иногда вы сразу находите нужный сайт с соответствующей информацией.
Поисковой сервер AltaVista — самый малоизвестный поисковик в «Рунете». Был популярен у англоязычной аудитории во время запуска системы «Виста» от «Майкрософт». В его базе всего лишь пятьсот пятьдесят миллионов страниц. Четыре миллиона статей из 15.000 групп новостей внутри агрегатора «Юзенет». И доступен поиск по изображениям и прочим медийным файлам, типа видео и звуков. Выдача по картинкам производится в немного неудобном формате. Они выводятся все с описанием размера при наведении мышки на картинку.
Open Directory Project — этот сервис, скорее, относится к каталогам, чем к поисковикам. Но через него поиск осуществляется только по качественным ресурсам Сети интернет. Работу для удобства пользователей осуществляет около 38 тысяч редакторов, которые ежедневно отбирают сайты для своего каталога.
Поисковой сервер WebCrawler — количество индекса поискового сервиса около 1,6 миллиона проиндексированных материалов. Каталог проекта имеет около 100 000 категорий, куда можно определить практически любой сайт. У поисковика общая база данных с другим интернет проектом под названием Excite, но данный проект специализируется на развлекательном трафике, индексируя чаты и гороскопы.
Lycos — в этом сервере есть информация о 50-ти миллионах страниц. Вам приведены запросы к поисковому серверу. Вы можете написать, например: «Как написать статью для сайта», и поисковик выдаст нужную информацию. Отсортированы они релевантно вашему запросу. Возможно, среди них вы найдёте нужный. Приведены запросы к поисковому серверу для каждого поисковика ниже.
HotBot — содержит в себе информацию о 55 миллионах страниц со всего интернета. Среди них вы сможете найти нужную информацию. Для удобства можете указать нужное гео-положение. Например, вы ищете кафе в определённом городе и задаёте соответствующий запрос. Поисковик также совершает поиск по звукам, графике, скриптам сайта, и прочим нетривиальным вещам, которые могут быть вам нужны. Сервер недавно подключился к «Юзенет», и поиск также может совершаться там.
10 самых известных поисковых систем в России
Начнём мы перечисление поисковиков с того, что назовём 10 самых упоминаемых систем в Рунете, не затрагивая те машины, о которых русскоязычные пользователи никогда не слышали.
— самая популярная поисковая система в мире, которая занимает первое место в мировом рейтинге. Была создана ещё в 1998 году программистами Сергеем Брином и Ларри Пейджом. Обрабатывает свыше 41 млрд запросов в месяц, в индексе порядка 25 миллиардов веб-страниц, на сайт заходят более 200 миллионов человек по всему миру и набирает более 72% запросов со всего мира. Поисковая система Гугл постоянно совершенствуется и улучшается. Позволяет пользователям искать информацию в мире, включая веб-страницы, изображения и видео. В 2017 году признан самым дорогим брендом в мире. Также корпорации Alphabet Inc. наряду с Google принадлежит браузер Хром и мобильная операционная система Андроид.
Baidu
Baidu — крупнейшая китайская поисковая система среди китайских поисковых систем и второй поисковик мира в 2020 году. В глобальном рейтинге находится на пятой точке по посещаемости. В Baidu содержится более 740 млн веб-страниц, 80 миллионов изображений и 10 миллионов медиафайлов. Основана в 2000 году предпринимателями Робином Ли и Эриком Сю. В России к этому поисковику неоднозначное отношение из-за того, что на сайте отсутствует русификация. Свыше 95% аудитории Байду составляют граждане Китая.
Yahoo!
Yahoo — это один из старейших и наиболее популярных в Интернете поисковиков. Создали его предприниматели Джерри Янг и Дэвид Фило в далёком 1995 году. Входит в первую двадцатку по посещаемости среди всех веб-сайтов в мировой сети. С 2009 года использует поиск Bing, а с 2017 года куплена компанией Verizon Communications. Крупный интернет-портал и поставщик услуг, предлагающий результаты поиска, настраиваемый контент. Наибольшая доля посетителей – граждане США. В мировом глобальном рейтинге по посещаемости занимает 12-е место.
Mail.ru
Mail.ru — это русскоязычный интернет-портал, принадлежащий крупнейшему IT-гиганту Рунета Mail.Ru Group и имеющий множество тематических проектов, в том числе ВКонтакте, Мой мир и Одноклассник». Ежемесячная аудитория портала составляет 54 миллиона человек и занимает 60-е место по популярности в мире, а в России — 5-е место. Создан в 1998 году авторами Евгением Голандом и Владимиром Шутовым. С начала 2006 года по 2009 год использовался поиск от «Яндекса». В 2017 году попала под запрет в Украине.
Bing
Bing — поисковая система, разработанная международной корпорацией Microsoft. Была основана в 2009 году. В настоящее время сайт Bing занимает 6-е место в списке самых популярных поисковых сайтов в мире и 31-е место в общем рейтинге по посещаемости среди сайтов. Посещаемость уже менее 200 миллионов в день. Наиболее активно внедряется в смартфоны на ОС Windows. Больше всего заходов из США (32%), Китая (16%) и Германии (4%).
DuckDuckGo
Поисковая система, придающая особое значение обеспечению конфиденциальности. В день обрабатывает около 15 миллионов запросов и около миллиона пользователей. Основана предпринимателем Гэбриелом Вайнбергом. Это уникальная поисковая система, которая не отслеживает ваши действия в сети. Плюсом является русификация – в поисковике имеется отличный перевод на русский язык.
Спутник
Спутник — российская национальная государственная поисковая система и интернет-портал, созданная компанией «Ростелеком». Создан в 2014 году. На данный момент почти не используется рядовыми пользователями Рунета. Но в будущем на него могут перейти госслужащие.
TUT.BY
TUT.BY — белорусская поисковая система. Охватывает 2 миллиона всех интернет-пользователей Беларуси. Был создан в 2000 году журналистом Сергеем Дмитриевым.
Рамблер
Рамблер — популярный сервисный интернет-портал. Ежедневно на главную страницу заходит около полтора миллиона пользователей, а ежемесячно около шести миллионов. Был создан в 1996 году программистом Дмитрием Крюковым. До 23 июня 2011 года являлся одной из поисковых систем Рунета, но перестал существовать, перейдя на поисковый движок компании «Яндекса».
«Гугл» и «Яху» — гиганты поиска
Поисковой сервер «Гугл» (Google) — за всё время работы проиндексировано уже около 2-х миллиардов страниц, по которым производится поиск интересующего пользователя контента. «Рунет» проиндексирован неплохо, но лучше «Яндекса» «Гугл» не стал, поскольку тот учитывает индивидуальные особенности русского языка, орфографию и орфоэпию слов при поиске.
Поисковой сервер Яху (Yahoo!) — имеет развитый сервис новостей, собираемый из СМИ всего мира. В нём проиндексировано около 3 000 000 ссылок. Сервис достаточно неплохо структурирован. Является одним из первых в мире. Но не стал таким популярным как «Гугл».