Персональный SEO блог


Как устроен поиск в Google: механизмы и алгоритмы

21.03.2012 Опубликовано в разделе: SEO, Продвижение сайтов

Всем привет! Сегодня продолжим говорить о Google, о механизмах его работы, которые должен понимать каждый вебмастер и тем более сеошник.

Обсуждение деталей SEO с клиентами – дело не из лёгких. Но всё-таки очень важно объяснить им все азы так, чтобы у них было правильное представление о Вашей работе и правильные ожидания.

Люди, занимающиеся SEO, должны понимать как Google и другие поисковые системы сканируют, индексируют и ранжируют веб-сайты.

Важно понимать, как нелегко достичь высокого рейтинга с новым проектом, т.к. алгоритмы Google учитывают большое количество факторов, которые постоянно изменяются и дополняются. Разъяснив своим клиентам процесс работы поисковых машин, Вы тем самым дадите им понять, что SEO – занятие не из лёгких.

Так как же алгоритм Google работает?

Анатомия поисковых машин

- URL-сервер отправляет списки URL-адресов для сканирования

- Специальные роботы (краулеры) скачивают веб-страницы и отправляют их на сервер. На сервере они сжимаются и сохраняются

- Каждой веб-странице назначается специальный идентификатор, называемый DocID. Затем страница отправляется в индексатор

- Индексирование выполняется индексатором и сортировщиком

- Все страницы конвертируются в набор специальных элементов. Каждый элемент в себе содержит слово, его позицию в документе и другие переменные

- Индексатор посылает эти элементы в более крупные контейнеры, создавая частичный индекс

- Индексатор выделяет все ссылки со страниц и сохраняет информацию о каждой из них в отдельном месте. Важно местоположение ссылки (URL-адрес), целевая страница (на которую она ссылается) и её якорный текст

- База данных ссылок используется для вычисления PageRank для каждого из документов. Сортировщик принимает контейнеры, отсортированные по DocID, а затем сортирует их по WordID для создания инверсного индекса. Поисковик, запущенный на веб-сервере использует инверсный индекс и значения PageRank страниц для ответа на запросы пользователей

Поисковые системы используют настолько сложные алгоритмы, что лишь немногие действительно понимают весь принцип их работы.

На диаграмме показаны основы сканирования и индексирования сайтов, которые должен знать каждый уважающий себя веб-мастер:

Как работает поиск Google

Вот что на ней происходит с точки зрения непрофессионалов:

Допустим, что кто-то ищет информацию о blu-ray плеерах. Google берёт миллиард документов в сети и конвертирует их в блоки. Затем он ищет подходящие экземпляры блоков и ранжирует их на основе того как часто WordID в них появляется. Например,

Blu ray player

blu 1 4 6 23 37 52 94 134
ray 17 23 66 94 134 176 236 561
players 45 66 134 210 236 371 561 788
Blu ray players 23 134 561 765 876 1023 1348 1762

В таблице, приведенной выше, Вы можете увидеть, что документ 134 появляется в поиске по каждому WordID. Это делает его наиболее релевантным и, таким образом, он потенциально будет иметь высокий рейтинг в результатах поиска. Для подобного анализа Google должен “прочесать” миллионы документов. Далее подключаются такие факторы как ссылки, внутренняя оптимизация страниц и т.д. Процесс оценки позиций очень нетривиален.

Стоит отметить: Сначала Google должен создать “ассоциацию” или же другим образом определить релевантность Вашего веб-сайта поисковой фразе. Эта “ассоциация” может создаваться месяцами, если не годами. Без неё Вы вряд ли сможете продвинуть сайт в топ 10 по высоко конкурентным запросам.

Объём работ, выполняемых поисковой системой Google:

- На подготовку индекса Google ушло более 1 миллиона часов вычислений

- Каждый день поиск Google обрабатывает более 1 миллиарда запросов от пользователей

- На разработку алгоритма Google ушло более 1000 человеко-лет

- База данных индекса Google весит более 5 миллионов терабайт

- К июлю 2008 года Google обработал 1,000,000,000,000 уникальных URL-адресов. С чем можно сравнить такую цифру? С количеством всех перекрёстков дорог в США с тем условием, что территория этого государства будет в 50,000 раз больше

Задача SEO – помочь Google эффективно разобраться во всех страницах и назначить им правильный рейтинг.

Вот почему требуется немалое время, чтобы оценить потенциал веб-страницы по конкретному ключевому слову. Google непрерывно обрабатывает огромнейшие объёмы информации, чтобы лучше “понять” какие страницы должны находиться на первых позициях в поисковой выдаче.

Как видите, Google потратил много времени и сил для того, чтобы предоставлять пользователям качественную информацию на их запросы в поиске. Но и сейчас он не стоит на месте. Каждый день появляются новые страницы и сайты, информацию о которых Google без проблем обрабатывает.

Также следует заметить то, что Google постоянно совершенствуется и обновляет свои алгоритмы для блага пользователей. Это не даёт расслабиться специалистам по SEO и маркетологам даже на мгновение.

Автор теоретической схемы: TJ Welsh&seo.com



Комментариев 5

5 комментариев к «Как устроен поиск в Google: механизмы и алгоритмы»

  1. nikolas_sharp пишет:

    Прочитал, и аж испугался, если не сказать, еще больше запутался :) . Наверное сеошнику достаточно знать основные факторы ранжирования документов + близлежащее к этому, а в саму технологию лезть уже не стоит.

  2. Дмитрий пишет:

    Да все так запутано надо еще пару раз прочитать чтоб понять, видимо для крупных специалистов написано

  3. @ nikolas_sharp:
    @ Дмитрий:
    ребята, это для плавки мозгов) чисто теория, я сам об этом не знал, с интересом почитал, правда, пришлось раза три во всё вникать.
    однозначно, в школьную программу нельзя такое)

  4. Родион пишет:

    После прочитанного слезы аж навернулись) Бедненький гугл, все работает да работает, совсем не бережет себя))

  5. Алексей пишет:

    Спасибо хорошая статья, конечно страшновато все это воспринимается, но одно можно сказать точно – качественный контент всему голова и его не утопить.

    Я писал тексты сам, а потом понял, что чего то все же не хватает и решил заказать сео – статью на TextSale.ru результат сразу практически увидел в гугле, статья хорошо потянула сайт вверх. Собственно переключившись на поисковик гугл я и стал регулярно заказывать качественный текст на текстсале у разных исполнителей. Результат есть, деньги которые я потратил на статьи уже давно отбились и продолжают хорошо работать.

    Так что не так уж и страшны все эти алгоритмы от поисковиков если сайт или блог прикрыт качественным контентом.

Авторский seo блог заводского трудяги, seo новости и полезная seo информация

Дизайн и создание шаблона