Алгоритм ранжирования Google
Чтобы выстроить поисковую выдачу, которая будет максимально отвечать запросу пользователя, система Google использует искусственный интеллект RankBrain с системой самообучения. Технология, в основе работы которой заложено самообучение, может получать новые данные самостоятельно. То есть для этого процесса не требуется участие человека или перепрограммирование.
Искусственный интеллект, в отличие от обычной программы, может «мыслить». То есть в процессе самообучения он не просто применяет новые знания, но анализирует их, сопоставляет с уже существующими и создаёт новые смысловые связи. Однако такое определение скорее свойственно идеальному образу ИИ, на практике же этим термином обозначают системы, способные к самообучению и пониманию смысла анализируемой информации.
Из чего состоит алгоритм ранжирования Google
Rank Brain не работает самостоятельно и в прямом смысле не ранжирует страницы, хотя, безусловно, оказывает на это существенное влияние. Этот искусственный интеллект — часть общего поискового алгоритма, который анализирует миллионы страниц в поисках тех, что будут релевантны запросам пользователей. Если говорить конкретно о поисковом алгоритме, в составе которого находится и Rank Brain, то он называется Hummingbird (Колибри).
Колибри — это одна большая система, которая объединяет множество составляющих. RankBrain не работает над самостоятельно обработкой всех запросов, как Hummingbird. Помимо ИИ, в поисковой алгоритм входит много различных фильтров, каждый из которых решает отдельную задачу. Так, например, Payday борется со спамом, фильтр Pigeon оптимизирует локальный поиск, Top Heavy сортирует страницы, содержащие слишком много рекламного контента и т.д.
PageRank — это тоже часть Hummingbird, хотя многие ошибочно считают, что он и есть алгоритм Google. PageRank нужен для определения значимости страницы исходя из её важности и объёма ссылок на неё. Именно PageRank стал первым базисным элементом гугловской системы ранжирования, получившим собственное название. Эта составляющая алгоритма поисковой системы появилась ещё в 1998 году.
Как Google сортирует страницы
Поисковая система сортирует страницы с помощью специальных «сигналов», или факторов ранжирования. То есть когда она читает слова со страницы, она распознаёт их как ключевые запросы. Слова, выделенные полужирным шрифтом, тоже могут распознаваться как сигналы. Наличие оптимизации под мобильную версию — ещё один сигнал, и т.п. На основании этих сигналов алгоритм Колибри определяет место страниц в выдаче по различным запросам. Представители Google заявляют, что всего в поисковом алгоритме существует порядка 200 таких сигналов, которые могут обрабатывать до 10 000 вариаций суб-сигналов.
Rank Brain оказывает большое влияние на результат выдачи и используется, как правило, для распознавания запросов, в которых нет прямых ключевых слов для поиска. Конечно, Google и раньше «умел» находить страницы с неточными вхождениями ключевых слов. Однако сейчас речь идёт не просто о разных грамматических формах одного слова, а о синонимах. Сегодня поисковик может распознавать даже разные смысловые коннотации. То есть он способен отличить, когда речь идёт о технике Apple, а когда о фрукте — apple (яблоко).
С 2012 года у Google работает ещё одна технология, которая может понимать семантику слов. Она получила название Knowledge Graph. По сути, эта система представляет собой базу данных, в которой содержится информация о всех возможных смысловых значениях слов и различных семантических связях.
Ежедневно в Google вводится до трёх миллиардов запросов, причём около 15% из них — новые. RankBrain помогает интерпретировать эти запросы, чтобы обеспечить выдачу наиболее релевантных страниц. Искусственный интеллект может распознавать схожесть не связанных напрямую запросов и объединять их. Компания Google также заявляет, что RankBrain может предполагать, какие страницы больше понравятся пользователям и выдавать их в первую очередь. Правда, каким образом ИИ определяет, что может понравиться, а что нет, — не уточняется.
Представители Google заявили, что RankBrain может даже предоставлять разные результаты по одному запросу для жителей разных стран. Сотрудники компании приводили в пример запрос «сколько столовых ложек входит в стакан», по которому для США и Австралии поисковик выдавал разные результаты, так как страны используют отличающиеся системы измерения.
Итак, алгоритм ранжирования Google — это сложная система, состоящая из множества подсистем, среди которых далеко не последнее место занимает искусственный интеллект RankBrain. Это непосредственный фактор ранжирования, на основании которого определяется позиция ресурса и формируется выдача по запросу пользователя.
Вероятно, RankBrain помогает Google анализировать качественное содержание страницы, то есть полезность размещённого на ней контента. Система самообучается на основе пользовательского контента, после чего полученная информация верифицируется и вносится в последнюю версию ИИ. Скорее всего, по прошествии какого-то времени, искусственный интеллект Google займёт первую позицию среди факторов ранжирования.
Наши специалисты помогут!