Читать книгу 300+ факторов ранжирования в Google - Анатолий Владимирович Косарев - Страница 75

ТЕКСТЫ
51 фактор. TF-IDF – частота слов в тексте

Оглавление

TF-IDF – это как часто каждое слово появляется в документе. Google считает, чем чаще анализируемое слово появляется в тексте, тем выше вероятность того, что эта страница об этом.


Но Google использует более сложную версию TF-IDF.


TF-IDF (сокращение от «термин частота – обратная частота документа») используется для измерения важности данного ключевого слова на странице. В отличие от плотности ключевых слов, он не просто показывает, сколько раз термин используется на странице; он также анализирует большой набор страниц и пытается определить, насколько важно то или иное ключевое слово.


Скажем, в ремонте автомобилей термин «ремонт шин», вероятно, важнее, чем «ремонт двигателя с турбонаддувом» – просто потому, что у каждого автомобиля есть шины, и только у небольшого количества автомобилей есть турбодвигатели. Из-за этого термин «ремонт шин» будет использоваться в большем наборе страниц, которые говорят о ремонте автомобилей.


Исследуя статистику ключевых слов большого числа ваших конкурентов, формула TF-IDF покажет вам:


1) Какие ключевые слова являются наиболее важными и актуальными для вашей темы;


2) Какие из них используются на вашей странице должным образом (насколько поисковые системы ожидают их появления, поскольку известно, что Google использует TF-IDF при индексации);


3) Какие термины на вашей странице используются слишком много или слишком мало.


Учитывая, что Google не берет во внимание те ключи, которые указаны на веб странице, может оказаться, что в тексте он возьмёт другие ключевые фразы, и будет ранжировать по ним.


Например, создана страница, и как бы оптимизирована под фразу «ремонт компьютеров». Внесла «ремонт компьютеров» с плотностью 5%, но в тексте повторила фразу «наша компания» гораздо больше раз. Такой вариант Google посчитает текст переспамленным по фразе «наша компания». И это грозит тем, что веб страница вылетает из ТОПа.


Другая сторона вопроса – это запросы, с которыми Google сталкивается впервые, и на них нет уже заготовленных ответов, а таких примерно 25%. Подбирать же ответ по наибольшему наличию введённых пользователем слов – заведомо выдавать мусор. Не известно как оптимизирована веб-страница, ведь Google не анализировал её в этом разрезе. Поэтому поисковик начал работать с введёнными пользователем словами, пытаясь понять суть вопроса, на который нужно дать ответ.


Термин «ключевые слова» уже утратил своё смысловое значение с вводом алгоритма RankBrain как составная часть фильтра Колибри (Hummingbird) в 2015 году. Google, по введённым словам, пытается понять суть вопроса, чтобы подобрать наиболее подходящий ответ.


Вот как Грег Коррадо описал RankBrain в то время:


«RankBrain использует искусственный интеллект для встраивания огромного количества письменного языка в математические объекты – так называемые векторы – которые компьютер может понять. Если RankBrain видит слово или фразу, с которыми он не знаком, машина может догадаться, какие слова или Фразы могут иметь аналогичное значение и соответствующим образом фильтровать результат, что делает его более эффективным при обработке поисковых запросов, которых раньше не было».


RankBrain использует так называемые «сущности», которые представляют собой конкретные объекты, о которых Google знает некоторые факты, такие как люди, места и вещи. С помощью математического алгоритма он затем делит объекты на более конкретные векторы слов, которые приводят к определенной поисковой выдачи. Естественно, сходные векторы слов приводят к сходной поисковой выдачи.


Самое лучшее – это то, что Google уже собрал много информации о них и может сразу же найти самые точные результаты поиска по вашему запросу. Однако, когда RankBrain встречает неизвестный запрос, он ищет вектор, который наиболее похож на исходный запрос, и возвращает результаты именно для него.


Теперь, когда RankBrain направлен на подключение поисковиков к наиболее релевантным возможным результатам, поисковая цель стала приоритетом. Вот почему RankBrain отдает предпочтение только тем страницам, которые действительно соответствуют его миропониманию, требованиям – отвечают на вопросы поисковиков, и предоставляют исчерпывающую информацию по теме, указанной в запросе.


Таким образом, сегодняшняя эффективная оптимизация контента невозможна без понимания смысла поискового запроса и проведения исследования ключевых фраз для конкретных целей.


Ещё одна вещь, которая изменила грамотный подход к SEO, – это смещение акцента на оптимизацию контента с ключевых слов на темы запросов пользователями. Я думаю, что для большинства SEO-специалистов неудивительно, что концепция «одно ключевое слово – одна страница» действительно мертва. Это означает, что в эпоху RankBrain всё, к чему вы должны стремиться, – это всесторонность – вы не сможете получить высокий рейтинг, создав многочисленные страницы, которые охватывают различные варианты ключевых слов.


Google теперь даёт больший вес тем страницам, которые способны ответить на большее количество вопросов.


Что мы знаем наверняка о алгоритмах Google, так это то, что они никогда не останутся неизменными надолго. И шансы чрезвычайно высоки, что Google будет (если не уже) настраивать и улучшать RankBrain.

Более того, RankBrain постоянно учится и меняется, поэтому единственное, что нужно делать, это нацелить контент на людей, сделать его актуальным для поисковых целей, а также сделать его диалоговым и современным.


Более подробно о RankBrain читайте в «36 фильтров Google».

300+ факторов ранжирования в Google

Подняться наверх