Что делать, когда в одном кластере запросы с разным интентом

Андрей Буйлов

Автор статьи
Андрей Буйлов

Подробнее об авторе

В статье поговорим про особенности кластеризации. Подписчик спрашивает: «Как действовать в ситуации, когда по результатам кластеризации (в Key Collector или др. сервисе) в один кластер попали запросы с разным интентом? Например, в кластер «фильтр от извести» попали запросы «очистка воды от извести в частном доме» и «очистка воды от извести в квартире». Надо ли продвигать их в одном кластере и, соответственно, на одной странице, если поисковик так считает? Или прежде всего надо ориентироваться на интент и продвигать запросы на разных страницах?»

Разные типы кластеризации

Когда вы делаете кластеризацию в любом софте у вас есть выбор того, как ее делать. Во-первых, есть несколько типов: soft, hard, middle (или moderate — по разному называют). Во-вторых, есть разная сила кластеризации. Обычно ставят 3-4, но можно и варьировать. Иногда можно ставить 2, хотя очень редко, иногда можно ставить 4. И это сильно влияет на то, как эти группы распределяются: будут более компактными или более объемными. Кроме того, есть варианты, когда можно менять глубину, которую сервис анализирует по каждому запросу. То есть по умолчанию обычно анализирует ТОП-10, где и ищет одинаковые УРЛы, одинаковые страницы по нескольким запросам для анализа. Но можно задать, чтобы смотрел ТОП-20 или 30, а кто-то, наоборот, смотрит меньше — ТОП-5.

И в зависимости от того, какие настройки выставите, у вас будут разные группы. Потому нельзя сказать, что обязательно нужно противопоставлять кластеризацию и здравый смысл. Если рассматривать «здравый смысл», то понятно, что там большое пространство для маневра и разночтений, но и в технической кластеризации на основе поисковой выдачи есть много нюансов, как минимум указанные три. Кроме них могут не учитываться главные страницы, не учитываться другие страницы и т.д. — то есть много всего можно учесть или не учесть.

Как сделать

Вот вы сделали кластеризацию и с ней не очень согласны. То есть взяли 3000 запросов, раскидали и видите, что группы какие-то не такие: слишком большие — может быть как и слишком много запросов, так и много попало в одну группу явно с разным интентом, с разным намерением пользователя — или слишком маленькие. И когда вы получаете такую нестандартную картину, то стоит сразу пойти и поменять параметры, сделать перекластеризацию уже с другим типом кластеризации, или с другой силой, или с другой глубиной и т.д. В разном софте есть разные параметры, которые можно добавить/убрать. Но, как правило, в результате получается найти некоторое компромиссное положение.

Допустим, вы поэкспериментировали, выбрали hard и силу 2, 3 или 4. И понимаете, что 3 в данном случае это лучший вариант, но результат все равно не совсем тот. Тогда смотрите не ТОП-10, а ТОП-20 — и видите, что все подходит. То есть сила 3 и ТОП-20 дает более корректную, адекватную картину, и значит, останавливаетесь на этом.

Иными словами, когда мы делаем техническую кластеризацию, именно по топам, то не нужно ей следовать непременно, вроде как «поиск так сказал и так надо делать». Это не поиск так сказал, это мы так проанализировали и проинтерпретировали результаты. Важно просто разумно подойти, поэкспериментировать с параметрами и найти компромиссный вариант. Но при этом не плыть против течения.

Если вы хотите объединить запросы, по которым нет ни одной общей страницы — то это глупость. А если хотите объединить запросы, по которым 2-3 общие страницы, то это нормально. И логикой они нормальные, и по такой мягкой кластеризации они совместимы, тогда можно делать вместе. Ну и точно так же разделяем.

То есть вы приводите технические настройки кластеризации максимально приближено к здравому смыслу. И потом можно еще вручную проверить и посмотреть самому, действительно ли там есть общие урлы. То есть если вы что-то объединили, следите, чтобы эти группы запросы не были явными антагонистами, чтобы какие-то общие УРЛы там были. Потому что это тоже ошибка — объединять группы, если вообще нет общих страниц, продвигаться на одной странице такие запросы будут плохо. А если просто недостаточная сила связи в этом типе кластеризации, то это не так страшно и часто будет продвигаться более-менее.



Остались вопросы? Задавайте! Мы обязательно ответим.
Последние статьи