Ранжирование и семантика
Поисковая система не может позволить себе ранжировать статьи с одного сайта, которые написаны на очень похожие тематики, а зачастую — на одну тематику, но под разными названиями. Для того, чтобы проверить, как рассматривает ключевые слова на сайте поисковик, нужно их вбить в строку запроса поочереди. Если наблюдается большое пересечение — три однаковых урла и выше, то это значит, что Яндекс или Гугл рассматривает эти слова как синонимы.
Чтобы избежать каннибализации, нужно группировать слова по выдаче, подойтет автоматическая кластеризация с помощью сервисов или десктопного приложения KeyAssort.
Бывает так, что вебмастер не пишет на похожие ключевые слова, а делает кластеризацию и у него получаются слишком большие группы — по 50 и больше ключевых слов (у меня в одной тематики больше ста ключевых слов на группу встречались довольно часто, с частотой больше пяти). Чтобы с такими группами не мучаться с составлением ТЗ, вебмастер может разделить большую группу на две или даже несколько частей. Но такого делать не рекомендуется, так как здесь тоже может случится каннибализация.
Как поедаются тексты
При каннибализации поисковая система выбирает из двух или несколько статей по ее мнению более релевантную, и она учавствует в выдаче, другие статьи в выдаче не учавствуют (но если статьи очень уникальные, возможна выдача по микрочастотниках в тексте). То есть индексация производится, и поисковик держит статью «на всякий случай», и то если по мнению робота, эта статья может быть в принципе полезной в будущем.
Но одной автоматической группировки может быть недостаточно. У меня на семантическое ядро попадаются иногда группы, которые автоматический разгруппировщик разделяет, но их нужно объединять, так как они слишком уж похожи, так что семантику нужно просматривать, доделывать руками, а если уж и не делать этого, то придется группы просто пропускать, теряя ключи. Все зависит от важности сайта и размера семантики. Ведь если ядро предполагает тысячи статей, то все не столь уж важно, но если всего ключевых слов несколько сотен — то нужно, и это не трудно, поработать руками для улучшения групп.