Сбор семантики для контекстной рекламы — руководство от Ильи Исерсона — Офтоп на vc.ru

Владелец базы ключевых слов MOAB и спикер конференции Baltic Digital Days о том, что важно учесть при составлении семантического ядра.

55 593 просмотров

Как собрать правильное семантическое ядро

Если вы думаете, что собрать правильное ядро способен некий сервис или программа, то вы будете разочарованы. Единственный сервис, способный собрать правильную семантику, весит около полутора килограмм и потребляет около 20 ватт мощности. Это мозг.

Причем в этом случае у мозга есть вполне конкретное практическое применение вместо абстрактных формул. В статье я покажу редко обсуждаемые этапы процесса сбора семантики, которые невозможно автоматизировать.

Существует два подхода к сбору семантики

Подход первый (идеальный):

  • Вы продаете заборы и их монтаж в Москве и Московской области.
  • Вам нужны заявки из контекстной рекламы.
  • Вы собираете всю семантику (расширенные фразы) по запросу «заборы» откуда угодно: от WordStat до поисковых подсказок.
  • Получаете много запросов — десятки тысяч.
  • Затем несколько месяцев чистите их от мусора и получаете две группы: «нужные» запросы и «минус-слова».

Плюсы: в этом случае вы получаете 100% охват — вы взяли все реальные запросы с трафиком по главному запросу «заборы» и выбрали оттуда всё, что вам нужно: от элементарного «заборы купить» до неочевидного «установка бетонных парапетов на забор цена».

Минусы: прошло два месяца, а вы только закончили работать с запросами.

Подход второй (механический):

Бизнес-школы, тренеры и агентства по контексту долго думали, что с этим делать. С одной стороны, действительно проработать весь массив по запросу «заборы» они не могут — это дорого, трудозатратно, людей не получится научить этому самостоятельно. С другой стороны, деньги учеников и клиентов тоже надо как-то забрать.

Так было придумано решение: берем запрос «заборы», умножаем на «цены», «купить» и «монтаж» — и вперед. Ничего не надо парсить, чистить и собирать, главное — перемножить запросы в «скрипте-перемножалке». При этом возникающие проблемы мало кого волновали:

  • Все придумывают плюс-минус одинаковые перемножения, поэтому запросы вида «монтаж заборов» или «заборы купить» моментально «перегреваются».
  • Тысячи качественных запросов вида «заборы из профнастила в Долгопрудном» вообще не попадут в семантическое ядро.

Подход с перемножениями себя полностью исчерпал: наступают трудные времена, победителями выйдут только те компании, которые смогут для себя решить проблему качественной обработки действительно большого реального семантического ядра — от подбора базисов до очистки, кластеризации и создания контента для сайтов.

Задача этой статьи — научить читателя не только подбирать правильную семантику, но и соблюдать баланс между трудозатратностью, размером ядра и личной эффективностью.

Что такое базис и как искать запросы

Для начала договоримся о терминологии. Базис — это некий общий запрос. Если вернуться к примеру выше, вы продаете любые заборы, значит, «заборы» — главный для вас базис. Если же вы продаете только заборы из профнастила, то вашим главным базисом будет «заборы из профнастила».

Но если вы один, запросов много, а кампании надо запускать, то можно взять в качестве базиса «заборы из профнастила цена» или «заборы из профнастила купить». Функционально базис служит не столько как рекламный запрос, сколько как основа для сбора расширений.

Например, по запросу «заборы» более 1,3 млн показов в месяц по РФ

Это — не пользователи, не клики и не запросы. Это количество показов рекламных блоков «Яндекса» по всем запросам, включающим слово «заборы». Это мера охвата, применимая к некоему большому массиву запросов, объединенных вхождением в него слова «заборы».

В то же время по запросу «заборы из профнастила» — только 127 тысяч показов, то есть охват сжался в десять раз. Сопоставимым образом уменьшится и количество запросов, и трафик на сайт.

Таким образом, можно сказать, что базис — это общий запрос, описывающий товар, услугу или нечто иное, за счет самой своей формулировки определяющий меру охвата потенциальной аудитории.

  • Хотим «геноцида» конкурентов — берем огромный массив запросов по базису «забор», несколько лет его чистим и группируем — и вуаля — у вас лучшая рекламная кампания на рынке.
  • Хотим сделать скромно, но эффективно, продавая только высокомаржинальные заборы из профнастила ограниченной аудитории — берем меньшую в десять раз выборку по запросу «заборы из профнастила» и работаем только с ней.

Итак, первый этап любой рекламной кампании — подбор семантики. А первый этап подбора семантики — это подбор базисов. Важно подобрать базисные запросы, которые:

  • Описывают товар или услугу.
  • Дадут такой объем расширенных запросов, который вы можете обработать в приемлемые для себя сроки.

Теперь попробуем разобраться с проблемой поиска базисов как таковых.

1. Как вы сами называете товар или услугу

Если вы — подрядчик, то спросите об этом у клиента. Например, заказчик говорит вам: «Я продаю спортивные покрытия в Москве и области». Выбросьте из формулировки заказчика Москву и область, а также подберите синонимы.

Базисы в таком случае будут такими

Цифры — это данные частотности по Москве и области по WordStat. Нетрудно заметить, что каждый из запросов при парсинге WordStat в глубину даст разную выборку расширенных запросов, и каждая выборка — это сегмент целевого спроса.

Пример с синонимами посложнее: «небольшой» медиаплан на сотню с лишним базисов с частотностью по Москве для продажи элитной недвижимости:

Вывод: собирать семантику сложно. Но сам сбор низкочастотных запросов довольно прост — есть куча сервисов от Key Collector до MOAB и других. Дело не в сервисе.

Дело в том, что подобрать корректные базисы сервисом невозможно — это можно сделать только руками и мозгом человека, это самая трудная и тяжелая операция.

Итак, мы уже вспомнили определения товара или услуги «из головы» и привели их к укороченным формам. То есть если мы продаем «грузовики камаз», то пишем в файл просто — «камаз».

2. Посмотрите сайты конкурентов

Важно понять ключевой принцип — выборка по запросу «камаз» и по запросу «65115 -камаз» дает разные запросы, частично непересекающиеся. Это разные сущности.

Поэтому не нужно мучительно читать тайтлы конкурентов или анализировать их в сомнительных сервисах. Расслабьтесь, включите фантазию, налейте бокал хорошего коньяка и почитайте сайты конкурентов. Вот список артикулов, каждый из которых — отдельная выборка.

3. Сервисы поисковых систем

Здесь буду краток: проверяйте найденные в первых пунктах базисы вручную через правую колонку WordStat и блок «искали вместе с этим»

Пример: в правой колонке WordStat содержатся так называемые запросы, которые пользователи искали вместе с указанным. Глядя на правую колонку по запросу из примера выше, можно увидеть запрос с вхождением слова «самосвал».

Отлично. Запрос «купить камаз самосвал» нам не нужен, так как он и так попадет в расширенные запросы по базису «камаз», а вот запрос «самосвал» — это новый сегмент с отдельными новыми запросами, новым спросом и новой семантикой.

Берем его в проект. Аналогичным образом анализируем и блок «искали вместе с этим» в выдаче «Яндекса» и Google.

Google, к примеру, подсказывает запрос «сельхозник»

Вот что можно получить по нему в WordStat

Проверим, что говорит «Яндекс». Даже если предположить, что вы не продаете ничего, кроме «КамАЗов», то ваши усилия все равно не пропадут даром.

Можно взять запрос «тягач» и получить новый спрос на ваши грузовики и по нему

В целом, думаю, принцип понятен: задача — найти как можно больше целевых базисов, которые выступают инициаторами, драйверами новых длинных семантических хвостов.

Конечно, тут можно дать ещё много советов: посмотреть анкор-файл конкурентов, посмотреть выгрузки из SpyWords или Serpstat. Всё это, конечно, хорошо. Вернее, было бы хорошо, если бы не было так грустно. Потому что в сущности работа еще даже не началась: насобирать каждый может, а попробуйте-ка всё это очистить, сгруппировать и грамотно управлять.

Вышеописанного вполне достаточно, чтобы, имея светлую голову, собрать семантику на порядок качественнее и лучше, чем у 99% ваших конкурентов.

Как не потратить всю жизнь на сбор ключевых слов

Многие спрашивают: как грамотно управлять семантикой, как её «резать». Если вы продаете могильные камни из буйволиного рога в Нарьян-Маре, вы вряд ли столкнетесь с этой проблемой — у вас семантики всегда будет мало. В то же время, в «горячих» популярных тематиках семантики всегда валом: названия брендов, категорий, моделей, их синонимы и так далее.

Мы решаем эту проблему за счет многоуровневой приоритизации семантики.

1. Приоритизация семантики до сбора запросов

Посмотрите на разделы и категории, по которым собираете семантику, оцените среднюю маржинальность каждой категории. Выкиньте те разделы, где маржинальность меньше 20%. Чаще всего (почти всегда в b2c и чуть реже в b2b) на марже 20% вы будете крутить рекламу в ноль.

Если всё равно остается много — уберите и те разделы, где маржинальность меньше 25-30%, там вы тоже, скорее всего, много не заработаете — максимум немного мелочи в карман плюс покажете производителю больше оборота и выбьете новые скидки. Зарабатывать интересные деньги получается на товарах и услугах с маржой от 30% — не всегда и не везде конечно, но эти цифры я видел десятки раз на самых разных проектах.

2. Сбор базисов и расширенной семантики по ним

Собрали? Все равно получается много? Проранжируйте запросы. Ставьте 1, 2 или 3 рядом с каждым базисом. Заставьте себя это сделать, вот так:

Я специально ограничиваюсь тремя значениями — это просто. Если у вас будет десять уровней приоритета, вы сойдете с ума, думая о том, поставить 6 или 7 конкретному базису, — а так решения очень простые и очевидные.

Кроме того, это помогает структурировать свой бизнес для самого себя — взглянуть на него сквозь призму спроса и маржинальности: фильтруем по столбцу «Приоритет» и видим, что поставили «1» тем базисам, по которым мало спроса.

Значит, надо либо активнее работать с другими товарными направлениями, снижать закупочные цены, либо стимулировать спрос — но это уже другая история.

3. Отсекли всё неприоритетное и всё равно семантики слишком много

Когда говорят про «резать» семантику, те, кто с этим поработал, как правило, имеют в виду удаление низкочастотных запросов с частотностью ниже определённой отсечки. В тематических дискуссиях в Facebook и на форумах я регулярно вижу цифры от 5 до 10 (имеется в виду общая частотность по запросу).

То есть намеренно убирается из массива всё, что по частотности меньше 10.

Понятно, что так делать можно, если у вас всё равно очень много семантики. Но это всегда вопрос выбора между поеданием рыбы и сидением на неудобных для сидения предметах. Слишком много уберете — недосчитаетесь каких-то минус-слов, получите больше «грязного» трафика на запуске, но выиграете в трудозатратности.

Моё мнение таково: условная точка баланса здесь находится на уровне «убираем всё, что не имеет частотности». Это позволяет выкинуть примерно половину массивов, полученных из различных источников, в то же время трафик на запуске остается очень чистым, с погрешностью буквально 1-3% и быстро дочищается.

Что значит «дочищается»

Представьте, что вы собрали рекламную кампанию для поискового размещения в «Яндекс.Директе», запустили ее, и вам нужно оценить эффективность проделанной работы. Как это сделать? Оценивать по продажам? Не совсем правильно, ведь продажи — это результат работы цепочки «кампания-сайт-менеджеры».

Звонки? Тоже нет, ведь огромное влияние на количество звонков оказывает сайт: может быть, с кампанией всё хорошо, просто сайт сделан неправильно.

Быстро проверить эффективность поисковой кампании можно в «Яндекс.Метрике». Для этого нам надо через два-три дня после запуска кампании получить отчет о фразах, послуживших источниками перехода. Как найти этот отчет в «Метрике»:

А затем:

Кликаем на крестик на всех группировках, кроме «Поисковая фраза», и нажимаем «Применить». Мы получим отчет о тех фразах, по которым пользователи увидели наши объявления, кликнули по ним и перешли к нам на сайт. Что делать с этим отчетом?

Внимательно просмотреть и выделить нерелевантные фразы, которые не относятся к вашему бизнесу. На жаргоне их называют «мусором». В профессионально сделанных кампаниях в первое время после запуска доля «мусора» может составлять от 1 до 4%, в кампаниях, собранных «на коленке», — до 20-40%.

Как вы уже, наверное, поняли, процедуру с дополнительной очисткой от мусора стоит проводить регулярно — как минимум, два-три раза в месяц. Почему так часто?

У нас был интересный пример из практики. Мы работали с кампанией, в которую включили для клиента высокомаржинальный запрос «черный дым дизель». Клиент работал с дизельными двигателями, и такой запрос означает, что у клиента есть серьезная проблема с двигателем, и, вероятно, потребность в квалифицированных услугах.

Одновременно с этим в сентябре 2016 года, когда группировка российского флота направилась в Сирию, ТАКР «Адмирал Кузнецов» привлек внимание международных СМИ сильным черным дымом из выхлопной трубы. Это неизбежно спровоцировало запросы вроде «черный дым дизель адмирал кузнецов».

Ранее таких запросов просто не было, поэтому и не было минусов формата «–адмирал, –кузнецов». Поэтому мало того, что наше объявление показалось по таким запросам, так оно ещё и сгенерировало бессмысленные переходы, не имеющие для бизнеса никакой ценности.

Отследить такие запросы оперативно можно только в «Метрике»: поэтому возьмите себе за правило на старте кампании почаще (позже — реже) проверять семантику и дополнительно минусовать новый мусор.

Разумеется, возникает вопрос: а что вообще влияет на количество мусора. Всё просто — статистическая достоверность семантики.

На что влияет объем семантики

Далеко не всегда люди понимают, о чем говорят, когда обсуждают влияние обширного семантического ядра на цену клика, качество кампании и прочее. Сама по себе обширная семантика не вызывает ни снижения цены клика, ни увеличения качества кампании. На что же реально влияют сотни и тысячи собранных НЧ-запросов?

1. Чистота трафика на запуске кампании

Чем больше запросов вы соберете — тем больше найдете минус-слов. На бесконечно большой выборке запросов вы найдете все возможные минус-слова, потратив на это бесконечный период времени.

На практике стоит ограничиться запросами, как я уже говорил, с частотностью от 1 по нужному региону — это даст «мусорность» в районе 3-4% при запуске, после чего вы быстро дочистите оставшиеся мусорные запросы, минусы, по которым почему-то не попали в выборку.

При этом стоит использовать и WordStat, и советы поисковых систем, собирая подсказки для каждого запроса, полученного в WordStat. Использование одного только WordStat даст высокую мусорность — 10-15% на запуске как минимум (если не больше). Но все мы понимаем — чем больше мусора, тем больше расход средств, тем меньше лидов на единицу расхода.

2. Релевантность объявлений запросам

Здесь важно понять системообразующий принцип: запросы, которые вы добавили в кампанию, по большому счету, ничего не значат. Они не важны.

Реальный трафик, который будет попадать к вам на сайт, приходит большей частью не по тем запросам, которые вы добавили в кампанию, а по расширениям от них. На один запрос, добавленный в кампанию, приходится как минимум три-четыре расширенных варианта — это ультра-НЧ, которые вообще никак не предскажешь, пользователи генерируют их прямо в момент поиска.

Поэтому не столь важен сам запрос: так много стало трафика по ультра-НЧ с частотой перехода в один-два раза в месяц или в год, что привязываться к конкретному запросу нет смысла. Важно собрать статистически значимую семантику, разбить её на мелкие группы похожих запросов и составить под них объявления.

Больше семантика — больше групп, больше точность соответствий и ниже цена кампаний на поиске. В конкретной группе похожих ультра-НЧ, из которых сформируется объявление, может быть пять-десять запросов — а если вы выудите из «Метрики» фразы по этому объявлению через полгода, получите список на 30-40 фраз как минимум.

Повторюсь: семантика — не панацея от всего и не божество. Семантика влияет на многое: на чистоту трафика, на релевантность объявлений запросам — но не на всё. Не имеет смысла собирать огромные выборки «нулевок» в надежде получить трафик дешевле — этого не будет.

Семантика влияет:

  • На охват рекламной кампании.
  • На чистоту трафика.
  • На релевантность «запрос-объявление».

Вот те факторы, про которые вам стоит помнить в первую очередь. Впрочем, попробуем суммировать итоги в двух словах.

Кратко

  1. ​Соберите базисные запросы — общие фразы, описывающие ваши товары и услуги.
  2. Проверьте, все ли синонимы и переформулировки вы собрали: в помощь вам WordStat и блок «похожие запросы» в SERP.
  3. Соберите расширения по полученным запросам: WordStat, поисковые подсказки, база MOAB — всё идет в дело.
  4. Составьте табличку, где рядом с каждым базисом будет указана его частотность и количество расширенных запросов.
  5. Если запросов слишком много, и вы не успеваете их обработать — выполните приоритизацию базисов в зависимости от маржи, частотности и количества запросов.
  6. Окончательный семантический план сформирован. Теперь дело за очисткой и кластеризацией семантики.

Сбор семантического ядра с помощью Serpstat

33538 86

SEO – Читать 13 минут

Прочитать позже

Пошаговая инструкция для новичков и владельцев бизнеса

Анастасия Сотула

Редактор блога Serpstat

Прочитав эту статью, вы узнаете о том, как правильно собирать ключевые слова для сайта и как составить семантическое ядро. Рассмотрим, как собирать ключевые слова Гугл, используя планировщик ключевых слов от Serpstat.

Данный инструмент позволяет осуществить быстрый подбор ключевых слов Гугл с учетом поисковых подсказок и упущенных фраз. Создание полной и актуальной семантики поможет улучшить позиции сайта в поисковой выдаче.

Содержание

  1. Что такое семантическое ядро сайта?
  2. Как собрать ключевые фразы для сайта?
  3. Как расширить список ключевых фраз?
  4. Как очистить список ключевых слов?
  5. Как разбить ключевые фразы на группы?

Заключение

Что такое семантическое ядро сайта?

Пользователи осуществляют поиск информации, товаров и услуг, используя разнообразные поисковые запросы, которые называют ключевыми фразами. Чтобы пользователи могли найти ваш сайт в поиске, соберите максимально полный и релевантный список ключевых фраз по нужной тематике. Этот перечень ключевых слов называется семантическим ядром. Качественное семантическое ядро поможет ресурсу хорошо ранжироваться в поисковой выдаче.

Поведенческие факторы (ПФ) — это действия, которые осуществляют посетители на странице выдачи по отношению к сайту, а также на самом ресурсе (вход, продолжительность посещения, кликабельность, показатель отказов и др.), которые учитываются поисковиками в процессе формирования поисковой выдачи.

Для чего собирают семантическое ядро?

  • для создания структуры сайта;

  • для заполнения метатегов, заголовков страниц сайта и соцсетей;

  • для создания текстового контента на ресурсе и в соцсетях;

  • для анкоров ссылок, используемых во внутренней перелинковке;

  • для анализа сезонности поисковых запросов.

Чтоб собрать качественное семантическое ядро, проводят тщательный анализ ключевых фраз. Только таким способом можно найти актуальные ключи для эффективного продвижения проекта.

    Особенности ключевых слов, которые необходимо учитывать:

    • частотность фразы, с которой пользователи ищут товары и услуги по данному запросу;

    • сложность фразы для продвижения в органическом поиске с учетом уровня конкуренции;

    • стоимость за клик (CPC) в платной выдаче.

    Далее я расскажу подробнее, как собирать качественную семантику для сайта, но сначала небольшой спойлер 😉

    Как собрать семантическое ядро: 6 этапов

    • Поиск основных ключевых слов (наиболее четко описывающих тематику продвигаемой страницы, чаще всего они используются для страниц разделов, категорий, рубрик).

    • Расширение семантического ядра.

    • Чистка полученного перечня.

    • Повтор действий, указанных в пунктах 1−3 (при необходимости).

    • Группировка (кластеризация) ключей.

    • Изучение альтернативных источников и подбор ключевых слов.

    Как собрать ключевые фразы для сайта?

    Базовый анализ ключевых фраз

    Чтобы получить список ключевых фраз, следует определить ключи, имеющие отношение к тематике вашего проекта. Есть такие способы их поиска:

    • Анализ структуры сайта прямых конкурентов.

    • Brain storm.

    • Использование специализированных сервисов (Serpstat, Netpeak Spider, Netpeak Tags Finder).

    Подумайте, какие ключи описывают ваш продукт, услугу, уникальное предложение. Сохраните этот список в Google Таблице. Затем проанализируйте эти ключи таким образом:

    Проверьте эти запросы в разделе «Анализ ключевых фраз→ SEO-анализ→ Подбор фраз», чтобы найти все ключи, содержащие искомую фразу:

    Подбор ключевых фраз

    При необходимости воспользуйтесь фильтрами и отсортируйте ключевые слова по нужным параметрам.

    Использование фильтра

    Совет #1

    Для оптимизации сайта под специальные результаты поиска, например, расширенный сниппет, быстрый ответ, граф знаний или local pack, рекомендуем воспользоваться фильтром «наличие элементов в выдаче» и посмотреть, по каким ключевым фразам они отображаются. Более подробно узнать про спецэлементы SERP можно, прочитав наш визуальный гайд по выдаче Google.

    Дополните свой список ключевых слов фразами, тематически связанными с ключами, которые вы собрали. Для этого откройте раздел «Похожие фразы». В этом отчете вы найдете неочевидные варианты ключевых фраз: синонимы, сленговые выражения и ключевые фразы с длинным хвостом.

    Поиск похожих фраз

    Как расширить список ключевых фраз?

    Конкурентный анализ. Является надежным источником релевантных поисковых запросов: если другие сайты из всей ниши хорошо ранжируются по каким-то фразам, почему бы вам их не позаимствовать? Анализируя топовых конкурентов и используя их опыт, вы можете значительно улучшить свои позиции.

    Serpstat предлагает несколько вариантов анализа семантики конкурентов. Хотите знать, какие ключевые слова используют ваши конкуренты? Просто введите адрес сайта в поисковую строку, чтобы увидеть ключевые слова, по которым этот сайт появляется в результатах поиска.

    Анализ ключевых слов конкурентов

    Упущенные фразы. Также можно найти упущенные вами фразы, по которым ранжируются конкуренты. Для этого воспользуйтесь отчетом «Сравнение доменов». Здесь вы можете сравнить семантику своего сайта с одним или двумя конкурентами.

    Особый интерес представляют фразы, которые используют оба ваших конкурента, но они не обнаружены на вашем сайте. С высокой вероятностью они будут релевантны и для вас. Также Serpstat позволяет найти самые трафиковые темы для статей.

    Общие ключевые фразы у доменов

    Хотите проанализировать конкурентов с помощью Serpstat?

    Активируйте триал и протестируйте платформу бесплатно в течение 7 дней!

    Зарегистрироваться!

    Поисковые подсказки и вопросы. Чтобы заполнить больше семантических пробелов, вы можете воспользоваться поисковыми подсказками и вопросами. Это продолжения фраз, которые предлагают поисковики, когда пользователь вводит ключевое слово.

    Отчет по поисковым подсказкам

    Вверху отчета вы увидите список самых популярных слов, употребляемых с искомой фразой. Это может быть действительно полезно для анализа того, чем интересуются и что ищут ваши потенциальные клиенты.

    Совет #2

    Нажмите на кнопку «Только вопросы» и вы увидите список вопросов, на которые пользователи ищут ответы прямо сейчас. Здесь вы найдете действительно хорошие идеи для контента и заголовков статей.

    Вопросы в поисковых подсказках

    Хотите собрать семантическое ядро с помощью Serpstat?

    Активируйте триал и протестируйте платформу бесплатно в течение 7 дней!

    Зарегистрироваться!

    Как очистить список ключевых слов?

    Идем далее, мы собрали впечатляющий список ключевых слов. Здорово! Но, если внимательнее посмотреть на весь список, можно заметить, что не все они соответствуют теме вашего сайта или не подходят по другим критериям. Использование таких ключей может привести к тому, что на сайт будет попадать нецелевая аудитория.

    Чтобы избежать этого, нужно очистить список ключевых фраз от «мусора». Здесь вы должны определить список стоп-слов для своей тематики (сайта).

    Наиболее распространенные ключевые слова для удаления включают в себя:

    • бесплатно, дешево, б/у;
    • брендовые запросы конкурентов;
    • топонимы, которые не имеют отношения к вашему бизнесу;
    • ключевые фразы с неправильным написанием;
    • повторы.

    Как отсортировать эти ключевые слова? Serpstat предлагает различные варианты сортировки — фильтры. Вы можете исключить любые ключи (ключевое слово), географические названия (фильтрующие топонимы), ключевые слова с ошибками.

    Фильтрация ключевых слов

    Как разбить ключевые фразы на группы?

    Для того, чтобы понять, как ключевые фразы должны распределяться по страницам сайта, необходимо разбить их на смысловые группы — кластеризовать.

    Кластеризация — процесс разбиения ключевых фраз на группы, называемые кластерами. Внутри каждой группы должны оказаться «похожие» фразы, а фразы разных групп должны быть как можно более отличны.

    Кластеризация включает в себя:

    • объединение фраз по смыслу;

    • проведение эффективного анализа семантического ядра;

    • создание кластера фраз для размещения на конкретной странице;

    • иерархия кластеров для организации структуры страниц;

    • поиск некластеризованных ключевых фраз, которые не относятся ни к одной из групп.

    Семантические кластеры — группы связанных по смыслу ключевых фраз. Они включают в себя несколько уровней:

    Протокластер — это набор суперкластеров. Как правило, в протокластер объединяются суперкластера, представляющие определенную категорию объектов. Например, если вы создаете семантику для многотоварного интернет-магазина, то в одном протокластере будут суперкластеры по тематике холодильников, а в другом — микроволновые печи. Протокластера созданы для удобства работы с суперкластерами.

    Суперкластер — это набор кластеров. Суперкластер объединяет близкие по смыслу фразы, но менее синонимичные, чем фразы из кластера.

    Кластер — группа семантически связанных ключевых фраз. Важно, что запросы из кластера должны соответствовать поисковым запросам пользователей. Обратите внимание, что на одной странице не должны быть и коммерческие, и информационные ключевые фразы.

    Вы можете кластеризовать запросы вручную, но этот процесс займет много времени, особенно, если вы группируете фразы для крупного сайта. Поэтому быстрее и проще сделать это автоматически, при помощи специализированных сервисов.

    Здесь вам может помочь инструмент «Кластеризация» Serpstat. Сделав простые настройки, вы получите готовые кластеры, разбитые по смыслу. Как работать с инструментом, читайте в статье.

    Кластеризация ключевых фраз

    В чем преимущества кластеризации Serpstat?

    Serpstat использует метод интеллектуальной иерархической кластеризации, который объединяет кластера в суперкластера. При этом от вас не требуется ни дополнительного сбора частотности, ни какой-либо предварительной подготовки данных. Вы просто загружаете список фраз, выбираете регион и выбираете способ кластеризации.

    У инструмента «Кластеризация» нет центра кластера (высокочастотной фразы, для которой подбираются фразы со схожими результатами выдачи) — Serpstat проверяет связи между всеми кластеризуемыми фразами.

    Пример анализа ключевых слов

    Текстовая аналитика

    Рекомендуемые ключевые слова

    Анализ текста

    Анализ ошибок

    Хотите повысить текстовую релевантность страниц с помощью Serpstat?

    Активируйте триал и протестируйте платформу бесплатно в течение 7 дней!

    Зарегистрироваться!

    Шпаргалка: особенности семантики для разных сайтов

    Интернет-магазин:

    • широкая структура сайта;
    • легко выделить категории;
    • в приоритете товарные и коммерческие запросы;
    • наличие тегов и фильтров;
    • возможность генерировать ключи под отдельные марки и модели;
    • использование информационных запросов обзорах, отзывах.

    Блог:

    • исключительно информационные запросы;
    • тематика может быть определена на слишком четко;
    • широкий спектр запросов для постов;
    • использование тегов для статей.

    Новостники:

    • периодичная тематика, события, тренды;
    • обязательно использование тегов для статей;
    • небольшое количество категорий на сайте.

    Корпоративный сайт:

    • небольшое количество запросов;
    • узкотематическая семантика;
    • менее четкая группировка запросов.

    Заключение

    Чтобы получить полный список релевантных ключевых фраз для сайта, необходимо:

    Собрать список маркерных ключевых слов, на основе которых будет формироваться облако запросов.

    Расширить семантику, используя конкурентный анализ и синонимы.

    Дополнить список ключевых фраз поисковыми подсказками и вопросами (по необходимости).

    Удалить «мусорные» ключевые фразы, которые нерелевантны для вашего сайта.

    Тщательно сгруппировать запросы и создать приблизительную структуру сайта.

    Serpstat — набор инструментов для поискового маркетинга!

    Находите ключевые фразы и площадки для обратных ссылок, анализируйте SEO-стратегии конкурентов, ежедневно отслеживайте позиции в выдаче, исправляйте SEO-ошибки и управляйте SEO-командами.

    Набор инструментов для экономии времени на выполнение SEO-задач.

    Получить бесплатный доступ на 7 дней

    Оцените статью по 5-бальной шкале

    4.55 из 5 на основе 94 оценок

    Нашли ошибку? Выделите её и нажмите Ctrl + Enter, чтобы сообщить нам.

    Рекомендуемые статьи

    SEO

    Анастасия Сотула

    11+ способов SEO-оптимизации видео для сайта

    SEO

    Анастасия Сотула

    9 лучших инструментов для парсинга сайтов в помощь SEO-специалисту

    SEO

    Анастасия Сотула

    10 лучших инструментов для проверки скорости загрузки сайта

    Кейсы, лайфхаки, исследования и полезные статьи

    Не успеваешь следить за новостями? Не беда! Наш любимый редактор подберет материалы, которые точно помогут в работе. Только полезные статьи, реальные кейсы и новости Serpstat раз в неделю. Присоединяйся к уютному комьюнити 🙂

    Нажимая кнопку, ты соглашаешься с нашей политикой конфиденциальности.

    Поделитесь статьей с вашими друзьями

    Вы уверены?

    Спасибо, мы сохранили ваши новые настройки рассылок.

    Сообщить об ошибке

    Отменить

    основных словарей | Joinup

    Уважаемые пользователи, создание новых аккаунтов временно отключено. Пожалуйста, проверьте позже. Приносим извинения за доставленные неудобства.

    Постоянная ссылка

    • Основные словари
    • Кто использует основные словари
    • Подробнее об основных словарях

     

     Справочник по использованию основных словарей описывает, как основные словари могут использоваться государственными администрациями для достижения минимального уровня семантической совместимости для систем электронного правительства. Справочник объясняет, как (а) разрабатывать новые модели данных, расширяющие базовые словари; и (b) сопоставить существующие модели данных с основными словарями.

    Практическое руководство по использованию основных словарей, основанное на справочнике, доступно на сайте Joinup.

     

    Что такое основные словари

    Основные словари представляют собой упрощенные, многократно используемые и расширяемые модели данных, которые охватывают фундаментальные характеристики объекта в контекстно-нейтральной форме. Государственные администрации могут использовать и расширять основные словари в следующих контекстах:

    • Разработка новых систем : Базовые словари можно использовать в качестве отправной точки по умолчанию для разработки концептуальных и логических моделей данных во вновь разрабатываемых информационных системах.
    • Обмен информацией между системами : Базовые словари могут стать основой контекстно-зависимой модели данных, используемой для обмена данными между существующими информационными системами.
    • Интеграция данных : Базовые словари можно использовать для интеграции данных, поступающих из разрозненных источников данных, и создания объединения данных.
    • Публикация открытых данных : Основные словари могут использоваться в качестве основы для общего формата экспорта данных в базовых реестрах, таких как кадастры, коммерческие реестры и порталы государственных услуг.

    SEMIC поддержала международные рабочие группы для достижения консенсуса по следующим основным словарям.

    Словарь

    Описание

    Базовый бизнес-словарь представляет собой упрощенную, многократно используемую и расширяемую модель данных, которая отражает основные характеристики юридического лица, например. юридическое название, вид деятельности, адрес, юридический идентификатор, тип компании и ее деятельность. 8 января 2013 года синтаксис RDF основного бизнес-словаря был официально опубликован на треке стандартов W3C в качестве общедоступного рабочего проекта. Привязка синтаксиса RDF к основному бизнес-словарю была названа W3C словарем зарегистрированной организации. Последнюю версию Базового бизнес-словаря можно скачать здесь.

    Базовый словарь местоположения — это упрощенная, многократно используемая и расширяемая модель данных, которая фиксирует основные характеристики местоположения, представленного в виде адреса, географического названия или геометрии. Словарь местоположения приведен в соответствие со спецификациями данных INSPIRE. Последнюю версию словаря основных местоположений можно скачать здесь.

    Основной словарь человека — это упрощенная, многократно используемая и расширяемая модель данных, которая фиксирует основные характеристики человека, например. имя, пол, дата рождения и т. д. Последнюю версию словаря Core Person Vocabulary можно скачать здесь.

    Базовый словарь государственной службы представляет собой упрощенную, многократно используемую и расширяемую модель данных, которая отражает основные характеристики службы, предлагаемой государственной администрацией. К таким характеристикам относятся название, описание, входы, выходы, поставщики, местонахождение и т. д. государственной услуги. Профиль приложения Базового словаря государственных услуг (CPSV-AP) был разработан для описания государственных услуг и их группировки в деловых мероприятиях. Последнюю версию CPSV-AP можно скачать здесь.

    Базовый словарь доказательств и критериев представляет собой упрощенную, многократно используемую и расширяемую модель данных для описания принципов и средств, которым должна соответствовать частная организация, чтобы получить право или квалификацию для оказания государственных услуг или участия в государственных закупках. Государственным организациям часто необходимо определить критерии. Критерий — это правило или принцип, который используется для суждения, оценки или проверки чего-либо. Доказательство — это средство, с помощью которого может быть доказан Критерий. Последнюю версию словаря Core Evidence and Criterion можно скачать здесь.

     

    Базовый словарь общественных организаций представляет собой упрощенную, многократно используемую и расширяемую модель данных для описания общественных организаций в Европейском Союзе. Последнюю версию Базового словаря общественной организации можно скачать здесь.

     

     

    Посетите страницу «Основные словари» на сайте «Joinup» для получения дополнительной информации или просмотрите «Реестр основных словарей».

     

    Сопоставления между основными словарями и другими международными спецификациями данных доступны в Каталоге сопоставлений моделей основных данных.

    Узнайте больше об основных словарях здесь или посмотрите наше вводное обучение.

     

     

    Кто использует основные словари

    Проекты, реализующие основные словари, можно найти на карте SEMIC.

    Подробнее об основных словарях

    Наименование

    Описание

    Использование Crane Genericode-to-UBL-NDR для расширения базовых словарей и создания форматов электронных документов (апрель 2014 г.)

    В этом руководстве объясняется, как создать электронный документ в формате XSD с помощью инструмента Cranesoftwrights Genericode to UBL NDR. Мы использовали этот инструмент для создания образца документа под названием «Запрос на регистрацию деловой активности» с использованием основных словарей ISA и правил именования и дизайна UBL.

    Как описывать организации с помощью словаря основного бизнеса и онтологии ORG (ноябрь 2012 г. )

    В этом тематическом исследовании объясняется, как организации могут быть описаны в RDF с использованием словаря основного бизнеса и онтологии организации.

    Взаимосвязь коммерческих регистров с Базовым бизнес-словарем (ноябрь 2012 г.)

    Экономическое обоснование подчеркивает потенциал Ключевого бизнес-словаря в качестве основы для общего семантического стандарта для взаимосвязанных коммерческих регистров в Европе и за ее пределами.

    Процесс и методология разработки основных словарей (ноябрь 2011 г.)

    В этом отчете документированы процесс и методология, которые используются для обеспечения достижения консенсуса по такому Основному словарю и обеспечения максимально широкого участия государств-членов в процессе разработки и последующего принятия.

    К метаданным открытого правительства (сентябрь 2011 г.)

    Это документ с изложением позиции по продвижению метаданных открытого правительства как важного посредника и средства обеспечения семантической интероперабельности.

    Основные словари SEMIC.eu: дело основного лица (август 2011 г.)

    В этом тематическом исследовании описываются инициативы SEMIC.EU по созданию основных словарей для электронного правительства.

     

    The Wiley Blackwell Companion to Semantics, набор из 5 томов

    Выбранный тип: Твердый переплет

    Количество:

    795,00 $

    Дэниел Гуцманн (редактор), Лиза Мэтьюсон (редактор), Сесиль Мейер (редактор), Хотце Руллманн (редактор), Томас Э. Циммерман (редактор)

    ISBN: 978-1-118-78831-8 март 2021 г. Уайли-Блэквелл 3360 страниц

    • Распечатать

      Всего от 795 долларов США

    Твердый переплет

    795,00 $

    Загрузить рекламный проспект

    Загрузить рекламный проспект

    Загрузить флаер продукта для загрузки PDF в новой вкладке. Это фиктивное описание. Загрузить флаер продукта — загрузить PDF в новой вкладке. Это фиктивное описание. Загрузить флаер продукта — загрузить PDF в новой вкладке. Это фиктивное описание. Загрузить флаер продукта — загрузить PDF в новой вкладке. Это фиктивное описание.

    Описание

    Всеобъемлющий обзор лингвистической семантики, написанный видными экспертами в этой области

    The Wiley Blackwell Companion to Semantics содержит тщательное исследование вопросов и явлений, занимающих центральное место в развитии современной семантики и ее интерфейсов. В этой книге представлены подробные главы, написанные ведущими экспертами в этой области, исследуются конкурирующие анализы и подходы, исследуются их концептуальные основы и оцениваются применительно к различным языкам. Этот авторитетный сборник позволяет ученым и изучающим семантику, а также специалистам в смежных областях лингвистики, например специалистам по синтаксису, расширять и углублять свои знания по предмету и разработкам в этой области.

    Представляя более 100 тематических исследований, коллекция глав в этом компаньоне организована в алфавитном порядке для удобства поиска. Этот ключевой справочный труд:

    • Подробно освещает основные достижения в области лингвистической семантики за последние несколько десятилетий.
    • Демонстрирует, как исследования могут выявить различия и сходства в различных языках. играют важную роль в теоретических дебатах
    • Идентифицирует темы с помощью известных примеров предложений

    Wiley Blackwell Companion to Semantics является ценным справочным пособием для ученых, исследователей, академиков и студентов, изучающих лингвистику и смежные области.

    Эта работа также доступна в виде онлайн-ресурса на www.companiontosemantics.com

    Об авторе

    Даниэль Гуцманн — старший преподаватель немецкого языкознания в Кёльнском университете, Германия. Его исследовательские интересы — семантика, прагматика и синтаксис. Он автор Use-Conditional Meaning (2015) и Грамматика выразительности (2019), а также соредактор Beyond Expressives (2013), Подходы к значению: композиция, значения и интерпретация (2014) и Вторичный контент (2019).

    Лиза Мэтьюсон — профессор лингвистики Университета Британской Колумбии, Канада. Ее исследовательские интересы сосредоточены на семантических вариациях и универсалиях. Она соредактор Methodologies in Semantic Fieldwork (2015) и редактор Quantification: A Cross-Linguistic Perspective (2008) и автор книги When I Was Small — I Wan Kwikws: A Grammatical Analysis of St’át’imcets Oral Narratives (2005) и Системы определения и количественные стратегии: данные из Salish (1998).

    Сесиль Мейер — старший преподаватель Гете-Университета, Франкфурт, Германия. Работала над толкованием прилагательных и конструкций сравнения, над определенностью. Она является соредактором Подходы к значению: состав, ценности и интерпретация (2014) и Субъективное значение: альтернативы релятивизму (2016).

    Хотце Руллманн — адъюнкт-профессор Университета Британской Колумбии, Канада. Он является соредактором журнала Perspectives on Negation and Polarity Items (2001) и опубликовал публикации по различным темам семантики, включая вопросы, сравнительные сравнения, отрицательную полярность, фокусные частицы, модальность и взаимодействие модальных глаголов с временными и аспектными. .

    Томас Эде Циммерманн — профессор формальной семантики в Гете-Университете, Франкфурт, Германия. Его основные исследовательские интересы включают описательную композиционную семантику, логические основы семантики и философию языка. В дополнение к его книжным публикациям, которые включают в соавторстве Introduction to Semantics (2013), он также опубликовал более 50 исследовательских работ и является бывшим редактором журнала Linguistics and Philosophy .

    Соглашение

    Actuality Entaultions
    Валентин Хаккард

    Неоснова
    Massimo Poesio

    Anankastic Conditionals
    KJELL Johan Sæbø


    KJELL Johan Sæbø


    Kjell Johan Sæbø

    . Глаголы
    Хейзел Пирсон

    Единственное число
    Алан Манн и Кристина Шмитт

    Biscuit conditionals
    Kyle Rawlins

    Boolean and non-Boolean conjunction
    Viola Schmitt

    Clausal vs. phrasal comparatives
    Winfried Lechner

    Complex Demonstratives
    Geoff Georgi

    Compositionality
    Michael Johnson

    Скрытые вопросы
    Илария Франа

    Концептуальные пространства и семантическое сходство цветов
    Gerhard Jäger

    Контекст и разговор
    Mitchell Green

    Копулярные предложения
    Caroline Heycock

    Correlatives
    Jo-Wang Lin

    .
    Ана Арреги

    Определенность
    Сесиль Мейер

    Измерения смысла
    Даниэль Гуцманн

    частицы дискурса
    Патрик Г. Грош

    Распределение, коллективность и кумулятивность
    Лукас Шамполлион

    Donkey Anaphora
    Adrian Brasoveanu & Jakub Dotlacla 99. Adrian Brasoveanu & Jakub Dotlacil Игорь Янович

    Местоимения E-типа
    Рик Ноувен

    Оценочные предикаты за гранью веселья и вкусняшки
    Carla Umbach

    Evidentials
    Sarah Murray

    Exclamatives
    Elena Castroviejo

    Expressives
    Elin McCready

    Family Resemblance and Prototypes
    Galit Sassoon

    Free choice disjunction
    Marie-Christine Meyer

    Предметы свободного выбора и модальные неопределенные числа
    «Луис Алонсо-Овалье и Паула Менендес-Бенито»

    Свободные родственники
    Radek Šimík

    Gradable adjectives and degree expressions
    Marcin Morzycki

    Graded Modality
    Daniel Lassiter

    Idioms
    Manfred Sailer

    Imperatives
    Magda Kaumann

    Imperfectivity
    Ashwini Deo

    Неопределённо-вопросительное сродство
    Эдгар Онеа

    Индекс-зависимость и вложение
    Орин Перкус

    Indexicality
    Isidora Stojanovic

    Indicative Conditionals
    Katrin Schulz & Robert van Rooij

    Information Structure
    Beáta Gyuris

    Intensional Transitive Verbs
    Florian Schwarz

    Intentional Identity
    Robert van Rooij

    Эффекты вмешательства
    Clemens Steiner-Mayr

    Конструкции обратной связи
    9033

    Лингвистическая относительность: от Уорфа до наших дней
    Юрген Бонемейер

    Буквальное против обогащенного значения
    Пол Элбурн

    Логическое всеведение
    Paul Egré

    Matrix and embedded presuppositions: projection, accommodation, cancellation, and ambiguities
    Raj Singh

    Measure phrases
    Greg Scontras

    Mixed Quotation
    Emar Maier

    Modal concord
    Janneke van Wijnbergen-Huitink

    Модальное подчинение: Оно съест вас первым!
    Крейдж Робертс

    Модально-временные взаимодействия
    «Anamaria Falaus & Brenda Laca»

    Modified Numerals
    Benjamin Spector

    Negative Indefinites and negative concord
    Doris Penka

    Negative polarity
    Vincent Homer

    Nominal vs. Adverbial Quantification
    Stefan Hinterwimmer

    Номинализации: случай номинализации модальных предикатов
    Фридерика Мольтманн

    Модификация нелокального прилагательного
    Bernhard Schwarz

    Non-restrictive nominal modification
    Cathrine Fabricius-Hansen

    Noun Incorporation
    «Sandra Chung & William A. Ladusaw»

    Pluractionality
    Ana Müller + Luciana Sanchez-Mendes

    Семантика возможных миров для изображений
    Дорит Абуш

    Прагматическое приспособление
    «Михаил Киссине и Мирто Пантази»

    Предположительное связывание
    Роб Ван Дер Сэндт

    Прогрессивный: несовершенный парадокс
    Алессандро Цукки

    Просодический фокус

    leptifier. Sauerland + Andreea Nicolae

    «Вопросы и вопросительные предложения, полнота и количественная изменчивость»
    Paul Hagstrom

    Представление интенсиональности
    Thomas Ede Zimmermann

    Rhetorical Relations
    «Katja Jasinskaja & Elena Karagjosova»

    Semantic Change
    Dirk Geeraerts

    Semantic Parameters and Universals
    Sigrid Beck

    Semantics of English intonation: A leopard? Леопард!
    Хьюберт Тракенбродт

    Семантика против прагматики
    Даниэль Гуцманн

    Последовательность времени
    Yael Sharvit

    Spatial prepositions and locatives in formal semantics
    Marcus Kracht

    Speaker’s Reference
    Barbara Abbott

    Strong and Weak Nominals
    Louise McNally

    Systematic Polysemy
    Johannes Dölling

    Temporal Свойства именных фраз
    Джудит Тонхаузер

    Наречия времени и времени
    Даниэль Альтшулер

    The Interpretation of Tense
    «Toshiyuki Ogihara & Kiyomi Kusumoto»

    The Linguistic and Philosophical Status of ‘Impossible Words’
    John Collins

    The Name and Nature of Neg-Raising
    Jon Robert Gajewski

    Параметры косвенной речи
    Регина Эккардт

    Парадокс стороны
    Себастьян Лёбнер

    Идеал
    Атле Гронн и Арним фон Штехов

    Семантика и прагматика аппозитивных
    Филипп Шленкер

    Субъектив
    Josep Quer

    Тема
    SATOSHI TOMIOKA

    Тема
    SATOSHI TOMIOKA

    Тема
    SATOSHI TOMIOKA

    TOOM
    SATOSHI TOMIOKA


  • .