Содержание

руководство для инди-студий — Gamedev на DTF

В статье описаны этапы сбора семантического ядра, составления фундамента всей текстовой ASO оптимизации и продвижения в поиске.

998 просмотров

На данный момент в Google Play более 11,4 млн., а в App Store более 4.4 млн. приложений.

Создавая и публикуя собственное приложение или игру в Google Play или App Store, вы задаетесь вопросом — как и по каким запросам пользователи найдут ваш проект? Как строить свое семантическое ядро для текстового ASO, чтобы приложение было заметно на фоне конкурентов и получало качественный органический трафик?

Чтобы ответить на эти вопросы, разберемся в терминах “ключевое слово” и “семантическое ядро”.

ASO терминология

Ключевые слова (поисковые запросы, ключи, ключевики, keywords) — это слова или фразы, которые включают интент (намерение,потребность) пользователя найти то или иное приложение или игру. Ключевые слова могут состоять из наименований жанров игры, категорий приложений, отдельных их функций или прямого описания.

Например ключ “idle tycoon game” описывает инкрементальную игру в жанре tycoon.

Юзеры набирают ключи в строке поиска, ожидая найти наиболее подходящее их запросу приложение. Соответственно, разработчикам и ASO специалистам необходимо внедрять такие запросы в метаданные на страницах приложений, чтобы повысить поисковую видимость и конверсию.

Семантическое ядро (СЯ) — это все релевантные ключевые слова и фразы, описывающие ваше приложение. СЯ- это фундамент всей текстовой оптимизации и продвижения в поиске. От того насколько релевантны и ценны найденные вами ключевые слова и фразы зависит ваше ранжирование в поиске, а также появление в категориях и похожих (similar apps) в Google Play.

Важно не забывать, что семантическое ядро для Google Play и App Store отличается, так как это два разных не связанных между собой магазина приложений со своими уникальными алгоритмами.

При составлении СЯ необходимо собрать как можно больше ключевых слов, которые потенциально принесут установки вашему проекту. В этой статье мы подробно расскажем, как это сделать.

Этап 1: Исследование

Как правило разработчики инди-студий и ASO специалисты могут быстро описать своё приложение на 15 — 20 слов без труда. А для расширения списка ключей понадобится помощь команды разработки. Вы можете устроить мозговой штурм или пустить в коллективе Google Форму, где каждый причастный к проекту поделится своими ассоциациями.

Обычно полученный список содержит большинство высокочастотных (ВЧ) и среднечастотных (СЧ) запросов, описывающих основные функции, жанр и задачи, которые решает ваше приложение.

Например, если это игра в жанре idle simulator, первыми запросами в списке скорее всего будут: idle simulator, idle simulation, simulator offline, idle simulation game. А если у вас брендовое приложение, список будет состоять из брендовых ключевых слов с общими запросами.

Добавьте их в свое стартовое семантическое ядро и переходите к следующему этапу.

Этап 2: Автоматические подсказки (Keyword Auto-Suggestions)

Воспользуйтесь инструментами ASO-сервисов и ASA для App Store и изучите, что ищут пользователи и что они находят по поисковым запросам. Потому что часто юзеры не вводят запрос целиком, а нажимают на поисковую подсказку, которую предлагает маркет.

На этом этапе введите в поисковую строку релевантные запросы из своего стартового списка и вы получите ключи, которые ранее уже вводили юзеры. Они могут быть похожи на ваши, но с дополнительными словами, если они релевантны вашему приложению — добавьте их в свое семантическое ядро.

Для Google Play обращайте внимание на длинные запросы (long-tail keywords), они низкочастотные (НЧ) и конкуренция по ним низкая, более 60% поискового трафика приходится на long-tail запросы. И на старте вашего приложения long-tail ключи принесут вам первый целевой органический трафик.

При сборе семантики для App Store учитывайте показатель популярности запроса Search Ads Popularity (SAP). Apple маркирует им запросы при настройке рекламных кампаний в Apple Search Ads. И для App Store лучше не использовать и не вносить в ядро низкочастотные запросы, SAP которых меньше 5.

Автоматические сервисы помогут вам увеличить количество ключей в разы.

Популярные ASO-сервисы с функцией автоматических подсказок по бесплатной пробной версии: AppFollow, ASO Desk, Checkaso, ASO Mobile.

Подсказки и запросы мы ищем в мобильном поиске (магазины приложений), а не в web поиске, так как это две абсолютно разных платформы размещения.

Этап 3: Анализ конкурентов

На этом этапе вам необходимо отобрать конкурентов, которые имеют сильные позиции на интересующих вас рынках. Воспользуйтесь вышеуказанными ASO-сервисами, добавьте конкурентов и оцените запросы, которые они используют, проверьте их на релевантность и добавьте в свое семантическое ядро.

Сбор семантического ядра при помощи конкурентов на примере Jumper Cat: Bouncing Kitten

Если же вы не знаете, кто ваш конкурент, введите запрос в строку и посмотрите, кто ранжируется по нему. Если приложения похожи на ваше, используйте этот запрос.

Также обращайте внимание на то, сколько приложений использует выбранный вами ключ. В случае, если ваше приложение пока не популярно, выйти в топ по ВЧ и СЧ запросам будет сложно и поэтому нужно ранжироваться по запросам с низкой конкуренцией. Чем меньше конкурентов на запрос, тем лучше.

Этап 4: Чистка семантического ядра

На этом этапе вам необходимо очистить семантическое ядро от нерелевантных и низкочастотных запросов. Количество символов в метаданных ограничено, а значит включить в них все найденные запросы не получится. Нужно оставить именно те ключи, которые могут дать установки.

Следует оставлять только релевантные запросы, чтобы приложение находили только те юзеры, которым оно нужно. Иначе будут расти удаления, retention будет падать.

Для Google Play удаляйте запросы с ошибкой, по ним вы можете проиндексироваться, но использовать в метаданных их не следует.

Для App Store вы можете оставить запросы с ошибкой, их можно добавить поле ключевых слов и проиндексироваться по ним. Однако такие ключи следует проверять вручную, так как автокоррекция в IOS устройствах автоматически исправляет опечатки и такие ключи могут не дать трафика.

Если в вашем ASO-сервисе в списке с ключевыми фразами есть показатель Popularity и Difficulty, удаляйте слова с низким Popularity и высоким Difficulty. Вырасти в топе по таким ключам новому приложению будет невозможно.

Если вам необходимо собрать запросы для иностранных локализаций, переведите и проработайте СЯ на English. Такой способ даст понимание поведения пользователей и облегчит локализацию поисковых фраз.

Этап 5: Кластеризация семантического ядра

Кластеризация как этап работы с семантикой в ASO оптимизации пришла к нам из SEO, где кластеризация запросов по Топу или семантическим когортам определяет пул запросов на посадочную страницу.

Кластеризация запросов по семантическим группам в ASO позволяет охватить большее количество запросов производных из одного ключа и проиндексировать их.

Выглядит кластеризация следующим образом, вы оцениваете свое семантическое ядро и выделяете отдельные кластеры по термам (подсловам), разбивая поисковые фразы и автоподсказки.

Кластеризация запросов в семантическом ядре на примере Samedi Manor: Idle Simulator

Метод поможет вам быстро отслеживать покрытие метаданных ключевыми фразами и выстроить поэтапно итеративную работу с текстовым ASO:

  • сужать семантику и увеличивать ранжирование по выгодным кластерам из ТОП 5 — ТОП 20;
  • увеличивать охват в рамках узкой семантической когорты;
  • максимизировать установки, двигая ключевые слова из ТОП 50 в ТОП20; из ТОП 20 в ТОП 5 в рамках выбранного кластера.

Выводы

Чтобы собрать семантическое ядро, вам необходимо провести 5 этапов:

  • Добавить все поисковые слова, которые ассоциируются с приложением у вас и вашей команды.
  • Расширить семантическое ядро за счета автоматических подсказок ASO-сервисов и инструментов ASA.
  • Проанализировать конкурентов и найти релевантные вам запросы, по которым они ранжируются.
  • Очистить семантическое ядро от низкоконкурентных и нерелевантных запросов.
  • Провести кластеризацию запросов для дальнейшей итеративной работы.

Учитывайте правила App Store и Google Play, подготовьте текстовые метаданные на основе вашей семантики.

Бонус! Вы можете скопировать Шаблон семантического ядра и распределения ключевых слов под метаданные для App Store и Google Play. В нем уже есть скрипт “Распред”, фильтрующий ключевые слова по кластерам для быстрой итеративной работы.

Работа с ключевыми словами — фундамент текстовой ASO оптимизации приложений. Собирая поэтапно семантическое ядро, вы найдете релевантные и ценные запросы, по которым пользователи найдут ваше приложение. Так вы сделаете ваше приложение более заметным на фоне конкурентов и получите качественный органический трафик.

Козловская Людмила

ASO Specialist /// Black Caviar Games

Подписывайтесь на официальный аккаунт Black Caviar Games на DTF, чтобы не пропустить новые интересные статьи! 😉

Мы также есть в YouTube, VK, Telegram, Яндекс. Дзен и TikTok.

Формирование семантического ядра сайта

Семантическое ядро сайта — набор поисковых запросов, характеризующих деятельность сайта, товары или услуги реализуемые на нем. Это те слова и фразы, по которым сайт потенциально может получать трафик, находясь в зоне видимости пользователя. В статье расскажу о нашем подходе к сбору поисковых фраз для семантического ядра. Вы узнаете, в чем ценность такой работы, зачем она необходима и почему стоит своих денег.

Не все фразы одинаково важны и полезны для успешного развития проекта и не по всем фразам нужно стремиться в топ выдачи. Определить фокус для работы на продвижение можно после сбора семантического ядра проекта — это одна из первых услуг перед началом поискового продвижения. На ее основании составляется план оптимизации сайта.

Работа по формированию ядра состоит из трех крупных блоков: сбора, фильтрации, простановки релевантных посадочных и скоринга. Формирование полного и правильного ядра зависит напрямую от разнообразия источников, используемых для сбора фраз. Одних данных из Яндекс.Вордстата явно недостаточно. 

Мы в своей работе учитываем комбинации из 19 параметров, собираемых по каждой фразе: обрабатываем и анализируем сезонность, конверсионность, трафиковый потенциал поисковых запросов, чтобы в продвигаемый сегмент ушли только те фразы, которые будут полезны для бизнеса.

Для чего собираем семантическое ядро

Определяем приоритетные категории, по которым важно присутствие в топе поисковых систем и формируем вокруг этих категорий семантику, состоящую из поисковых запросов.

  • Семантика необходима для формирования структуры сайта или каталога.

  • При проектировании фильтров для интернет-магазина семантика облегчит поиск товаров в каталоге.

  • С помощью семантического ядра определяем анкор-лист для составления релевантного ссылочного профиля без переспама.

Задача специалиста, приступающего к формированию ядра — собрать его максимально полно: со всей релевантной семантикой проекта, хвостами и разными синонимами, низкочастотными и узконишевыми запросами.

Сбор и скоринг семантики в агентстве развивается вместе с технологиями продвижения. Сейчас он не может занимать менее 12 часов работы специалиста, поскольку на 100% автоматизировать эту задачу нельзя.

Для контроля качества мы используем систему чек-листов проверки семантики, что позволяет на старте проекта иметь полную базу чистых и рабочих фраз. Под рабочими фразами мы подразумеваем оценку трафика по каждому кластеру с оценкой СРО на каждый месяц продвижения.

Собираем семантику по чек-листу из 48 пунктов — он описывает все процессы, которые нужно выполнить для формирования семантики

С чего начинаем сбор ядра

Чтобы лучше понимать с чего начинается работа над семантическим ядром, анализируем поисковый запрос — он состоит из тела, спецификатора и хвоста.

Пластиковые окна — тело, заказать — спецификатор, в барнауле со скидкой — хвост

Перед сбором определяемся с телом запроса для каждой категории сайта. В последующем это тело можно расширить с помощью общедоступных сервисов, вроде «Яндекс.Вордстата» и других профессиональных инструментов — расширение, поиск дополнительных хвостов, иные формулировки запросов семантики проходит в Кей Коллекторе.

Источниками для категорий будут левая и правая колонки

Какие еще источники используем

Парсинг конкурентов. Но важно, чтобы конкуренты были с вами в «одном весе». Если вы продаете картриджи для принтеров не стоит сравнивать себя с маркетплейсом или условным «Эльдорадо». Конкурент должен заниматься примерно тем же и обладать схожим ассортиментом.

В анализе конкурентов идем дальше и вычисляем фрагмент семантики, общий у нескольких конкурирующих с вами сайтов — для нас это маркер, что необходимо проработать этот фрагмент запросов.

Сравнивая семантические ядра конкурентов, анализируем сегменты, не пересекающиеся с нашим

Под процессом сбора подразумеваем не только формирование списка фраз, но и сбор информации по ним. Для этого вычищаем семантику от нулевок, нерелеванта, информационных запросов и дублей. Получаем большую выборку ключей, которые пока никак не проранжированы, в ключах нет дополнительной информации и мы пока не можем определить какие фразы хорошие, а какие нет. Поэтому прогоняем фразы по дополнительным параметрам.

На один и тот же запрос поисковые системы дают разные релевантные страницы — это плохой сигнал, страницы конкурируют по этому запросу. Специалисту тогда придется руками проверять и назначать ту страницу, которую будем оптимизировать. Так, мы избегаем «каннибализации запросов» — когда несколько страниц внутри проекта борются за одну и ту же фразу.

По каким параметрам собираем семантику

Оцениваем семантику по пяти крупным параметрам: популярность, конкурентность, коммерческость, текущие позиции и перспективность. Собираем информацию по всем этим факторам, преобразуем ее и нормируем для дальнейших расчетов.

Развесовка факторов, влияющих на скоринг семантики. Спасибо Дмитрию Иванову за идеи развесовок

В результате скоринга каждая фраза получает итоговый балл и оценку по отдельному фактору. Коэффициент влияния фактора задается экспертом. Помимо указанных факторов в скоринге учитываются ручные выборки.

В зависимости от особенностей проекта мы вручную придаем вес (значимость) отдельным параметрам или целым группам, чтобы наибольший балл получили фразы полезные с точки зрения бизнеса и те, по которым мы скорее получим положительный результат.

Если нам известны приоритеты для определенной товарной категории, все фразы этой категории мы отмечаем в выборке меткой «Приоритет» и даем этой выборке коэффициент влияния. После скоринга вверху окажутся не только эффективные фразы с точки зрения параметров скоринга, но и важные для клиента по потенциалу лучшего СРО.

1. Популярность

Определяем, как часто этот запрос вводится в поиск и его динамику, учитываем два фактора:

Частотность фразы — насколько часто пользователи вводят именно этот запрос. Фразы бывают высокочастотными с показами выше 1000 в месяц, среднечастотными с запросами от 100 до 1000 и низкочастотными, которые ищут реже 100 раз в месяц.

Бывает, клиенты спрашивают, зачем включать в семантику низкочастотные запросы и платить за фразы, которые принесут максимум 1-2 пользователей в месяц. Однако НЧ и СЧ важны — с их помощью мы «подпитываем» высокочастотные запросы

Сезонность фразы — меняется ли динамика спроса в течение года или двух.

Оцениваем тренд спроса за последние 24 месяца. Растущий тренд свидетельствует об интересе пользователей

2. Конкурентность

По фактору конкурентности мы смотрим, как много проектов стремятся отображаться по конкретному поисковому запросу и насколько их страницы оптимизированы под него. Для лучшего понимания конкурентности запроса мы определяем:

  • Количество документов в обеих поисковых системах — сколько страниц (документов) в индексе поисковых системах Яндекса и Гугла по этому запросу. Чем их больше, тем выше конкурентная борьба по одному ключевому слову.

  • Количество главных страниц в выдаче по запросу: чем больше главных страниц в топе, тем сильнее конкуренция идет за место в выдаче — тем труднее будет бороться за место в топе.

  • Оптимизация заголовков, а именно вхождение ключевой фразы в Title страницы. Если вхождения преобладают в топ-выдачи, это свидетельствует о том, что под запрос оптимизируются целая страница.

3. Коммерческость

Запросы бывают информационными, навигационными и коммерческими. Специфика определена интентом пользовательского запроса — что он хочет найти. Для продвижения e-commerce проектов мы исключаем информационные и навигационные запросы.

Информационный запрос

Транзакционный запрос

«рецепт пиццы»

«заказать пиццу»

Для определения коммерческости фразы используем следующие данные:

  • Бюджет на продвижение фразы в системе «Яндекс. Директ» — примерные расходы в контексте на месяц для фразы с показами на выбранной позиции в указанном регионе.

  • Стоимость за клик в «Яндекс.Директе» по данной фразе — примерная стоимость клика в контексте для фразы с показами на выбранной позиции в регионе.

  • Бюджет на продвижение в ссылочных агрегаторах — примерные затраты в месяц для ссылочного продвижения запроса в различных агрегаторах.

Как мы понимаем, следует ли включать запрос в сегмент для продвижения?

Если в выдаче по данному запросу преобладают коммерческие сайты, значит запрос обладает большей коммерческостью. Параметр определяется в процентном соотношении. Для запроса с коммерческостью в 80%, 80% выдачи будет занято e-commerce проектами.

4. Текущие позиции

В группе «Текущие позиции» учитывается наличие фраз проекта в топах выдачи (топ-10, топ-30, за пределами топ-100), а также динамика позиций — есть ли рост у проекта в позициях, или наблюдается стагнация.

Для нас это признак того, как проект развивается. Если есть динамика роста по определенным фразам — значит, следует на них обратить внимание в первую очередь. Если фразы «застыли» далеко за топ-100, то они будут не первым приоритетом.

5. Перспективность

Для этого фактора мы определяем сам факт продвижения проекта по запросу, как скоро и на какую позицию сайт может претендовать в выдаче.

Смотрим по динамике позиций и экспертной оценке. Например, «схожесть с топом» — насколько проект соответствует топу и на какие потенциальные позиции может претендовать. Например, 6 из 10 проектов с их позиций в топ-10 «выпихнуть» невозможно. Значит для нас потенциальных слотов меньше.

Геозависимость и локализация

Геозависимость запроса. Зависит ли выдача от региона запроса? Например, если вы ищете грузчиков, то для вас важно, чтобы эти грузчики находились в одном городе с вами. А если хотите узнать показания к медицинскому препарату, то вам по-большому счету все равно к какому региону будет относиться релевантный запросу сайт.

SEO с детальным сбором и скорингом семантики

Локализация запроса. Параметр характеризующий долю локальных (местных для региона) результатов в выдаче. Если вы собираетесь выйти на рынок с локальным ресурсом, а в выдаче по этим запросам преобладают крупные межрегиональные проекты, то шанс занять хорошие позиции слабый.

Рынок недвижимости — яркий пример геозависмых запросов с высокой степенью коммерциализации

Релевантные страницы в выдаче по запросу. Для определения посадочной, которую мы будем оптимизировать под запрос нам нужно узнать, какую страницу поисковые системы показывают по запросу.

В агентстве мы собираем все перечисленные параметры в сводный документ

Все параметры используются в дальнейшем для анализа и выбора фраз, которые лучше всего включить в сегмент на продвижение.

Мы не ограничиваемся только частотой: определяем популярность, коммерческость, конкурентность и перспективность запросов. Это помогает определить сложность проекта и подготовить почву для дальнейшего продвижения — в частности, сформировать оценку для каждой фразы.

В будущем нам предстоит из выбранных фраз сформировать сегменты для поискового продвижения и рассчитать стоимость каждой фразы в месяц. Как формируются сегменты и из чего складывается стоимость — мы расскажем в следующих материалах.

О журнале Semantic Web (от IOS Press)

Область применения
Открытые конкурсы
Открытые и прозрачные обзоры
Редакционная коллегия


Журнал Semantic Web – Interoperability, Usability, Applicability (опубликован и напечатан IOS Press, ISSN: 1570-0844), короче Semantic Web Journal , объединяет исследователей из различных областей, которые разделяют видение и потребности для более эффективных и значимых способов обмена информацией между агентами и службами в будущем Интернете и в других местах. Таким образом, технологии Semantic Web должны поддерживать плавную интеграцию данных, оперативную композицию и взаимодействие Web-сервисов, а также более интуитивно понятные поисковые системы. Семантика – или значение – информации, однако, не может быть определена без контекста, который делает персонализацию, доверие и происхождение основными темами для исследования семантической паутины. Новые парадигмы поиска, пользовательские интерфейсы и методы визуализации должны высвободить мощь семантической паутины и в то же время скрыть ее сложность от пользователя. Основываясь на этом видении, журнал приветствует вклад, начиная от теоретических и фундаментальных исследований методов и инструментов и заканчивая описанием конкретных онтологий и приложений во всех областях. Мы особенно приветствуем статьи, которые добавляют социальное, пространственное и временное измерение к исследованиям Semantic Web, а также статьи, ориентированные на приложения, использующие формальную семантику.

Журнал является рецензируемым, имеет открытый доступ и публикуется раз в два месяца.

Официальная интернет-версия журнала.

Следите за журналом Semantic Web в Twitter.

Приветствуются предложения по специальным вопросам.

По любым вопросам обращайтесь к главному редактору.

IOS Press является ведущим международным издателем научных книг и журналов во многих областях, включая информатику и коммуникационные науки, а также Semantic Web. Посетите Semantic Web Journal в IOS Press.

Журнал Semantic Web опирается на открытый и прозрачный процесс рецензирования. Представленные рукописи размещаются на сайте журнала и находятся в открытом доступе. В дополнение к запрошенным обзорам, выбранным членами редакционной коллегии, публичные обзоры и комментарии приветствуются любым исследователем и могут быть загружены с помощью веб-сайта журнала. Все рецензии и ответы авторов размещаются на главной странице журнала. Все привлеченные рецензенты и редакторы будут отмечены в окончательной печатной версии. Хотя мы настоятельно рекомендуем рецензентам участвовать в открытом и прозрачном процессе рецензирования, по-прежнему можно отправлять анонимные рецензии. Перед отправкой рукописи или рецензии см. процесс рецензирования и ответы на часто задаваемые вопросы.

Кроме того, журнал Semantic Web является сторонником Open Science Data и требует, чтобы авторы, когда это возможно, предоставляли соответствующие данные и программное обеспечение для оценки и тиражирования. Пожалуйста, смотрите наш соответствующий пост в блоге для более подробной информации. .

  • Индекс научного цитирования (импакт-фактор): 3,105 (IF 2021, опубликовано в июне 2022 г.)
  • SCImago — 18-е место в мире по компьютерным наукам в 2013 г.
  • Цифровая библиотека ACM
  • Каталоги издательских возможностей Cabell
  • DBLP
  • Скопус
Главные редакторы

Контактный адрес электронной почты: contact@semantic-web-journal. сеть

  • Паскаль Хитцлер, Университет штата Канзас, Манхэттен, Канзас, США
  • Кшиштоф Янович, Венский университет, Австрия и Калифорнийский университет, Санта-Барбара, США
Помощник редактора
  • Коган Симидзу, Государственный университет Райта, Дейтон, Огайо, США
Редакция
  • Мехвиш Алам, Télécom Paris, Политехнический институт Парижа, Франция
  • Клаудия д’Амато, Università degli Studi di Bari, Италия
  • Стефано Борго, Consiglio Nazionale delle Ricerche (CNR), Италия
  • Боян Бродарич, Геологическая служба Канады, Канада
  • Филипп Чимиано, Университет Билефельда, Германия
  • Оскар Корчо, Политехнический университет Мадрида, Испания
  • Бернардо Куэнка-Грау, Оксфордский университет, Великобритания
  • Елена Демидова, Боннский университет, Германия
  • Jerome Euzenat, INRIA Гренобль Рона-Альпы, Франция
  • Марк Гахеган, Оклендский университет, Новая Зеландия
  • Альдо Ганджеми, Болонский университет и ISTC-CNR, Рим, Италия
  • Анна Лиза Джентиле, IBM
  • Рафаэль Гонсалвес, Стэнфордский университет, Калифорния, США
  • Дагмар Громанн, Венский университет, Австрия
  • Армин Халлер, Австралийский национальный университет, Австралия
  • Карл Хаммар, Microsoft, США
  • Франк ван Хармелен, Амстердамский университет VU, Нидерланды
  • Айдан Хоган, Чилийский университет, Чили
  • Катя Хосе, Ольборгский университет, Дания
  • Ээро Хювенен, Университет Аалто и Университет Хельсинки, Финляндия
  • Сабрина Кирране, Венский университет экономики и бизнеса (WU Wien), Австрия
  • Agnieszka Lawrynowicz, Познаньский технологический университет, Польша
  • Freddy Lecue, CortAIx Thales, Монреаль, Канада и INRIA, Франция
  • Мария Малешкова, Зигенский университет, Германия
  • Raghava Mutharaju, IIIT-Дели, Индия
  • Аксель Поллерес, Венский университет экономики и бизнеса (WU Wien), Австрия
  • Гуйлинь Ци, Юго-восточный университет, Китай
  • Марта Сабоу, Технический университет Вены (TUWien), Австрия
  • Harald Sack, FIZ Karlsruhe – Институт информационной инфраструктуры им. Лейбница и Технологический институт Карлсруэ, Германия
  • Кристоф Шлидер, Бамбергский университет, Германия
  • Стефан Шлобах, Амстердамский университет VU, Нидерланды
  • Ошани Сеневиратне, Политехнический институт Ренсселера, США
  • Коган Симидзу, Государственный университет Райта, США
  • Таня Тудораче, Стэнфордский университет, США
  • Рубен Верборг, Гентский университет – imec, Бельгия
  • GQ Zhang, Центр медицинских наук Техасского университета в Хьюстоне, США
Помощники редактора
  • Аарон Эберхарт, Университет штата Канзас, Манхэттен, Канзас, США
  • Саназ Саки Норузи, Университет штата Канзас, Манхэттен, Канзас, США
Системный администратор

Контактный адрес электронной почты: sysadmin@semantic-web-journal. сеть

    Что такое семантический поиск? Как это влияет на SEO

    Михал Пеканек

    Маркетолог и автор контента в Ahrefs. Зависимость от SEO, авиации, ароматов, суши и тако.

    Показывает, сколько разных веб-сайтов ссылаются на этот фрагмент контента. Как правило, чем больше веб-сайтов ссылаются на вас, тем выше ваш рейтинг в Google.

    Показывает приблизительный месячный поисковый трафик к этой статье по данным Ahrefs. Фактический поисковый трафик (по данным Google Analytics) обычно в 3-5 раз больше.

    Сколько раз этой статьей поделились в Твиттере.

    Поделитесь этой статьей
    Подпишитесь на еженедельные обновления

    Подписка по электронной почте

    Подпишитесь

    Содержание

      Вы когда-нибудь замечали, что Google может ответить практически на любой вопрос, который вы ему задаете?

      Просто посмотрите на результат этого запроса:

      Несмотря на то, что Йода не упоминается по имени, Google понял, о ком мы говорим, и что мы хотели о нем узнать.

      Это было бы невозможно без семантического поиска.

      В этом посте вы узнаете:

      • Что такое семантический поиск
      • Почему семантический поиск важен
      • Технологии Google, которые играют роль в семантическом поиске
      • Как адаптировать SEO для семантического поиска

      Что такое семантический поиск?

      Семантический поиск — это процесс поиска информации, используемый современными поисковыми системами для получения наиболее релевантных результатов поиска. Он фокусируется на значении поисковых запросов вместо традиционного сопоставления ключевых слов.

      Терминология происходит из области лингвистики, называемой семантикой, которая занимается изучением значения.

      Почему важен семантический поиск?

      Хотя задействовано бесчисленное множество переменных, принципы семантического поиска, зачем он нужен и как он на него влияет, легко понять.

      • Пользователи часто не используют тот же язык, что и желаемый контент
      • Многие поиски непреднамеренно двусмысленны
      • Необходимость понимать лексическую иерархию и отношения сущностей
      • Необходимость отражать личные интересы и тенденции

      Пользователи часто не используют тот же язык, что и желаемый контент

      Что еще хуже, иногда мы даже не знаем, как правильно сформулировать поисковый запрос.

      Допустим, вы услышали незнакомую песню по радио. Вам понравилось, и вы начали гуглить случайные тексты песен, пока, наконец, не нашли.

      Чтобы добавить еще один уровень сложности, сравните то, что вы вводите в Google, с тем, что вы говорите Siri, Alexa или Google Assistant. Ключевые слова теперь становятся диалогами.

      Существует так много способов выразить одну и ту же идею, и поисковым системам приходится учитывать их все. Они должны иметь возможность сопоставлять содержание в своем индексе с вашим поисковым запросом на основе значения обоих.

      Как бы сложно это ни звучало, это только начало.

      Многие поисковые запросы непреднамеренно неоднозначны

      Около 40 % английских слов многозначны — они имеют два или более значений. Возможно, это самая серьезная проблема, которую пытается решить семантический поиск.

      Например, ключевое слово «python» имеет 533 000 поисковых запросов в месяц только в США :

      Если бы я когда-либо искал «python», я, скорее всего, имел в виду язык программирования. Но любой, кто не связан с технологической индустрией, скорее всего, ожидал увидеть настоящую змею или легендарную британскую комедийную труппу.

      Проблема здесь в том, что слова редко имеют определенное значение вне контекста. Помимо многозначных слов, у вас есть бесчисленное множество существительных, которые также могут быть прилагательными, глаголами или и тем, и другим. И мы все еще находимся в сфере буквального значения. Становится еще интереснее, если мы углубимся в предполагаемые значения (вспомните сарказм).

      Контекст — это все в семантике, и он подводит нас к оставшимся двум пунктам.

      Необходимость понимать лексическую иерархию и отношения сущностей

      Давайте посмотрим на следующий поисковый запрос и самый популярный результат поиска:

      Это действительно впечатляет. Вот что Google должен сделать, чтобы понять этот запрос:

      1. Знайте, что «партнер» означает жену/подругу/мужа/парня/супруга.
      2. Поймите, что Оби-Ван появлялся в нескольких фильмах и сериалах, сыгранных разными актерами.
      3. Выполните соединения.
      4. Отображать результаты поиска таким образом, чтобы отразить двусмысленность слова «оби-ван».

      Я даже не могу представить, какие результаты поиска я бы получил, если бы я сделал этот поиск в 2010 году или раньше.

      Теперь давайте вернемся на шаг назад, чтобы объяснить концепции.

      Лексическая иерархия иллюстрирует отношения между словами. Слово партнер является вышестоящим (гипернимом) по отношению к жене, парню, супругу и другим.

      Как упоминалось ранее, наши запросы часто не соответствуют точной формулировке желаемого контента. Крайне важно знать, что «доступный» — это что-то среднее между дешевым, средним и разумным по цене.

      Сущности , в данном примере это персонажи фильмов и сериалов (Оби-Ван), люди с определенной работой (актер) и люди, которые с ними связаны (партнеры). В общем, сущности — это объекты или понятия, которые можно четко идентифицировать — часто это люди, места и вещи.

      И как будто всех языковых хитросплетений недостаточно, надо пойти еще дальше.

      Необходимость отражать личные интересы и тенденции

      Вернемся к примеру с питоном. Если я ищу это, я действительно получаю все результаты, связанные с языком программирования.

      Как бы нам не нравились все способы использования наших личных данных, это, по крайней мере, полезно для поисковых систем. Google использует ограниченные данные вместе с вашей историей поиска, чтобы предоставлять более точные и персонализированные результаты поиска.

      Мы все это знаем. Просто введите любой тип услуги в строку поиска, и вы получите локализованные результаты:

      Но что еще более увлекательно, так это способность Google временно корректировать результаты поиска на основе динамически меняющихся целей поиска.

      Например, коронавирус — не новый термин. Это всегда было названием группы вирусов. Но, как мы все знаем, цель поиска быстро изменилась в начале 2020 года. Люди начали искать информацию об определенном штамме коронавируса (SARS-CoV-2), и поисковую выдачу пришлось соответствующим образом скорректировать.

      Как вы можете видеть в истории позиций SERP для «коронавируса» выше, ни один из текущих пяти лучших результатов поиска не ранжировался до 2020 года.

      Вы видите то же самое в индустрии электронной коммерции во время крупных распродаж, таких как Рождество или Черная пятница. Намерение поиска в это время очень транзакционное, тогда как обычно люди предпочитают видеть сравнения или обзоры.

      Какие технологии Google влияют на работу семантического поиска?

      Google постоянно выпускает обновления алгоритмов и технологий, которые еще больше улучшают его возможности понимания естественного языка и целей поиска.

      Есть четыре важных вехи, которые делают семантический поиск тем, чем он является в 2020 году.0219

      График знаний Google, выпущенный в 2012 году, представляет собой базу знаний сущностей и отношений между ними.

      Вы можете представить, что это выглядит примерно так, но вместо этого с пятью миллиардами сущностей:

      Короче говоря, это технология, которая положила начало и сделала возможным переход от сопоставления ключевых слов к семантическому сопоставлению.

      Существует два основных метода заполнения Knowledge Graph:

      1. Структурированные данные (подробнее об этом позже)
      2. Извлечение объектов из текста

      Во-вторых, поисковая система должна понимать естественный язык. Вот когда в игру вступают три алгоритмических обновления, приведенных ниже.

      Hummingbird

      Еще в 2013 году Google запустил поисковый алгоритм под названием Hummingbird, чтобы выдавать более качественные результаты поиска. Это было особенно полезно для сложных поисковых запросов.

      Hummingbird было первым колоссальным обновлением, которое подчеркивало значение поисковых запросов по отдельным ключевым словам. Это был столь необходимый катализатор для написания тем, а не ключевых слов.

      RankBrain

      Если вы когда-либо встречали фразу «Скрытое семантическое индексирование» или «ключевые слова LSI», забудьте об этом. Google решает проблему, для решения которой была создана LSI, с помощью алгоритма RankBrain.

      И мы уже обсуждали эту проблему ранее. Речь шла о несоответствии языка, используемого в поисковых запросах, желаемому контенту.

      Google RankBrain использует технологии, намного превосходящие LSI. С точки зрения непрофессионала, RankBrain понимает значение даже незнакомых слов и фраз, используя сложные алгоритмы машинного обучения.

      И это очень много, учитывая, что 15% всех поисковых запросов являются новыми.

      Мы можем считать RankBrain обновлением Hummingbird, а не самостоятельным поисковым алгоритмом. Это один из самых сильных сигналов ранжирования, но единственное, что вы можете заранее сделать для его оптимизации, — это удовлетворить поисковое намерение.

      BERT

      Представления двунаправленного кодировщика от преобразователей (BERT) — это новейшее значительное обновление работы семантического поиска. Он затрагивает примерно 10 % всех запросов с конца 2019 года..

      Не волнуйтесь; мне также потребовалось довольно много времени, чтобы даже вспомнить, что означает BERT.

      Все, что вам нужно знать, это то, что BERT улучшает понимание длинных и сложных предложений и запросов. Это решение для работы с двусмысленностью и нюансами, потому что оно стремится лучше понять контекст слов.

      И хотя вы ничего не можете сделать для оптимизации BERT как такового, полезно знать, что это значит и что он делает в двух словах.

      Как адаптировать SEO для семантического поиска

      Я уже дал несколько советов и подсказок на протяжении всей статьи. Теперь давайте по-настоящему действовать.

      1. Нацельтесь на темы, а не на ключевые слова
      2. Оцените намерение поиска
      3. Используйте семантический HTML
      4. Используйте разметку схемы
      5. Создайте свой бренд, чтобы стать объектом сети знаний
      6. Повысьте релевантность с помощью тем, а не ключевых слов
      7. 90.

        В старые времена SEO вы могли занимать высокие позиции, размещая отдельные фрагменты контента по одной и той же теме, но ориентируясь на несколько иные ключевые слова, например:

        • теги открытого графа
        • метатеги открытого графа
        • метатеги og
        • тег открытого графа
        • что такое открытый граф
        • теги открытого графа facebook

        Это уже не так. Теперь Google понимает, что все эти поисковые запросы означают одно и то же, и ранжирует для них в основном одни и те же страницы.

        Помните об этом при создании контента. Целью больше не является ранжирование только по одному ключевому слову, а более глубокое освещение темы, чтобы Google ранжировал вашу страницу по множеству похожих и длинных ключевых слов.

        Например, наша статья о метатегах Open Graph хорошо ранжируется по сотням ключевых слов. Многие из них представляют собой другие способы поиска того же самого, но некоторые из них представляют собой подтемы, такие как «og:title», «og url» и «og:image».

        Мы можем ранжироваться по всем этим ключевым словам, потому что мы написали подробную статью по теме, а не только по одному ключевому слову.

        Глядя на этот отчет, чтобы найти высокопоставленную страницу по теме, вы поймете, о каких подтемах писать. Например, скажем, вы хотели написать пост о выращивании спаржи. Если вы подключите высокорейтинговую страницу «выращивание спаржи» к обозревателю сайта Ahrefs и проверите Органические ключевые слова  отчет, вы видите, что он ранжируется по этим ключевым словам среди других:

        • насколько глубоко сажать спаржу
        • условия выращивания спаржи
        • когда сажать спаржу
        • лучшее место для посадки спаржи
        • как выращивать спаржу
        • как ухаживать за спаржей

        Это все, что вы хотели бы упомянуть, чтобы создать подробный пост, который получит как можно больше органического трафика.

        Небольшое предостережение. Ориентация на конкретную тему не означает, что вы должны охватывать абсолютно все, что связано с этой темой, или слишком углубляться.

        Возьмите эту статью в качестве примера. Я мог бы потратить десятки часов на изучение обработки естественного языка и углубление в технические аспекты семантического поиска. Я этого не сделал, потому что большинству людей это неинтересно.

        Что подводит нас к следующему пункту.

        2. Оценка цели поиска

        Вы по-прежнему можете публиковать контент по определенной теме, которая не соответствует цели поиска.

        Допустим, вы специалист по маркетинговым данным и видите возможность настроить таргетинг на тему «Отчет по поисковой оптимизации». Естественно, вы хотите поделиться всем, что необходимо для создания лучшего SEO-отчета. Итак, вы придумали что-то вроде «Используйте силу запроса, чтобы создать лучший SEO-отчет».

        Это действительно может быть часть контента, которая в конечном итоге приводит к лучшему отчету о поисковой оптимизации. Но большинство людей, которые ищут эту тему, не будут знакомы со многими функциями Google Таблиц. Они просто хотят что-то, что может сделать работу за них:

        Итак, прежде чем вы начнете обрисовывать в общих чертах новый фрагмент контента, посмотрите на страницы с самым высоким рейтингом, чтобы сделать вывод о цели поиска.

        Рекомендуемое чтение:   Намерение пользователя: упускаемый из виду «фактор ранжирования», который следует оптимизировать

        3. Используйте семантический HTML

        Прежде чем мы смогли перейти к семантическому поиску, мы должны были начать переход к семантической сети. Первоначальную концепцию WWW можно было интерпретировать как стандартизированные взаимосвязанные документы без явного смысла. К настоящему времени должно быть ясно, что нам нужен смысл.

        Все начинается с базового HTML.

        Сравните следующие элементы HTML:

        Семантический HTML добавляет смысл в код, чтобы компьютеры могли распознавать блоки навигации, верхние и нижние колонтитулы, таблицы или видео.

        HTML5 предоставляет большинство семантических элементов, которые уже используются в большинстве современных тем CMS. Если у вас нет, обычно есть плагин, который вы можете использовать для их добавления.

        Но семантический HTML по-прежнему весьма ограничен. Хотя он говорит «это таблица, это нижний колонтитул», он не передает смысла фактического содержимого. Вот почему мы используем разметку схемы.

        4. Используйте разметку схемы

        Разметка схемы — это дополнительный способ разметки ваших страниц. Их также называют структурированными данными, которые можно описать как общую семантическую основу для Интернета.

        Словарь Schema.org содержит сотни типов, связанных со свойствами. Вы можете использовать их для разметки своего контента таким образом, чтобы Google мог понять его без сложных алгоритмов.

        Например, Google было бы проще извлечь смысл из структурированного контента, такого как :

         время приготовления: 20 минут.
        калорий: 80
         

        … чем на естественном языке:

         На приготовление блинов уйдет 20 минут.  Еще лучше то, что это низкокалорийные блины — около 80 на порцию.
         

        Поэтому, когда пользователь хочет узнать, сколько времени уходит на приготовление блина или сколько в нем калорий, Google может предоставить эту информацию наилучшим образом.

        Дальнейшее чтение

        • Что такое структурированные данные? И почему вы должны это реализовать?
        • Расширенные описания: что это такое и как их получить?

        5. Создайте свой бренд, чтобы стать сущностью Сети знаний

        Заголовок говорит сам за себя, потому что я уже говорил о сущностях, поэтому я просто укажу вам на нашу статью о том, как попасть в Сеть знаний.

        Среди всех советов по настройке вашего SEO для семантического поиска этот труднее всего воплотить в жизнь. Это долгосрочное следствие построения бренда и применения остальных советов.

        6. Повышение релевантности с помощью ссылок

        Ссылки исторически были одним из первых индикаторов релевантности. Если бы документ А был связан с документом Б, их можно было бы рассматривать как связанные.