Содержание

что это такое – релевантность запросов

Релевантность – что это такое? Она представляет собой параметр, который указывает на соответствие результата выдачи поисковой системы требованиям пользователя, отправившего запрос. Расчет осуществляется алгоритмами поисковых систем и представляет собой отношение количества ключей к общему количеству слов на странице ресурса. Каждая веб-страница получает свой процент вхождений в тексте. Оптимальный вариант – придерживаться золотой середины, ведь небольшое число будет незаметным для поисковиков, а большое может быть расценено как спам (а это грозит наложением фильтра). 

Характеристика

Со стремительным увеличением числа сайтов и активным развитием Интернета вопрос о качестве результатов выдачи особенно актуален. Сегодня поисковые системы используют принцип релевантности запроса. Благодаря анализу сайтов пользователям предоставляют максимально приемлемые варианты. Вначале релевантность страниц строилась на основе плотности ключевых слов, метатегов, частотности запросов в заголовках, способах оформления контента и так далее. С появлением дорвеев, которые соответствуют этим критериям, были внедрены и внешние факторы релевантности.

Формула релевантности запросов

Ниже размещена формула, которая характеризует критерии релевантности. Но она представляет собой лишь условное обоснование эффективности алгоритмов ранжирования, демонстрирующее полную картину критериев релевантности.

Расшифровка значений:

  • R – это релевантность запроса;
  • T – представляет собой уровень текстовой релевантности, который показывает, насколько внутренние критерии отвечают требованиям поисковых систем;
  • L – это уровень ссылочной релевантности, то есть то, насколько тексты входящих ссылок  соответствуют поисковому запросу;
  • PR – представляет собой ранг ресурса, который не зависит от запроса.

Внешние критерии релевантности

Они представлены ссылочной популярностью – степенью цитируемости. Релевантность зависит от количества сайтов, ссылаемых на конкретный ресурс. Чем их больше, тем выше авторитет веб-сайта, тем качественнее его контент.

Поисковые машины имеют личные алгоритмы релевантности, но работают на основе одних и тех же принципов. По факту, это усовершенствованная версия первого алгоритма Google, учитывавшая только число внешних ссылок. ИЦ (индекс цитирования) был разработан в 1999 году, он определял наиболее весомую внешнюю ссылку. В 2001 году у Яндекса появился свой индекс – ВИЦ. Он присваивался каждой веб-странице. Позже, в 2002, общий доступу к нему был ограничен (из-за манипуляций многих вебмастеров с ВИЦ). До недавнего времени был актуален параметр ТИЦ (тематический индекс цитирования). Сегодня же есть возможность просматривать только ИКС (индекс качества сайта). Осенью 2002 года Рамблер создал свой ИЦ, который кроме ссылок определял частоту посещаемости веб-страниц. Узнать ее можно было в счетчике TOP 100.

Внутренние критерии ранжирования

Наиболее весомый критерий – плотность ключей на странице. Поисковые машины могут выделить запрос в тексте. Веб-ресурс релевантный, если запрос пользователя совпал с формой ключевого слова на сайте. Корректность вставки запроса влияет на релевантность, особенно если ключ вставлен в заголовок. Если запрос идентичен заголовку текста, поисковая машина поставит эту веб-страницу на высокую позицию.

Внутренние критерии включают в себя:

  1. Положение запроса на странице, например, в метатегах.
  2. Близость расположения ключей.
  3. Положение запроса в начале страницы. Чем выше размещен ключ, тем больший у него вес.
  4. Синонимы. Чем больше в тексте  словоформ и синонимов ключей, тем лучше (но важно не переусердствовать). Это будет говорить о том, что тематика ресурса соответствует изначально заданной теме.

Из этой статьи вы узнали, что значит релевантность, получили подробную информацию о ее внутренних и внешних критериях, а также поняли, что она повышает видимость ресурсов в поисковых системах.

Что такое релевантность страницы сайта и как ее определить ᐉ Веб-студия Brainlab

Содержание:

  • Что такое релевантность страницы
  • Зачем знать релевантные страницы своего сайта
  • Что влияет на релевантность сайта
    • Внутренние факторы
    • Внешние факторы
    • Поведенческие факторы
  • Как проверить релевантность сайта
    • Вручную
    • Istio
    • Netpeak Checker
    • Majento
    • PR-CY
    • Serpstat
    • Seolib
    • Megaindex
    • Seolik
  • Как оценивают релевантность поисковые системы
  • Как повысить релевантность страницы
    • Проверить, есть ли на сайте релевантные страницы
    • Анализировать релевантность содержимого страниц
    • Выбирать подходящие домены для внешних ссылок
  • Популярные проблемы с релевантностью

Один из важнейших показателей влияющих на результат в поисковой выдачи —  релевантность — согласованность запроса пользователя с информацией на сайте. Чтобы этот показатель рос, нужно следить за контентом ресурса. В этой статье мы расскажем, что такое релевантность и как повысить ее. Этот будет полезно всем у кого есть свой собственный сайт.

Что такое релевантность страницы

И так, релевантность представляет собой показатель соответствия найденной информации с целью поиска. Страница считается релевантной запросу, если в ее содержимом есть ответ на вопрос пользователя (нужная информация или решение).

Поисковые системы обладают неким алгоритмом, который помогает формировать релевантную выдачу каждому пользователю. При этом, чтобы ранжирование было эффективным, необходимо: 

  • точно определить запрос;
  • правильно интерпретировать тематику и содержимое страницы в индексе;
  • выбрать варианты, которые отвечают интернет запросу.

Приведем пример: 

Пользователь вводит в поисковую строку “как пробить скважину своими руками”. В результате выдачи он может увидеть:

  1. Сайт “Построй своими руками” с советами как бурить скважины на даче самостоятельно.
  2. Сайт “Бурим скважины в вашем городе”, где компания предлагает свои услуги касательно бурению.

Первый вариант — релевантный.

Зачем знать релевантные страницы своего сайта

Знать, что такое релевантность и как ее повысить должен знать каждый, кто хочет оптимизировать свой сайт и продвинуть его в топ выдачи. 

Зная список релевантных страниц можно опереть на них и всю дальнейшую оптимизацию и проанализировать, почему именно эти страницы поисковая система выделила как релевантные. 

Что влияет на релевантность сайта

Рассмотрим подробнее какие факторы (внешние, внутренние и поведенческие) влияют на восприятие страниц как релевантных. 

Внутренние факторы

Сюда можно отнести:

  • Частоту употребление ключевых слов/словосочетаний. При этом важно соблюдать баланс, ведь слишком большое их количество приведет к тому, что сайт заподозрят в заспамленности. 
  • Наличие слов сопутствующих ключевому запросу и синонимов.
  • Расположение ключевиков. Специалисты отмечают, что они должны размещаться ближе к началу текста.
  • Наличие перелинковки — ссылки на другие разделы сайта.
  • Правильное количество символов на странице.
  • Слова связанные с запросом в заголовках, подзаголовках и мета-тегах.

Внешние факторы

Под внешними предполагают: 

  • количество сайтов, который ссылаются на ваш ресурс;
  • качество ссылочной массы: релевантны ли ссылки тематике вашего сайта;
  • наличие ключей в анкорах (ссылки, которые ведут на ваш сайт).

Поведенческие факторы

В данном случае речь идет о поведении пользователя, который пришел из поисковой системы, на сайт: как долго он находится на сайте, сколько он страниц просмотрел и пр.

Как проверить релевантность сайта

Релевантность можно проверить и существует несколько методов, как это можно сделать. Рассмотрим немного подробнее. 

Вручную

Простой способ анализа сайта по ключевым словам. Суть метода заключается в следующем: составить список ключевых слов, которому должна соответствовать конкретная страница/сайт. Вводите их в поиск и смотрите, есть ли ваш ресурс в поисковой выдаче. 

Метод рабочий, но требует много времени. Конечно, куда проще использовать специальные сервисы (платные или нет).

Istio

Это бесплатный сервис, где можно проверить ключевые слова. Istio — отличный помощник, который предназначен для авторов и тех, кто заказывает статьи. Он также позволяет оценить, как то или иное слово соответствует содержимому текста и то насколько верно отображает тематику сайта конкретный текст. 

Netpeak Checker

Отличный инструмент для качественного SEO-анализа. В левом блоке сервиса нужно ввести список запросов (каждый с новой строки) именно по ним система покажет видимость интересующего сайта в поисковике. Есть возможность указать стоп слова. Из преимуществ то, что можно выбирать дополнительные настройки: регион, страну, язык, временной диапазон поиска и пр.

Majento

Несложная онлайн-система для проверки позиций в поисковых системах. Здесь также можно провести анализ контента определенной станицы сайта на предмет ее релевантности одному из поисковых запросов. Работать с Majento просто: необходимо ввести URL и запрос. 

PR-CY

Удобный портал, где можно провести грамотную аналитику сайта. Здесь есть блог и лента новостей. Сервис качественно анализирует не отдельные страницы, а сайт в целом. 

Пользователь может проанализировать:

  • трафик;
  • контент;
  • юзабилити;
  • внутренние страницы и пр.

Весь основной инструментарий доступен только по платной подписке, но релевантности можно определить и в бесплатной таблице ключевых слов: если в таблице есть слова, которые вы закладывали, то сайт релевантный. Все просто. 

Serpstat

Эта платформа одна из популярнейших, где можно провести анализ как сайта, так и отдельной страницы. Пользоваться этим ресурсом не так просто, как в выше описанных, но при этом результаты будут 100% точными, ведь здесь есть возможность задать необходимые параметры.

Seolib

Неплохой сервис для аналитики, но чтобы определить релевантность страницы, необходимо будет заплатить. Но уже после регистрации разработчик начисляет пользователю бонусы. Как и в Serpstat здесь есть тоже достаточно количество интересных настроек и параметров. Но для начала, нужно создать проект.

Megaindex

Чтобы получить доступ к инструментам для оптимизации и анализа сайта (а здесь их 39), нужно пройти регистрацию. Для определения релевантности необходимо открыть приложение “Видимость сайта”. Пользователю доступна информация о таких показателях: 

  • эффективные показы;
  • оценочный трафик;
  • количество поисковых запросов.

Доступно и сравнение с конкурентами.

Seolik

Данный сервис заточен под поисковую систему Яндекс. Очевидно, что и полезен он тем, кто ориентирован на нее. Здесь пользователю доступны такие инструменты:

  • позиция в Яндекс;
  • SЕО-аудит;
  • проверка посещаемости сайта. 

Суть проверки проста: ввести в нужную строку адрес сайта/страницы, подтвердить, что вы не бот и ждать результат. Плюс в том, что регистрация не требуется.  

Как оценивают релевантность поисковые системы

Раньше, владельцы сайтов, просто “напихивали” максимальное количество ключей на одну страницу, чтобы поисковики сочли ее релевантной. Да, такая схема работала. И все мы помним, большое количество ресурсов с бесполезным и нечитабельным контентом. 

Теперь же поисковые системы используют сложные алгоритмы, которые определяют релевантность. Правда, что это за алгоритм, никто не знает, но то, что на него влияют факторы, которые мы описали выше (внутренние, внешние и поведенческие) —  это факт.

Теперь рассмотрим схему ранжирования релевантных страниц: 

  • юзер вводит в браузер поисковый запрос;
  • поисковая система переформировывает запрос и отправляет в индексные базы страница и сайтов;
  • страницы, которые были найдены роботом, считаются релевантными;
  • далее робот расставляет страницы по порядку убывания от более релевантных к менее;
  • именно этот список мы и видим в поисковой выдаче

Поисковые системы сортируют релевантные страницы внутри сайта, а потом они ранжируются с разных источников.  

Как повысить релевантность страницы

Если этот показатель есть и он важен, то значит есть и методы того, как его повысить. Ниже рассмотрим действенные способы, которые уже проверены практикой специалистов.

Проверить, есть ли на сайте релевантные страницы

Сделать это очень просто. 

  1. Зайдите нв Google или Яндекс.
  2. В поисковой строке впишите запрос и site: +домен вашего сайта.
  3. Изучите результат и проанализируйте его.
  4. Проведите работу над улучшением оптимизации.

Анализировать релевантность содержимого страниц

При анализе рекомендуется обратить внимание на следующие элементы:

  • Ключевые слова в заголовках (h2, h3, h4 и пр.). Именно они помогают поисковым системам верно интерпретировать информацию на странице, так как заголовки имеют больший приоритет, нежели сам текст.
  • Ключевые запросы в Title, Description, желательно в начале текста, так как они могут формировать сниппет, а там количество текста ограничено.
  • Наличие ключевика в URL.
  • ALT картинки должен содержать в себе ключевой запрос.
  • В основном тексте должен быть ключ в прямом вхождении.
  • Расположение ключевого слова/запроса в начале текста.
  • Плотность ключевых слов. Здесь важно не превратить контент в спам. SEO-спецалисты утверждают, что оптимальный показатель 3-7%.

Выбирать подходящие домены для внешних ссылок

Внешние ссылки — отличный способ продвижения сайта, но только в том случае, если бэклинки помогут поисковикам определять сайт как релевантный. Для этого нужно просто правильно выбрать ресурс для размещения ссылок. 

Перед размещением внешней ссылки оцените качество страницы и домена. Очевидно, что большей пользы принесут ссылки с тематических и надежных ресурсов. Но многие, пытаясь, сэкономить игнорируют эту рекомендацию, что влияет на продвижение в целом. 

Популярные проблемы с релевантностью

Самая частая ошибка — дубли страниц. Из-за нее поисковик часто меняет релевантную страницу. Исправить это можно следующим образом: настройте rel= «canonical» со страницы-дубля на продвигаемую страницу. 

Если ваш интернет-магазин никак не попадет в топ-10 поисковых систем, то стоит проверить наличие в контенте информационных запросов на коммерческих страницах и убрать их.

В целом, повысить релевантность можно, главное правильно проработать контент. Он должен решить проблемы пользователей. Обязательно включите ключевые запросы в мета-теги, добавьте цепляющее описание. Лучшим местом, где можно охватить различные запросы — блог. Он актуален на любом сайте.

Что такое «релевантный» результат поиска?

Пять лет назад я написал статью «Что такое релевантность поиска?». В то время мне приходилось кричать, чтобы убедить людей хотя бы заметить, точны результаты поиска или нет. В проектах разработки приложений OSC я часто резко поднимал руку, пытаясь заставить кого-либо серьезно отнестись к мысли, что «посмотрите, эти результаты поиска явно не имеют ничего общего с этим запросом!!»

Теперь я чувствую, что битва за осведомленность выиграна. После еще многих лет моего личного опыта я хочу взглянуть более вдумчиво, чем моя предыдущая статья. Давайте углубимся в то, что мы имеем в виду. Что такое релевантность на самом деле? Что мы имеем в виду, когда говорим, что тот или иной результат релевантен или нерелевантен?

Два человека входят в строку поиска

Удивительно, как два человека могут ответить на простой запрос, сказать «Рокки» в поиске фильма, посмотреть документ, сказать «Шоу ужасов Рокки» и спорить о релевантности фильма или неуместность. Недавно я попросил аудиторию Meetup из примерно 50 человек оценить релевантность «Шоу ужасов Рокки Хоррора» для «Рокки» от 1 до 4. Я получил на удивление разные результаты, как показано на графике ниже:

Если покопаться в том, почему это так, то найдутся разные объяснения и обоснования:

  • Рокки упоминается в заголовке, возможно, пользователь еще не ввел свой полный запрос? Оба начинаются со слова «рокки»…
  • Конечно, это не так актуально, как фильмы «Рокки», но это все же один из немногих фильмов, в названии которых упоминается термин «Рокки», так что это как минимум «2 или 3»!
  • Пользователь явно хочет фильм «Рокки», здесь есть небольшая двусмысленность, поэтому покажите фильмы «Рокки», хоррор Рокки явно не имеет значения
  • Как ни странно, когда вы используете «Рокки» (заглавная буква «Р») и «Рокки» (строчная буква «р»), у вас возникает разное восприятие, при этом первая буква с заглавной буквы, кажется, означает имя собственное

Для меня (человека, сформулировавшего запрос) «Шоу ужасов Рокки Хоррора» явно не имело значения. Я знал, что имел в виду фильмы Рокки. Поэтому я был откровенно удивлен, увидев такое широкое распределение по тому, что я считал «очевидным» запросом.

Я только что попросил аудиторию дать суждение по запросу и документу, посредством чего присваивается оценка, указывающая на актуальность этого документа для запроса. Мы можем создать список оценок , если мы накопим много оценок для многих пар документов запроса, таких как оценка:

  • «Рокки III» для q=Рокки как 4 (очень актуально))
  • «Счастливый Гилмор» для q=Rocky as a 1 (очень неуместно)
  • «Беги, Лола, беги» для q=фильмов в Берлине 3 (умеренно актуально)

И так далее… И, как многие читатели могут знать, имея достаточное количество этих данных, вы можете дать рейтингу поискового решения его общую релевантность с помощью таких показателей, как nDCG и ERR

Лучший метод для оценки релевантности результатов поиска?

Суждения, собранные оценщиками, известны как заключения экспертов . Если у нас есть запрос, мы можем позвать реальных живых людей, чтобы просмотреть полный результат поиска и спросить их: «Насколько это актуально?». После полного рассмотрения каждый эксперт-рейтер присваивает оценку (например, 1-4 выше) элементу запроса.

Как вы могли догадаться, на это нужно много времени. Многие поисковые приложения интерпретируют поведение пользователя на сайте (нажатие на результаты поиска, просмотр фильмов, покупка продуктов и т. д.) как неявную оценку документа в этом запросе. Мы назовем их

неявные суждения . Если кажется, что пользователи часто смотрят «Шоу ужасов Рокки Хоррора» после ввода запроса «роки», мы можем решить дать ему оценку 3. Эта неявная оценка основана на наших собственных предположениях о том, как пользователи ведут себя, когда они касаются предмета. актуально/неактуально.

Это возвращает нас к центральному вопросу этой статьи — что такое релевантный результат? Какой элемент следует вернуть наверх? Должны ли мы доверять хорошо обдуманным мнениям живых людей, тщательно обдумывая, является ли предмет актуальным? Должны ли мы доверять нашим несовершенным измерениям поведения реальных пользователей?

Как вы могли догадаться, у обоих есть свои недостатки.

Эту группу экспертов (иногда даже не представляющих пользователей) на самом деле не заставляют решать реальные проблемы. Даже если тщательно все обдумать и набрать из числа пользователей, смогут ли они действительно поставить себя на место живого пользователя со всеми их тонкими соображениями? С проблемами, для которых пользователи пытаются использовать приложение? Сидеть перед запросом «Нотр-Дам» — это не то же самое, что измученный старшеклассник, изучающий в качестве домашнего задания последний пожар, поскольку он лихорадочно ищет хорошие цитаты для своей статьи. Этому студенту может понадобиться краткий обзор, а не подробный отчет. Тонкость, которую мы могли бы упустить, если бы не смотрели на реальное поведение пользователей.

Неявные суждения сами по себе являются несовершенными моделями. Часто предполагается, что клик является сигналом релевантности. Это? Щелчки часто случаются для дальнейшего изучения элемента, но не для окончательного решения, что элемент релевантен. Конверсия — еще один показатель релевантности, но чем глубже вы продвигаетесь по воронке, тем меньше данных вы можете собрать. Без конверсии вы делаете еще более сложные предположения (читали ли они статью? Остаются ли они на странице какое-то время?). Еще более проблематично то, что пользователи взаимодействуют только с тем, что им представлено, особенно с теми элементами, которые представлены выше в списке поиска. Ваш интерфейс поиска может иметь данные о взаимодействии только с 5 результатами для запроса — что, если соответствующий элемент спрятан на странице 2, и никто не нажимает на него?

Конечно, существует множество способов решения этих проблем, и у каждой поисковой группы есть свои хитрости. Я бы порекомендовал Haystack Keynote Макса Ирвина, если вам интересно узнать об этих трюках. Но я хочу глубже погрузиться в то, что на самом деле означает это понятие «релевантности».

За чем мы гонимся в этих мерах?

В поиске вы можете услышать об этом понятии потребности в информации . Идея состоит в том, что пользователь приходит на поиск с осознанной и неосознанной спецификацией того, что он хочет. Запросы, которые они вводят, являются несовершенной формулировкой этой потребности в информации.

Чтобы понять, чего пользователи действительно хотят в глубине души, вот список классов информационных потребностей:

  • Информационная
    Битва при Ватерлоо?»)
  • Сравнение/сопоставление : Некоторым пользователям необходимо сравнить/сопоставить варианты (например, покупка обуви или сравнение вакансий, на которые нужно подать заявку)
  • Исследование : Пользователи, собирающие набор элементов для решения и углубления своего понимания сложной темы, вопроса или проблемы (собирают статьи для написания школьного отчета по теме)
  • Просмотр : некоторые пользователи просто хотят пассивно просматривать или делать покупки в витринах (какие стратегические игры есть в магазине видеоигр Steam сегодня)
  • Known-Item : некоторые пользователи хотят искать элемент по имени (например, поиск по имени или SKU или имени в списке контактов вашего телефона)

Если задуматься об этих вариантах использования, пользователи не всегда точно понимают, чего они хотят. Пользователи получают представление о том, что они хотят, когда они ищут. Вы начинаете с изучения Гражданской войны в США, не зная, о чем будете писать исследовательскую работу. Затем вы можете увидеть результаты, лучше понять, чего вы хотите, и глубже сосредоточиться на конкретном аспекте какой-то конкретной битвы, близкой вашим интересам или проблеме, которую вам нужно решить. Подумайте также о покупках: часто вы начинаете с несовершенной потребности, такой как сумка для ноутбука, только чтобы лучше понять, что вам действительно нужен «прочный большой рюкзак для ноутбука, подходящий для ночлега».

Дело не только в том, что пользователи не осознают, чего они хотят, они учатся в процессе поиска. Уточняя запросы, наблюдая, что возвращается, и соблазняясь вариантами:

Пользователи поиска довольно часто находятся «в процессе». Если бы пользователи точно знали, чего они хотят, это часто было бы просто поиском в базе данных по идентификатору или превратилось бы в чистую проблему с ответом на вопрос. Они также не являются полностью пассивными, что относится к сфере рекомендательных систем. Они находятся в спектре, который не является ни стопроцентно пассивным, ни стопроцентно знающим, чего именно они хотят, как показано на диаграмме ниже:

Актуальность заключается в переадресации процесса

На самом деле «процесс» этого пользователя может длиться месяцами. Текущая проблема со здоровьем может потребовать обширных поисков в течение длительного периода времени. Поиск дорогого продукта требует принятия большого количества решений и исследований. По этой причине я предпочитаю сосредоточиться на том, что продвигает в этом процессе или путешествии, на котором они находятся.

На диаграмме выше я показываю спектр вариантов использования поиска в зависимости от того, насколько пользователи осведомлены и привержены тому, что они хотят. Пользователи справа близки к тому, чтобы точно знать, чего они хотят. Пользователи слева просматривают / изучают какое-то свое любопытство, едва в шаге от проблемы системы рекомендаций.

В поиске мы помогаем пользователям в этом процессе. Мы надеемся, что пассивные браузеры будут в восторге от того, что они увидят, и захотят предпринять дальнейшие шаги в новом направлении, приблизившись к действиям, ответу на их вопрос или решению их проблемы. Точнее, они начинают с несовершенного понятия и постепенно приближаются к пониманию точного вопроса, который хотят задать, предмета, который хотят купить, вида работы, на которую хотят претендовать, или статей, которые хотят собрать.

Релевантность заключается в том, чтобы решить, следует ли

глагол элемент

Во многих контекстах важно также то, что пользователи собираются «делать» с элементом. Многие поисковые системы построены с учетом явного действия. Электронная коммерция — это покупка вещей, поиск работы и так далее. Подобно объекту предложения, поисковый запрос также может быть переформулирован как «Я хочу купить __ » или «Я хочу подать заявку на __ _ работу», где пробел заполняется поисковым запросом. Пробел может быть «синие туфли» или «инженер-программист» соответственно. Знание того, хочу ли я «купить» товар, означает, что мое решение о релевантности будет продиктовано факторами, которые приведут меня к принятию правильного решения о покупке. Amazon, например, предоставляет нам много информации, которая помогает нам решить, стоит ли покупать товар, как показано на снимке экрана ниже, показывающем результаты поиска по запросу «синие туфли»:

Не все поисковые системы имеют очень четкое действие. Но для тех, кто это делает, этот глагол явно является частью разговора о релевантности. Поисковые пользователи в правой половине процесса выше более привержены. У них есть четкое понимание того, что они хотят сделать. Даже если они не полностью осознают все, чего хотят, у них есть миссия. В конечном итоге они предпримут последнее действие или будут недовольны тем, что не могут найти предмет, который хотят (глагол).

Однако дело обстоит так и в том, что менее заинтересованные пользователи могут не иметь четкого действия, которое они хотели бы предпринять, или которое мы могли бы легко измерить. Даже в более транзакционных системах, таких как электронная коммерция или поиск работы, пользователи могут начать просмотр. Для этих пользователей, просматривающих сайт, в крайней левой части приведенного выше спектра «глагол» может измениться на что-то менее обязательное. Что-то вроде «Я хочу добавить в закладки около __ заданий».

Слово предупреждения для поисковых команд, которые просто хотят оптимизировать конверсии. Поддержка уклончивой части спектра действительно важна. Если ваша поисковая система станет ресурсом для более пассивных браузеров, она также может стать их системой для покупки продуктов, когда они узнают, чего хотят. Amazon — это ресурс как для пассивного исследования продуктов, так и для их покупки. Это одна из причин, по которой в Best Buy вы будете смотреть на Amazon. Не только для покупки, но и для глубины информации о продукте и обзоров.

Дело не только в релевантности, дело в противопоставлении вариантов, которые подталкивают к принятию решений

Если наибольшая значимость заключается в том, чтобы быть в середине процесса, то продвижение по процессу заключается в принятии решений и оценке вариантов. Это также диктует, что мы считаем «актуальным». Различные варианты, которые контрастируют друг с другом, помогают пользователям принимать решения о следующих шагах, продвигаться по процессу и приближаться к тому, чего они хотят.

Например, пассивные/просматривающие поиск работы лица хотели бы знать варианты на очень высоком уровне. Они хотят видеть, что для работы инженера-программиста в их области основными темами являются рабочие места .Net и Python. И что большинство рабочих мест находится в центре города. Ответом на эти вопросы может быть не только поиск, но и многие другие элементы аналитики/обнаружения, которые помогают пользователям понять ситуацию и решить, следует ли предпринимать дальнейшие шаги.

Когда человек, ищущий работу, становится более приверженным определенному типу работы, он все равно хочет сопоставить различные детали. Они знают, что им нужна работа «Java-программирование». Они видят одну работу без поездок на работу; другой, который, кажется, платит больше, но требует долгой поездки. Оба актуальны. Однако выделение их ключевых различий более полезно для пользователя, принимающего решение, чем их сходство.

В этих ситуациях, а также в других поисковых системах, таких как исследования, электронная коммерция и многие другие, мы представляем пользователям контрастных вариантов на выбор, которые должны быть одновременно релевантными, но важными отличиями. Задача пользовательского интерфейса поиска состоит в том, чтобы как можно лучше выделить эти различия. Поисковая система, которая показывает пять одинаковых вакансий Java-программиста в центре города, не поможет вам почувствовать, что вы приняли правильное решение.

Мы не будем считать эти результаты релевантными, если они не будут полезны в целом . Они не будут ощущаться релевантными, если они недостаточно отличаются друг от друга, чтобы дать хороший обзор всех параметров, охватываемых предоставленными явными ключевыми словами. Если поиск касается следующего шага пользователя в процессе, и я не могу понять наиболее важные следующие шаги, которые я мог бы предпринять, значит, поиск не достиг своей цели.

Здесь классическая релевантность не работает, и здесь полезно взглянуть на другие системы оценки. Не только релевантность отдельных результатов, но и эффективность самой страницы результатов поиска, помогающая пользователям принимать дополнительные решения. Это дает более широкую точку зрения, помогая ответить на следующие вопросы:

  • Отображаются ли результаты таким образом, чтобы подчеркивались их качества, важные для пользователя (т.е. воспринимаемая релевантность?)
  • Получу ли я хорошее представление о различных параметрах/путях следования для этого ключевого слова?

Речь идет не только о размещении страницы результатов поиска «четверок» перед пользователем, речь идет о лучших «четверках», которые обеспечивают хорошие развилки на дороге. Такая «вилка» может означать новые темы для изучения, варианты продуктов для рассмотрения или дополнительные факторы при покупке дома или подаче заявки на работу.

Итак, наконец, что такое «релевантные» результаты поиска?

Я думаю, что когда вы соберете все это вместе, вы сможете получить представление о том, что для меня является «релевантным» результатом на данном этапе моей карьеры, после слишком большого количества битв за релевантность. полдела. Это точно так же, как релевантная страница, которая обслуживает пользователя, помогая ему узнать то, чего он не знает об опциях. Варианты, которые они могут в конечном итоге захотеть (глагол) — купить, подать заявку и т. Д. Помогая им с их собственным развивающимся определением «релевантности».

Будут ключевые слова, которые требуют дополнительной обработки/измерения/оптимизации при просмотре. Часто это головные запросы типа «рубашка» на сайте одежды. «Релевантным» может быть широкий спектр опций в этой категории, почти кураторская страница только для этой темы. Когда вы видите, что пользователи имеют более четкое представление о том, что им нужно «синяя классическая рубашка», пул релевантных возможностей становится меньше, но необходимая информация для принятия решения становится более специфичной для этой области («классическая рубашка»). Полезная страница результатов поиска знает эти параметры и наиболее подходящим образом сопоставляет релевантные элементы..

Вероятно, наиболее важным является изучение и составление карты «путешествия» вашего пользователя в процессе поиска вашего домена от менее активных браузеров до поисковых систем с известными элементами. Каждое поисковое приложение будет иметь разные классы информационных потребностей в этом спектре, которые требуют собственной системы измерения и решений. У каждого из них будет способ продемонстрировать пользователю «следующий шаг», который нужно сделать, будь то конверсия или просто дальнейшее уточнение и повышение осведомленности о вариантах, доступных по их теме.

Извините, это не так просто! У пользователей так много все более сложных требований к поиску. Я уверен, что через несколько лет мои взгляды на этот вопрос будут развиваться дальше. Если вы хотите помочь этой эволюции и показать мне, что я пропустил, свяжитесь со мной.

Справочное руководство по Apache Solr 6.6 Информация.

Релевантность ответа на запрос зависит от контекста, в котором был выполнен запрос. Одно и то же поисковое приложение может использоваться в разных контекстах пользователями с разными потребностями и ожиданиями. Например, поисковая система климатических данных может использоваться университетским исследователем, изучающим долгосрочные климатические тенденции, фермером, заинтересованным в расчете вероятной даты последних весенних заморозков, инженером-строителем, интересующимся характером осадков и частотой наводнений. , и студент колледжа, планирующий отпуск в регионе и размышляющий, что взять с собой. Поскольку мотивы этих пользователей различаются, релевантность любого конкретного ответа на запрос также будет различаться.

Насколько полными должны быть ответы на запросы? Как и релевантность в целом, ответ на этот вопрос зависит от контекста поиска. Стоимость , а не поиска конкретного документа в ответ на запрос высока в некоторых контекстах, например, при юридическом поиске в электронном виде в ответ на повестку в суд, и довольно низка в других, например, при поиске рецепта торта на веб-сайте. веб-сайт с десятками или сотнями рецептов тортов. При настройке Solr следует сопоставлять полноту с другими факторами, такими как своевременность и простота использования.

Примеры электронного обнаружения и рецепта демонстрируют важность двух концепций, связанных с релевантностью:

Возвращаясь к приведенным выше примерам, важно, чтобы приложение поиска электронного обнаружения имело 100% отзыв, возвращая все документы, которые имеют отношение к запросу. повестка в суд Однако гораздо менее важно, чтобы приложение с рецептами обеспечивало такую ​​степень точности. В некоторых случаях возврат слишком большого количества результатов в случайных контекстах может ошеломить пользователей. В некоторых случаях лучшим подходом может быть возврат меньшего количества результатов, которые имеют более высокую вероятность релевантности.

Используя концепции точности и полноты, можно количественно определить релевантность для пользователей и запросов для коллекции документов. Идеальная система будет иметь 100% точность и 100% отзыв для каждого пользователя и каждого запроса. Другими словами, он извлечет все соответствующие документы и ничего больше. С практической точки зрения, говоря о точности и полноте в реальных системах, обычно сосредотачиваются на точности и полноте при определенном количестве результатов, наиболее распространенными (и полезными) являются десять результатов.

Благодаря фасетированию, фильтрам запросов и другим компонентам поиска приложение Solr может быть гибко настроено, чтобы помочь пользователям точно настроить свои поиски, чтобы возвращать наиболее релевантные результаты для пользователей. То есть Solr можно настроить так, чтобы сбалансировать точность и полноту для удовлетворения потребностей конкретного сообщества пользователей.

Конфигурация приложения Solr должна учитывать:

  • потребности различных пользователей приложения (которые могут включать простоту использования и скорость отклика в дополнение к чисто информационным потребностям)

  • категории, которые имеют значение для этих пользователей в их различных контекстах (например, даты, категории продуктов или регионы)

  • любая присущая документам релевантность (например, может иметь смысл обеспечить, чтобы официальное описание продукта или часто задаваемые вопросы всегда возвращались вверху результатов поиска)

  • независимо от того, имеет ли значение возраст документов (в некоторых контекстах самые последние документы всегда могут быть самыми важными)

Принимая во внимание все эти факторы, на этапах планирования развертывания Solr часто бывает полезно набросать типы ответов, которые, по вашему мнению, должно возвращать приложение поиска для примеров запросов.