Содержание

Интерактивное голосовое редактирование текста с помощью новых речевых технологий от Яндекса / Хабр

Сегодня наше приложение Диктовка для интерактивного написания и редактирования текста голосом появилось в AppStore и Google Play. Его главная задача — продемонстрировать часть новых возможностей комплекса речевых технологий Яндекса. Именно о том, чем интересны и уникальны наши технологии распознавания и синтеза речи, я хочу рассказать в этом посте.

Пара слов, чтобы вы понимали, о чём пойдёт речь. Яндекс уже давно предоставляет бесплатное мобильное API, которое можно использовать, например, для распознавания адресов и голосовых запросов к поиску. За этот год мы смогли довести его качество почти до того же уровня, на котором такие запросы и реплики понимают сами люди. И теперь мы делаем следующий шаг — модель для распознавания свободной речи на любую тему.

Кроме этого, наш синтез речи поддерживает эмоции в голосе. И, насколько нам известно, это пока первый коммерчески доступный синтез речи с такой возможностью.

Обо всём этом, а также о некоторых других возможностях SpeechKit: об активации голосом, автоматической расстановке пунктуационных знаков и распознавании смысловых объектов в тексте — читайте ниже.

Всеядное ASR и качество распознавания

Система распознавания речи в SpeechKit работает с разными видами текста, и последний год мы работали над расширением сферы её применения. Для этого мы создали новую языковую модель, пока самую большую, для распознания коротких текстов на любую тему.

За прошедший год относительная доля ошибочно распознанных слов (Word Error Rate) понизилась на 30%. Например, сегодня SpeechKit правильно распознаёт 95% адресов и географических объектов, вплотную приблизившись к человеку, который понимает 96–98% услышанных слов. Полнота распознавания новой модели для диктовки разных текстов сейчас составляет 82%. С таким уровнем можно создать полноценное решение для конечных пользователей, что мы и хотели показать на примере Диктовки.

Изначально SpeechKit работал только для поисковых запросов: общей тематики и геонавигационных. Хотя уже тогда мы задумывали сделать не просто дополнительный инструмент ввода, «голосовую» клавиатуру, а универсальный интерфейс, который полностью заменит любое взаимодействие с системой живым разговором.

Для этого нужно было научиться распознавать любую речь, тексты на произвольную тему. И мы начали работать над отдельной языковой моделью для этого, которая была в несколько раз крупнее имеющихся геонавигационной и общепоисковой моделей.

Такой размер модели ставил новые условия с точки зрения вычислительных ресурсов. Для каждого фрейма рассматриваются несколько тысяч вариантов распознавания — и чем больше мы успеваем, тем выше качество. А работать система должна в потоке, в режиме реального времени, поэтому все расчёты нужно оптимизировать динамически. Экспериментировали, пробовали, искали подход: ускорения добились, например, сменой библиотеки линейной алгебры.

Но важнее и сложнее всего было собрать достаточно правильных данных, пригодных для обучения потоковой речи. Сейчас для тренировки акустической модели используются около 500 часов вручную транскрибированной речи. Это не такая уж большая база — для сравнения, популярный научный корпус Switchboard, который часто используют в исследовательских целях, содержит примерно 300 часов живых, спонтанных разговоров. Безусловно, увеличение базы способствует росту качества обучаемой модели, но мы делаем упор на правильную подготовку данных и аккуратнее моделируем транскрипции, что позволяет с приемлемым качеством обучаться на относительно небольшой базе.

Пара слов о том, как устроен модуль распознавания (подробно мы об этом рассказывали некоторое время назад). Поток записанной речи нарезается на фреймы по 20 мс, спектр сигнала масштабируется и после ряда преобразований для каждого фрейма получаются MFCC.

Коэффициенты поступают на вход акустической модели, которая вычисляет распределение вероятностей для примерно 4000 сенонов в каждом фрейме.

Сенон — это начало, середина или конец фонемы.

Акустическая модель SpeechKit построена на комбинации скрытых Марковских моделей и глубокой нейронной сети прямого распространения (feedforward DNN). Это уже проверенное решение, и в прошлой статье мы рассказывали, как отказ от гауссовых смесей в пользу DNN дал почти двукратный скачок в качестве.

Затем вступает первая языковая модель: несколько WFST — взвешенных конечных трансдьюсеров — превращают сеноны в контекстно-зависимые фонемы, а из них уже с помощью словаря произношений строятся целые слова, причём для каждого слова получаются сотни гипотез.

Финальная обработка происходит во второй языковой модели. К ней подключена RNN, рекуррентная нейронная сеть, и эта модель ранжирует полученные гипотезы, помогая выбрать самый правдоподобный вариант. Сеть рекуррентного типа особенно эффективна для языковой модели. Определяя контекст каждого слова, она может учитывать влияние не только ближайших слов, как в нейронной сети прямого распространения (скажем, для триграммной модели — это два предшествующих слова), но и дальше отстоящих, как бы «запоминая» их.

Распознавание длинных связных текстов доступно в SpeechKit Cloud и SpeechKit Mobile SDK — для использования новой языковой модели в параметрах запроса нужно выбрать тему «notes».

Голосовая активация

Вторая ключевая составляющая голосового интерфейса — это система активации голосом, которая запускает нужное действие в ответ на ключевую фразу. Без неё не получится в полной мере «развязать руки» пользователю. Для SpeechKit мы разработали свой модуль голосовой активации. Технология очень гибкая — разработчик, использующий библиотеку SpeechKit, может сам выбрать любую ключевую фразу для своего приложения.

В отличие от, например, решения Google — их разработчики используют для распознавания коронной фразы «Окей, Google» глубокую нейронную сеть. DNN даёт высокое качество, но система активации при этом ограничена единственной командой, и для обучения нужно огромное количество данных. Скажем, модель для распознавания всем знакомой фразы обучалась на примере более чем 40 тысяч пользовательских голосов, которые обращались к своим смартфонам с Google Now.

При нашем подходе модуль голосовой активации — это, по сути, система распознавания в миниатюре. Только работает она в более жёстких условиях. Во-первых, распознавание команды должно происходить на самом устройстве, без обращения к серверу. А вычислительные мощности смартфона сильно ограничены. Критично и энергопотребление — если обычный модуль распознавания включается только на определённое время для обработки конкретного запроса, то модуль активации работает постоянно, в режиме ожидания. И при этом не должен сажать батарею.

Впрочем, есть и послабление — для системы активации нужен совсем небольшой словарь, ведь ей достаточно понимать несколько ключевых фраз, а всю остальную речь можно просто игнорировать. Поэтому языковая модель активации гораздо компактнее. Большинство состояний WFST соответствуют определённой части нашей команды — например, «началу четвёртой фонемы». Есть также «мусорные» состояния, описывающие тишину, посторонний шум и всю остальную речь, отличную от ключевой фразы.

Если полноценная модель распознавания в SpeechKit имеет десятки миллионов состояний и занимает до 10 гигабайт, то для голосовой активации она ограничена сотнями состояний и умещается в несколько десятков килобайт.

Поэтому модель для распознавания новой ключевой фразы строится без труда, позволяя быстро масштабировать систему. Есть одно условие — команда должна быть достаточно длинной (желательно — более одного слова) и нечасто встречаться в повседневной речи, чтобы исключить ложные срабатывания. «Пожалуйста» плохо подойдёт для голосовой активации, а «слушай мою команду» — вполне.

Вместе с ограниченной языковой моделью и «лёгкой» акустической, распознавание команд по силам любому смартфону. Остаётся разобраться с энергопотреблением. В систему встроен детектор голосовой активности, который следит за появлением во входящем звуковом потоке человеческого голоса. Остальные звуки игнорируются, поэтому в фоновом режиме энергопотребление модуля активации ограничено только микрофоном.

Синтез речи

Третий основной компонент речевой технологии — это синтез речи (text-to-speech). TTS-решение SpeechKit позволяет озвучить любой текст мужским или женским голосом, да ещё и задав нужную эмоцию. Ни у одного из известных нам голосовых движков на рынке нет такой возможности.

Есть несколько принципиально разных технологий синтеза речи, и в большинстве современных систем используется конкатенативный синтез методом «unit selection». Заранее записанный образец голоса режется на определенные составные элементы (например, контекстно-зависимые фонемы), из которых составляется речевая база. Затем любые нужные слова собираются из отдельных юнитов. Получается правдоподобная имитация человеческого голоса, но воспринимать его тяжело — скачет тембр, возникают неестественные интонации и резкие переходы на стыках отдельных юнитов. Особенно это заметно при озвучивании длинного связного текста. Качество такой системы можно повышать, увеличивая объём речевой базы, но это долгий и кропотливый труд, требующий привлечения профессионального и очень терпеливого диктора.

И полнота базы всегда остаётся узким местом системы.

В SpeechKit мы решили использовать статистический (параметрический) синтез речи на базе скрытых Марковских моделей. Процесс, по сути, аналогичен распознаванию, только происходит в обратном направлении. Исходный текст передаётся в модуль G2P (grapheme-to-phoneme), где преобразуется в последовательность фонем.

Затем они попадают в акустическую модель, которая генерирует векторы, описывающие спектральные характеристики каждой фонемы. Эти числа передаются вокодеру, который и синтезирует звук.

Тембр такого голоса несколько «компьютерный», зато у него естественные и плавные интонации. При этом гладкость речи не зависит от объёма и длины читаемого текста, а голос легко настраивать. Достаточно указать в параметрах запроса один ключ, и модуль синтеза выдаст голос с соответствующей эмоциональной окраской. Разумеется, никакая система unit selection на такое не способна.

Чтобы модель голоса смогла построить алгоритмы, соответствующие различным эмоциям, потребовалось правильным образом обучить её. Поэтому во время записи наша коллега Евгения, чей голос и можно услышать в SpeechKit, произносила свои реплики по очереди нейтральным голосом, радостным и, наоборот, раздражённым. В ходе обучения система выделила и описала параметры и характеристики голоса, соответствующие каждому из этих состояний.

Не все модификации голоса построены на обучении. Например, SpeechKit позволяет также окрасить синтезированный голос параметрами «drunk» и «ill». Наши разработчики пожалели Женю, и ей не пришлось напиваться перед записью или бегать на морозе, чтобы хорошенько простудиться.

Для пьяного голоса специальным образом замедляется речь — каждая фонема звучит примерно в два раза медленнее, что и даёт характерный эффект. А для больного повышается порог озвученности — фактически моделируется то, что происходит с голосовыми связками человека при ларингите. Озвученность разных фонем зависит от того, проходит ли воздух через голосовой тракт человека свободно или же на пути его оказываются вибрирующие голосовые связки. В режиме «болезни» каждая фонема озвучивается с меньшей вероятностью, что и делает голос сиплым, посаженным.

Статистический метод также позволяет быстро расширять систему. В модели unit selection для добавления нового голоса нужно создать отдельную речевую базу. Диктор должен записать много часов речи, при этом безупречно выдерживая одинаковую интонацию. В SpeechKit для создания нового голоса достаточно записать хотя бы два часа речи — примерно 1800 специальных, фонетически-сбалансированных предложений.

Выделение смысловых объектов

Слова, которые произносит человек, важно не только перевести в буквы, но и наполнить смыслом. Четвёртая технология, которая в ограниченном виде доступна в SpeechKit Cloud, не касается напрямую работы с голосом — она начинает работать уже после того, как произнесённые слова распознаны. Но без неё полный стек речевых технологий не сделать — это выделение смысловых объектов в естественной речи, которое на выходе даёт не просто распознанный, а уже размеченный текст.

Сейчас в SpeechKit реализовано выделение дат и времени, ФИО, адресов. В гибридной системе сочетаются контекстно-свободные грамматики, словари ключевых слов и статистические данные поиска и разных сервисов Яндекса, а также алгоритмы машинного обучения. Например, во фразе «поехали на улицу Льва Толстого» слово «улица» помогает системе определить контекст, после чего в базе данных Яндекс.Карт находится соответствующий объект.

В Диктовке мы построили на этой технологии функцию редактирования текста голосом. Подход к выделению сущностей принципиально новый, и упор сделан на простоту конфигурации — чтобы настроить систему, не нужно владеть программированием.

На вход системы подаётся список разных типов объектов и примеры фраз из живой речи, их описывающих. Далее из этих примеров методом Pattern Mining формируются паттерны. В них учитываются начальная форма, корни, морфологические вариации слов. Следующим шагом даются примеры употребления выбранных объектов в разных сочетаниях, которые помогут системе понимать контекст. На основе этих примеров строится скрытая Марковская модель, где наблюдаемыми состояниями становятся выделенные в реплике пользователя объекты, а скрытыми — соответствующие им объекты из предметного поля с уже известным значением.

Например, есть две фразы: «вставить „привет, друг“ в начало» и «вставить из буфера». Система определяет, что в первом случае после «вставить» (действие редактирования) идёт произвольный текст, а во втором — известный ей объект («буфер обмена»), и по-разному реагирует на эти команды. В традиционной системе это потребовало бы написания правил или грамматик вручную, а в новой технологии Яндекса анализ контекста происходит автоматически.

Автопунктуация

Диктуя что-либо, в получившемся тексте ожидаешь увидеть знаки препинания. И появляться они должны автоматически, чтобы не приходилось разговаривать с интерфейсом в телеграфном стиле: «Дорогой друг — запятая — как поживаешь — вопросительный знак». Поэтому дополняет SpeechKit система автоматической расстановки знаков препинания.

Роль пунктуационных знаков в речи играют интонационные паузы. Поэтому изначально мы пытались построить полноценную акустическую и языковую модель для их распознавания. Каждому знаку пунктуации назначили фонему, и с точки зрения системы в распознаваемой речи появлялись новые «слова», полностью состоящие из таких «пунктуационных» фонем — там, где возникали паузы или определённым образом менялась интонация.

Большая сложность возникла с данными для обучения — в большинстве корпусов уже нормализованные тексты, в которых знаки препинания опущены. Также почти нет пунктуации и в текстах поисковых запросов. Мы обратились к «Эху Москвы», которые вручную расшифровывают все свои эфиры, и они разрешили нам использовать свой архив. Быстро выяснилось, что для наших целей эти транскрипции непригодны — они сделаны близко к тексту, но не дословно, а поэтому для машинного обучения не годятся. Следующая попытка была сделана с аудиокнигами, но в их случае, наоборот, качество оказалось слишком высоким. Хорошо поставленные голоса, с выражением декламирующие текст, слишком далеки от реальной жизни, и результаты обучения на таких данных никак не удавалось применить в спонтанной диктовке.

Вторая проблема заключалась в том, что выбранный подход отрицательно сказывался на общем качестве распознавания. Для каждого слова языковая модель рассматривает несколько соседних, чтобы правильно определить контекст, и дополнительные «пунктуационные» слова его неизбежно сужали. Несколько месяцев экспериментов не привели ни к чему.

Начать пришлось с чистого листа — мы решили расставлять знаки препинания уже на этапе пост-обработки. Начали с одного из простейших методов, который, как ни странно, показал в итоге вполне приемлемый результат. Паузы между словами получают одну из меток: пробел, точка, запятая, вопросительный знак, восклицательный знак, двоеточие. Чтобы предсказать, какая метка соответствует конкретной паузе, используется метод условных случайных полей (CRF — conditional random fields). Для определения контекста учитываются три предшествующих и два последующих слова, и эти нехитрые правила позволяют с достаточно высокой точностью расставлять знаки. Но мы продолжаем экспериментировать и с полноценными моделями, которые смогут ещё на этапе распознавания голоса правильно интерпретировать интонации человека с точки зрения пунктуации.

Планы на будущее

Сегодня SpeechKit активно используется для решения «боевых» задач в массовых сервисах для конечных пользователей. Следующая веха — научиться распознавать спонтанную речь в живом потоке, чтобы можно было прямо в реальном времени расшифровать интервью или автоматически конспектировать лекцию, получая на выходе уже размеченный текст, с выделенными тезисами и ключевыми фактами. Это огромная и очень наукоёмкая задача, которую пока не удалось решить никому в мире — а других мы и не любим!

Для развития SpeechKit очень важна обратная связь. Поставьте Яндекс.Диктовку, разговаривайте с ней почаще — чем больше данных мы получаем, тем быстрее растёт качество распознавания в доступной всем вам библиотеке. Не стесняйтесь исправлять ошибки распознавания с помощью кнопки «Корректор» — это помогает разметить данные. И обязательно пишите в форму обратной связи в приложении.

Тотальный диктант — 2022: восемнадцать часов в эфире

5 апреля 2022

Новости

Тотальный диктант — 2022: восемнадцать часов в эфире

В течение всего дня 9 апреля акцию будет сопровождать 18-часовой онлайн-марафон. В этом году трансляции пройдут из Владивостока, Новосибирска, Москвы и столицы Тотального диктанта Ярославля.

Марафон стартует в 7:30 утра по московскому времени и объединит трансляции для всех часовых зон. В программе: лекции филологов, общение с гостями (лингвистами, филологами, друзьями проекта), онлайн-диктант и даже урок удмуртского языка.

Гостями онлайн-марафона станут писатели, филологи, ученые-исследователи, популярные блогеры. Среди них автор идеи проекта «Тотальный диктант» Илья Стахеев, заместитель директора ИРЯ РАН им. В. В. Виноградова Елена Шмелёва, директор Российской государственной библиотеки для молодежи Ирина Михнова, лингвист, видеоблогер Никита Сафронов, известный в интернете как Микитко сын Алексеев.

В рамках лекционной программы публицист, популяризатор гуманитарных наук Павел Сурков поделится исследованием культуры и литературы в России в 1900 году.

 Ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН, ученый «Яндекса» Борис Иомдин расскажет об исследованиях компании, связанных с русским языком. Слушатели узнают о регионализмах, которые используют современные носители языка, а также о названиях населенных пунктов, которые только на первый взгляд выглядят как исконно русские.

 Сотрудник библиотеки им. Ф. И. Васильева (Ижевск, Удмуртия) Виолетта Анисимова и популярный блогер Вера Вандербера в формате кулинарного шоу поговорят на русском об удмуртском и на удмуртском о русском языке: вспомнят удмуртские мемы, регионализмы, сравнят два алфавита и прикоснутся к особенностям быта и суеверий удмуртов.

 Как спасти язык, на котором не говорит уже целое поколение? Нужно, чтобы его начали чаще использовать в интернете. Фильм режиссера Максима Томаша и сценариста Ксении Мчедлидзе о том, как «Яндекс» создавал переводчик с якутского языка, также будет доступен участникам ТД. В нем рассказана история Алексея Иванова — энтузиаста, который пришел в «Яндекс» с идеей сделать онлайн-переводчик. Задача, которую инженеры решали много раз с другими языками, в этот раз оказалась сложнее и интереснее.

В онлайн-марафон войдут четыре трансляции онлайн-диктанта для разных часовых зон, которые начнутся в 8:00, 11:00, 14:00 и 23:00 по московскому времени.

Эфир трансляции начнется в 8:00 (МСК) из Владивостока. На площадке ДВФУ текст прочитает Наталья Милянчук — член Филологического совета акции, кандидат филологических наук, руководитель образовательной программы «Филология (русский язык и литература)» ДВФУ.

В 11:00 (МСК) эстафету трансляций примет Новосибирск — родина проекта. Из НГУ в прямой эфир выйдет Антон Войналович, актер театра «Красный факел».

Третья площадка, с которой будет транслироваться диктовка, будет находиться в столице акции этого года — Ярославле. В 14:00 (МСК) из Волковского театра текст продиктует автор Тотального диктанта — 2022 Марина Степнова. В эфир из Ярославля выйдут и организаторы акции: координатор Тотального диктанта в Ярославле Полина Лебедева и филолог Екатерина Мельникова расскажут, как столица акции готовилась к диктанту и как он прошел в Ярославле.

Заключительную часть текста в 23:00 (МСК) прочитают из московской студии онлайн-марафона. Диктующим станет председатель филологического совета Тотального диктанта, кандидат филологических наук, главный редактор портала «Грамота.ру» Владимир Пахомов.

После каждой трансляции Наталья Милянчук проведет экспресс-разбор пунктуационно и орфографически сложных мест в текстах акции этого года.

«Благодаря онлайн-марафону, объединяющему обсуждения вопросов лингвистики, лекции экспертов и общение со звездными гостями, мы все сможем почувствовать себя на общем празднике тех, кто любит и изучает русский язык. Присоединиться к марафону можно из любой точки мира, а это очень важно в наше непростое время», — прокомментировала директор фонда «Тотальный диктант» Ольга Ребковец.

Во многих городах России проходят очные и онлайн-занятия для подготовки к диктанту. Подтянуть грамотность можно на курсах: «Никогда не пиши “ни когда”», «Мыш кродеться. Курс по истории русской орфографии», «Русская пунктуация: болевые точки… и двоеточия» и первый совместный с IT-компанией МойОфис онлайн-курс по деловой грамотности «Что-то на офисном, или Нормы и правила бизнес-правописания». 

В этом году онлайн-марафон Тотального диктанта проходит при технологическом партнерстве компании «Яндекс». Основная трансляция пройдет на платформе «Яндекс Дзен». Дополнительные трансляции будут вестись в группе «ВКонтакте» и на ютуб-канале Тотального диктанта.

Онлайн-марафон начнется 9 апреля в 7:30 по московскому времени и завершится 10 апреля в 00:30. Зарегистрироваться на онлайн-марафон и выбрать время онлайн-диктанта можно на сайте totaldict. ru. Подробная программа доступна по ссылке.

Идет на YouTube

Здравствуйте! На этой неделе наш главный материал посвящен юридическим проблемам, с которыми столкнулись два крупных YouTube-блогера — широко популярный Юрий Дудь и ранее влиятельный Юрий Хованский. Мы также рассмотрим, как ИТ-гигант Яндекс пытается проникнуть в бизнес онлайн-продуктовых магазинов и почему российские разведчики , как сообщается, пытались отравить одного из ведущих поэтов страны и литературных критиков.

российских звезд YouTube столкнулись с проблемами с законом

После давления на независимые СМИ и сторонников лидера оппозиции Алексея Навального российские власти, похоже, открыли огонь по влиятельным лицам в социальных сетях. Всего за несколько дней на прошлой неделе самой популярной в России звезде YouTube Юрию Дудь было предъявлено обвинение в пропаганде употребления наркотиков, а блогер и комик Юрий Хованский был арестован за «оправдание терроризма».

  • Хованский достиг пика своей популярности на YouTube несколько лет назад, но у него до сих пор 4,4 миллиона подписчиков, а его самый популярный клип — рэп-баттл 2016 года с конкурирующим стримером Дмитрием Лариным — набрал более 40 миллионов просмотров.
  • Арест Хованского во вторник прошел с большой дозой театральности. Полицейские пришли в квартиру блогера, прижали его к полу и стали допрашивать в присутствии камер сопровождения. Получившийся клип получил широкое распространение в прокремлевских социальных сетях, а на следующий день Следственный комитет опубликовал видео, в котором Хованский публично извинился за свои действия — тактика правоохранительных органов, обычная для Северо-Кавказской республики Чечня. Все это казалось фарсом, пока в четверг суд не постановил задержать Хованского на два месяца.
  • Обвинения против Хованского касаются пародийной песни о теракте, который произошел в театре на Дубровке в Москве в 2002 году и унес жизни 244 человек. Песня Хованского была написана несколько лет назад и, как и все его творчество, явно не предназначена для серьезного восприятия. Песня никогда не исполнялась публично, но в начале этого года другой блогер загрузил фрагменты ее исполнения. Если вина Хованского будет доказана, ему грозит до семи лет лишения свободы.
  • Российский YouTube-звезда Юрий Дудь также попал под нарушение закона на прошлой неделе. В отличие от Хованского, Дудь до сих пор пользуется бешеной популярностью и считается одним из лучших интервьюеров России. На своем канале в YouTube Дудь публикует подробные беседы с кем угодно, от стендап-комиков до изгнанного миллиардера Михаила Ходорковского и Навального. У него более 9 миллионов подписчиков, а его видео регулярно набирают более 10 миллионов просмотров. По данным социологической компании «Ромир», Дудь — блогер, пользующийся наибольшим доверием в России. Он открыто поддерживает оппозицию, регулярно появляется на акциях протеста.
  • Теперь Дуду грозит обвинение в «пропаганде наркотиков», что может повлечь за собой штраф до 1,5 млн рублей (20 800 долларов США). Дело стало достоянием общественности в четверг и связано с интервью Дуда с рэпером MORGENSHTERN в прошлом году и блогером Ивангаем в марте. Оба видео набрали более 20 миллионов просмотров на YouTube и включали обсуждение употребления наркотиков. Однако трудно понять, где происходила «реклама», поскольку оба интервью с самого начала сопровождались подписью «Наркотики — зло». Не используйте их!».
  • Дело против Дудь было инициировано Екатериной Мизулиной, членом Общественной палаты и дочерью консервативного депутата Елены Мизулиной, которая разработала печально известный в России закон о запрете «пропаганды гомосексуализма». Мизулина-младшая заявила, что надеется в будущем возбудить против Дудь уголовное дело. Скорее всего, это было бы за склонение других к употреблению наркотиков, и максимальное наказание за это могло бы составить до 15 лет лишения свободы.
Почему мир должен заботиться

Возможно, два дела за неделю против известных ютуберов — это просто совпадение. Но Кремль уже много лет беспокоит влияние блогеров на молодежь. И главный редактор RT Маргарита Симоньян, ведущий сторонник ограничений на YouTube, считает иначе. «Некоторое время система считала, что YouTube недосягаем, и прикасаться к его звездам было небезопасно — как будто миллионы фолловеров, наблюдавших за этими неизвестными уродами, выйдут на улицы. Угадайте, что изменило мнение системы? Это верно. Когда арестовали самую большую звезду YouTube [Алексея Навального] и абсолютно ничего не произошло», — написала Симоньян в своем Telegram-канале.

Российская Амазонка? «Яндекс» ведет переговоры о покупке крупной сети продуктовых магазинов

«Русский Google» может превратиться в «русскую Amazon». На прошлой неделе стало известно, что ИТ-гигант «Яндекс» ведет переговоры о покупке сети премиальных продуктовых магазинов «Азбука Вкуса», которая является символом богатой московской жизни. Именно The Bell впервые сообщила о заигрывании Яндекса с офлайн-ритейлом, что инсайдеры рынка сравнили с покупкой Amazon сети продуктовых магазинов Whole Foods в 2017 году.

  • В сравнении Яндекса и Google есть доля правды. С момента основания Яндекса в 1997 году он зарабатывал большую часть своих денег на рекламе в поисковых системах. Однако уже несколько лет активно инвестирует в другие сферы — в частности, в фудтех и электронную коммерцию. В этом году доходы от рекламы впервые составили менее половины доходов Яндекса.
  • Розничная торговля в настоящее время находится в центре внимания Яндекса, что вызывает сравнение с Amazon. Недавно Яндекс объявил, что хочет войти в тройку крупнейших ритейлеров России.
  • «Азбука Вкуса» — продуктовый магазин премиум-класса в Москве и Подмосковье. Продукция компании дорогая, а платиновая карта «Азбука вкуса» для москвичей — своего рода символ статуса. Компания гордится тем, что продает «европейские» продукты, но эмбарго 2014 года на импорт продуктов питания с Запада и падение зарплат остановили ранее быстрый рост. Сейчас аналитики оценивают «Азбуку Вкуса» в $300 млн (без учета долга).
  • Так зачем же Яндексу сеть элитных продуктовых магазинов? Два года компания экспериментировала с доставкой продуктов и готовой еды. Его сервис «Яндекс.Лавка» уже очень популярен в Москве (за последние три месяца 2020 года он принес около $55 млн выручки) и активно ищет возможности расширения в других крупных городах. Яндекс также хочет экспортировать концепцию Яндекс.Лавки за границу, а аналогичные сервисы планируется открыть в Лондоне и Париже.
  • Очевидна синергия между Азбукой Вкуса и Яндекс.Лавкой. Обе компании работают на премиальном рынке, а «Азбука Вкуса» исторически сильна на рынке готовых блюд (на который активно ориентируется «Яндекс.Лавка»). Кроме того, слияние может снизить затраты на закупки Яндекс.Лавки, поскольку она использует эффект масштаба.
  • «Яндекс пытается определить свое место на рынке: поисковые системы и такси — устоявшиеся бизнесы, а все остальное имеет экспериментальный характер. В том числе продуктовый сегмент, в котором невозможно добиться успеха без детального знания отрасли», — сказал Алексей Кривошапко, аналитик розничной торговли Prosperity Capital Management. «После того, как «Лавка» открыла дверь, теперь «Яндекс» подставляет плечо, покупая нишевого премиум-плеера».
  • Однако помимо интереса к премиальному рынку у «Азбуки Вкуса» и «Яндекса» есть нечто общее: у них есть общий акционер. В прошлом году управляющая компания миллиардера Романа Абрамовича Millhouse Capital приобрела миноритарный пакет акций Яндекса. Абрамович и его партнеры также владеют более чем 40 процентами акций «Азбуки вкуса».
Почему мир должен заботиться

Быстрая доставка еды и продуктов (в течение 15-20 минут после заказа) — следующая большая цель для сектора электронной коммерции. Яндекс был одной из первых крупных компаний, принявших участие в этой революции быстрой доставки, но до того, как она станет реальностью в России, еще далеко.

Сообщается, что

ядовитый отряд ФСБ преследовал известного поэта

Агентство расследований Bellingcat опубликовало в среду большую статью о ранее неизвестной деятельности группы российских разведчиков, отравивших Навального в прошлом году. На этот раз их мишенью стал не политик, а поэт Дмитрий Быков, известный своей критикой властей. Самым удивительным была не попытка отравления (к сожалению, это уже ни для кого не сюрприз), а выбор жертвы.

  • В поездке 2019 года в сибирские города Новосибирск, Екатеринбург и Уфу Быкова сопровождала та же группа сотрудников Федеральной службы безопасности (ФСБ), которая, согласно расследованию Bellingcat, принимала участие в отравлении Навального. Этот «ядовитый отряд» из Второго управления ФСБ (отвечает за борьбу с терроризмом) и Института судебной экспертизы ФСБ. Некоторые из них сопровождали Быкова в предыдущих поездках.
  • Причиной поездки (в которой Быкова сопровождала жена) было участие в акции «Тотальный диктант». Это популярное занятие среди русскоязычных — участники проверяют свою грамотность, записывая под диктовку известных писателей и общественных деятелей (Россия остается очень текстоцентричным обществом). Перед отлетом в Сибирь Быков выступил на радиостанции «Эхо Москвы» и рассказал о том, почему россияне не шутят о Путине («Потому что сегодня на власть смотрят как на что-то чуждое, потустороннее», — сказал Быков).
  • После нескольких дней сопровождения Быкова и его жены отравители улетели обратно в Москву. Первые признаки болезни у Быкова проявились 16 апреля 2019 года, когда он вылетал из Екатеринбурга (остановка после Новосибирска) в Уфу. По данным Bellingcat, Быков ничего не ел в аэропорту, но переоделся перед полетом. У Быкова симптомы, похожие на симптомы Навального, появились примерно в то же время — примерно через 2,5 часа после контакта с якобы отравленной одеждой, — но в более легкой форме. Он был госпитализирован в Уфе, впал в кому и нуждался в аппарате искусственной вентиляции легких.
  • Друзья Быкова сплотились и организовали эвакуационный рейс. Но самолет чуть не повернули обратно «по приказу Минздрава», сообщает Bellingcat. Только шквал срочных звонков доброжелателей смог преодолеть бюрократическое сопротивление, и 18 апреля Быков был наконец переведен в московскую больницу. Через три дня он пришел в сознание.
  • После того, как расследование Bellingcat было опубликовано, Быков сказал, что это было похоже на «получение государственной премии». Он добавил: «Приятно видеть, что моя скромная деятельность стоит таких щедрых затрат. Подумай, сколько билетов они купили. Хотя, я бы предпочел иметь деньги».
  • Тот факт, что отравители выслеживали Быкова более года, вызывает недоумение, причем не только у самого Быкова. Тот же вопрос задавали и лидеры оппозиции. Быков не скрывает своих политических взглядов — выступал на митингах оппозиции в 2011–2012 годах, осуждал аннексию Крыма и поддерживал прошлогодние протесты в Белоруссии, — но он в первую очередь поэт и литературовед. Нет оппозиционной группы, которую можно было бы с полным основанием рассматривать как «последователей» Быкова, и никто не знает, что у него есть какие-то политические амбиции.
  • Быков, пожалуй, наиболее известен своим проектом «Гражданин поэт», над которым он работал с актером Михаилом Ефремовым (который в настоящее время находится в СИЗО после того, как в результате аварии в нетрезвом виде погиб еще один автомобилист). Быков писал едкие стихи протеста для «Гражданина поэта», а Ефремов их читал.
Почему мир должен заботиться

То, что произошло с Быковым, еще раз доказывает, что угадать логику российских спецслужб невозможно. Если кто-то пытается убедить вас в обратном, стоит задаться вопросом, насколько хорошо этот человек действительно понимает, что сегодня происходит в России.

Звонок


Большой этнографический диктант в Татарстане — Реальное время

09:00, 03.11.2021

Почему важны «уроки дружбы и согласия» и какие проблемы может решить международная образовательная кампания

Международная образовательная акция «

Большой этнографический диктант» пройдет в Татарстане, а также по всей России с 3 по 7 ноября, приуроченная ко Дню Союза. В прошлом году к ней присоединились 1,7 млн ​​человек из всех регионов России и 123 стран мира. Организаторы надеются, что в этом году в акции примут участие гораздо больше людей и стран. Основная цель диктанта – пробудить у людей тягу к культуре и традициям своей национальности. Это стало актуальным и во время российской переписи. В то же время специалисты называют ряд проблем: сегодня в школе отсутствует системный подход к этнографическому образованию. О том, как в Татарстане пройдет Большой этнографический диктант и как республика работает над повышением этнографической грамотности, читайте в репортаже «Реального времени».

20 федеральных и 10 региональных вопросов

Большой этнографический диктант 2021 года будет как онлайн, так и офлайн. Онлайн-кампания стартует в 00:01 по московскому времени 3 ноября на официальной странице мероприятия miretno.ru. Пройти диктант можно офлайн в Доме дружбы народов в 11.00. Также акция пройдет и в других местах Казани — в Центральной городской библиотеке на улице Вишневского, 10, Комитете по развитию туризма Казани, гимназии № 22 и ряде школ. 244 площадки предназначены для дачи этнографического диктанта в районах республики. Его можно пройти на русском, английском, испанском и китайском языках.

«Задача акции — сделать так, чтобы после диктанта у всех жителей России возникло желание узнать свои корни, традиции предков, узнать больше о том, кто здесь живет», — сказала вице-министр культуры Татарстана Юлия Адгамова.

Диктовка будет в тестовом режиме. Всем участникам задается 20 вопросов — федеральная часть и 10 вопросов — региональная часть, разработанная краеведами и ведущими учеными Казанского федерального университета.

«10 вопросов, конечно, очень мало. Основной посыл региональной части – проиллюстрировать все составляющие нашей территории, именно нашего региона, всех проживающих здесь этносов. Для иностранцев тест состоит из 30 вопросов, одинаковых для всех стран», — добавил вице-министр.

Максимальная сумма баллов, которую можно набрать за диктант – 100. На выполнение всех заданий дается 45 минут. Каждому участнику мероприятия будет вручен сертификат, в котором будет указано, на какие вопросы были даны правильные ответы, а на какие нет.

Фото: mgppu.ru

В 2020 году к акции присоединились 1,7 млн ​​человек из всех регионов России и 123 стран мира. В этом году охват этнографического диктанта будет больше, надеются организаторы. По словам директора Дома дружбы народов Татарстана Ирека Шарипова, основной контингент мероприятия составляют члены и руководители национально-культурных объединений, школьники, иностранцы, артисты.

«Задача – повышение этнографической грамотности»

«Этнографический диктант придумали в Удмуртии, где я проработал более 20 лет», — сказал Шарипов. «Одну из главных проблем национальной политики и межэтнических отношений мы тогда определили в том, что мало знаем друг о друге, о национальном облике наших стран, регионов. А задачей диктанта как раз и было повышение этнографической грамотности населения»

«И она растет. Так, если 10 лет назад в республике было два Дома дружбы и 11 представительств, филиалов Ассамблей народов Татарстана, то сегодня у нас более 30 офисов, 13 домов и Домов дружбы народов. А наши подсчеты показывают, что около 800 тысяч человек занимаются реализацией государственной национальной политики, межнациональными отношениями. Другими словами, каждый четвертый житель нашей республики так или иначе участвует в наших мероприятиях. Это большая армия людей, которых можно считать этнографически грамотными», — продолжил Шарипов.

Работая в этом направлении, Дом дружбы народов в Казани организует уроки дружбы и согласия, — сказал Шарипов. Эти классы были предложены в течение 7 лет. Иногда их выдают за пределы Казани. Сейчас это в основном общественное движение, движение активистов. В последнее время в рамках проекта «Пушкинская карта» стали предлагать уроки дружбы и гармонии. Идея таких занятий возникла из-за отсутствия в современной школе системного подхода к этнографическому образованию.

«Сегодня вопросы этнографического образования больше относятся к самообразованию», — отметил спикер. «В школе нет такого спецпредмета, который бы отдельно задавал эти вопросы. Это занятия по истории, обществознанию и географии, экономике. Эти предметы могут научить устройству нашего государства, тому, как строятся межэтнические отношения. Но не хватает системного подхода».

Фото: Тимур Рахматуллин

В то же время, например, в Сингапуре четыре раза в неделю проходят занятия по расовой гармонии, отмечает Шарипов. По его мнению, этнографическая грамотность играет не последнюю роль в межэтнических отношениях.

«Чтобы в обществе царили мир и согласие, необходимо знать и понимать историю и специфику каждого из проживающих здесь этносов, — говорит директор Дома дружбы народов. «Мы всегда говорим детям, что мы должны понимать, какие отношения между этносами правильные, а какие отношения недопустимы, какие слова нельзя употреблять, на что не следует обращать внимание. Вот почему Большой Этнографический Диктант как раз и направлен на то, чтобы обратить всеобщее внимание на то, что этнографическая грамотность является нашим больным вопросом».

«Имеется тенденция изменения национального состава континентов, стран»

Эти вопросы особенно актуальны сейчас, в период Всероссийской переписи населения. Шарипов заявил, что ожидается заметная разница между результатами предыдущей и нынешней переписей.

«Это год больших прорывов в миграции», — пояснил спикер. «В целом наблюдается глобальная тенденция изменения национального состава континентов, стран, в том числе и наших, регионов. Для нас, Ассамблеи дружбы народов Татарстана, это рабочие документы, и они у меня на столе. Зайдя в любой населенный пункт, мы находим результаты переписи и видим национальный состав этих районов и городов.