«Русская грамматика» — Яндекс Кью

Популярное

Сообщества

Русская грамматика

Стать экспертом
  • Популярные
  • Открытые
  • Все вопросы
  • Новые ответы

Рыба Кит5 лет

7,1 K

Аквалангист

спрашиваетАндрей Диневич  · 1 ответ

Две. Одним из условий расчленения сложных союзов является наличие перед союзом вводного слова. В данном примере вводным словом является наше «наверное», поэтому сложный союз расчленяется… Читать далее

Оля Мороз5 лет

682

студентка

спрашиваетAnton Hauff  · 2 ответа

Правила, в котором говорится, что в этом случае «не» и «скучное» нужно писать раздельно, нет. Прилагательное «скучное» — не относительное, то есть оно может образовать с «не» новое слово,.

.. Читать далее

Андрей Миллер

История

851

Популяризатор истории, писатель

спрашиваетСергей А.  · 3 ответа

Во-первых, английский язык влияет на русский лексически — то есть происходит заимствование из него слов (как практически во все языки, учитывая международную значимость английского)… Читать далее

Лучший

Игорь Савин

Топ-автор

574

Энергетик по профессии. Интересы: лингвистика, психология.

спрашиваетΑλέξις ο Μέγας  · 1 ответ

Если бы в английском языке было 25 букв, а не 26, то в qwerty-клавиатуре было бы на одну клавишу меньше, и иностранные печатные машинки, которые завозились в Россию тоже имели бы на одну… Читать далее

Анонимный вопрос2г

Если я правильно понимаю, то «звонить» — это именно процесс, а «позвонить» — наличие. .. Развернуть

Ответить

Пока нет ответов

Элина Тодорова3г

Ответить

Пока нет ответов

Alexander Thorn

Филология

7мес

95

Александр Васильевич, теперь просто пенсионер

спрашиваетАлексей Н.  · 4 ответа

Большинство из них, я думаю, ничем не руководствуются. Они просто не знают, как писать чтобы/что бы в разных случаях.   Я и сам когда-то писал это чтобы раздельно во всех употреблениях… Читать далее

Андрей Бахматов

Биология

10мес

136

Увлекаюсь естественными науками и математикой. Разбираюсь в производстве корпусной мебели, мастер шахмат ICCF, разработчик научного ПО.

И какие ещё глаголы в ней бывают? Я могу подумать только про «идёмте» и «пройдёмте».

спрашиваетАмир Аарони  · 2 ответа

Это повелительное наклонение формы 1-го лица множественного числа, иногда эта форма называется побудительной. Примеры: идёмте, споёмте, поедемте. Эта форма употребляется только в… Читать далее

Владимир Хомченко2г

Ответить

Пока нет ответов

Русский язык и грамотность

173

Игорь Добразование и др.

спрашиваетди  · 1 ответ

Прежде всего, такого слова в русском языке нет. Есть страдательное причастие прошедшего времени к слову «водить» — «воженная». У Даля зафиксировано, правда, слово «воженый» — «резвый… Читать далее

Синтаксис грамматик. Томита-парсер

Директивы начинаются со знака # и заканчиваются переносом строки. Некоторые директивы совпадают по смыслу с аналогичными директивами препроцессора языка C++.

Указывает кодировку данного файла с грамматикой. Кодировка по умолчанию: utf-8. Кодировка указывается в кавычках.

#encoding “windows-1251”

Включает в данную грамматику текст другой грамматики. При этом фильтры грамматик суммируются, а корень включаемой грамматики (см. #grammar_root) игнорируется. Называние включаемой грамматики указывается в кавычках.

#include “small_grammar.cxx”

Директива #GRAMMAR_ROOT указывает нетерминал, который является корнем данной грамматики. Корень грамматики можно не задавать явно, если в грамматике есть только один нетерминал, который ни разу не встречается в правой части правил грамматики.

#GRAMMAR_ROOT MainRule

Директива #GRAMMAR_KWSET позволяет явно указать имена или типы статей из газеттира, чьи найденные в предложении ключи должны передаваться парсеру в качестве терминалов. C точки зрения текущей грамматики, эти цепочки становятся multiword-ами (см. п. 2 алгоритма работы парсера). В частности директива

#GRAMMAR_KWSET может использоваться для уточнения значения пометы kwtype=none. Пример использования см. тут.

Синтаксис описания статей аналогичен синтаксису пометы kwset: перечисления в квадратных скобках [ ] через запятую.

#GRAMMAR_KWSET [“котики”, cat_types];

Фильтры позволяют ускорить работу грамматик. Если предложение на входе не соответствует ни одному из объявленных фильтров, то грамматика на них не запускается.

Фильтр записывается как последовательность терминалов. Предложение проходит фильтр если в нем в указанном порядке встретились слова описываемые этими терминалами. Расстояние между словами может быть любым.

Перед названиями терминалов в фильтрах ставится амперсанд &. У терминалов могут быть их обычные пометы: kwtype

, wff и другие. Операторы (+, * и другие) в фильтрах использовать нельзя. Между терминалами может быть указано максимально допустимое расстояние в квадратных скобках [].

Если в грамматику включается другая грамматика директивой #include, то фильтры включаемой грамматики тоже учитываются.

#filter &Word<kwtype=fio> &AnyWord<wff=".*\d.*",h-reg1> [10] &Hyphen;

Директива #define также используется для реализации подстановок. В этом случае у директивы два аргумента: имя подстановки и ее значение. Именем подстановки может быть любая последовательность из букв, цифр и символа подчеркивания, первый символ имени подстановки не может быть цифрой. Значением подстановки может быть любое завершенное выражение, в синтаксисе, разрешенном в правой части правил грамматики: список граммем, цепочка нетерминалов с ограничениями и интерпретациями и т.п. Знак переноса строки означает конец значения переменной.

После объявления имя подстановки можно использовать с помощью синтаксиса в фигурных скобках со знаком доллара перед ним:

${ … }. Между знаком $, фигурными скобками и именем подстановки пробелы не допускаются.

Следует понимать, что подстановка «подставляется» не буквально (как, например, в языке C++), а сама по себе является сложным токеном в тексте грамматики. Поэтому подстановки нельзя использовать внутри строкового литерала (там она просто не будет распознана), а также внутри идентификаторов и других длинных токенов.

#define ALL_CASES [nom,acc,gen,dat,ins,loc]
BetterStatus -> PostStatusCoord<gnc-agr[1]> 
                FIO<rt,gnc-agr[1],GU=${ALL_CASES}>;
BetterStatus -> PostStatusCoord<gram='им'>
                FIO<rt,GU=&${ALL_CASES}>;
#undef ALL_CASES
#define HERO_WITH_INTERP Hero<rt,gram='ед,им'> interp (HeroMaybe.Fio from Fio)
Maybe -> ${HERO_WITH_INTERP} 
         TellVerb<gram='3л,ед'> ToSomeone Word;
Maybe -> ${HERO_WITH_INTERP} 
         ToSomeone TellVerb<gram='3л,ед'> Word;
#undef HERO_WITH_INTERP

Все определенные с помощью #define имена действуют дальше по тексту грамматики, в том числе во всех включенных позже файлах. Подстановку можно отменить, указав ее имя после директивы #undef. Рекомендуется всегда отменять подстановки явно, чтобы избежать неожиданных эффектов от включения одной грамматики в другую.

Вводит запрет на интерпретацию в рамках текущей грамматики. Все операторы interp перестают срабатывать.

tomita-parser/syntax-grammars.md at master · yandex/tomita-parser · GitHub

Файл грамматики состоит из двух частей: раздела с директивами, влияющими на работу грамматики в целом, и набора правил.

Директивы начинаются с символа # и заканчиваются разрывом строки. Некоторые директивы идентичны по смыслу аналогичным директивам препроцессора C++.

# кодировка

Указывает кодировку для этого файла грамматики. Кодировка по умолчанию: утф-8 . Кодировка указывается в кавычках.

#кодировка «windows-1251»;

# включает

Включает текст другой грамматики в эту грамматику. Фильтры грамматики объединяются, а корень включенной грамматики (см. #grammar_root) игнорируется. Имя включаемой грамматики заключено в кавычки.

#include «small_grammar.cxx» ;

#GRAMMAR_ROOT

Директива #GRAMMAR_ROOT указывает нетерминал, который является корнем этой грамматики. Корень грамматики не должен быть явно определен, если грамматика имеет только один нетерминал, который никогда не находится в правой части правил грамматики.

#GRAMMAR_ROOT Главное правило;

#GRAMMAR_KWSET

Директива #GRAMMAR_KWSET предназначена для явного определения имен или типов записей справочника, чьи ключи, найденные в предложениях, должны передаваться синтаксическому анализатору в качестве терминалов. С точки зрения текущей грамматики эти цепочки становятся составными словами (см. шаг 2 в алгоритме синтаксического анализатора). В частности, Директива #GRAMMAR_KWSET может использоваться для более точного определения значения тега kwtype=none. См. пример использования здесь.

Синтаксис описания записей аналогичен синтаксису тега kwset : список, разделенный запятыми, в квадратных скобках [ ] .

#GRAMMAR_KWSET ["котята", cat_types];

# фильтр

Фильтры могут ускорить работу грамматик. Если входное предложение не соответствует ни одному из объявленных фильтров, грамматика для них не выполняется.

Фильтр настроен как последовательность клемм. Предложение проходит через фильтр, если оно содержит слова, описываемые этими терминалами, в указанном порядке. Расстояние между словами не имеет значения.

Символ амперсанда и ставится перед именами клемм в фильтрах. Терминалы могут иметь свои обычные теги: kwtype , wff и другие. Операторы (+, * и другие) нельзя использовать в фильтрах. Максимально допустимое расстояние между клеммами можно указать в квадратных скобках [] .

Если в эту грамматику включена другая грамматика с помощью директивы #include , фильтры включенной грамматики также учитываются.

#filter &Word &AnyWord [10] &Hyphen;

Объявление замены: #define, #undef

Директива #define также используется для реализации замены. В этом случае директива имеет два аргумента: имя подстановки и значение. Имя подстановки может быть любой последовательностью букв, цифр и символов подчеркивания, но первый символ имени подстановки не может быть цифрой. Значением подстановки может быть любое полное выражение в синтаксисе, разрешенное в правой части правил грамматики: список граммем, цепочка нетерминалов с ограничениями и интерпретациями и т. д. Символ разрыва строки указывает на конец значения замены.

После объявления имя подстановки можно использовать в фигурных скобках со знаком доллара перед ним: ${ … } . Пробелы между знаком $ , фигурными скобками и именем подстановки не допускаются.

Имейте в виду, что подстановка не буквально «подставляется» (как в C++, например), а сама по себе является сложной лексемой в тексте грамматики. Поэтому подстановку нельзя использовать внутри строкового литерала (он просто не будет распознан) или внутри идентификаторов или других длинных токенов.

 #define ALL_CASES [nom,acc,gen,dat,ins,loc]
BetterStatus -> PostStatusCoord
                FIO;
BetterStatus -> PostStatusCoord
                FIO;
#undef ALL_CASES
 
 #define HERO_WITH_INTERP Hero interp (HeroMaybe.Fio от Fio)
Возможно -> ${HERO_WITH_INTERP}
         TellVerb ToSomeone Word;
Возможно -> ${HERO_WITH_INTERP}
         ToSomeone TellVerb Word;
#undef HERO_WITH_INTERP
 

Все имена, определенные с помощью #define , применяются к остальной части текста грамматики, даже для всех файлов, которые будут включены позже. Подстановку можно отменить, указав ее имя после директивы #undef . Мы рекомендуем всегда явно отменять замены, чтобы избежать неожиданных эффектов от включения одной грамматики в другую.

# НЕТ_ИНТЕРПРЕТАЦИИ

Запрещает интерпретацию в рамках текущей грамматики. Все interp операторы перестают работать.

IPO Яндекса привлекло 1,3 миллиарда долларов, больше, чем ожидалось

Алина Селюх, Ольга Попова Первичное публичное размещение акций в США после того, как Google Inc. стала публичной в 2004 году.

Люди идут возле штаб-квартиры компании «Яндекс» в Москве, 23 мая 2011 года. REUTERS/Сергей Карпухин

Самая популярная поисковая система России привлекла 1,3 миллиарда долларов (807 миллионов фунтов стерлингов), поскольку инвесторы скупили акции, привлеченные перспективами растущего интернет-рынка страны и эйфорией от прорывного дебюта LinkedIn Corp. на прошлой неделе.

Яндекс и его акционеры продали 52,2 млн акций по $25 каждая, сообщил Reuters источник, проинформированный о сделке. Первоначально они планировали продать акции по цене от 20 до 22 долларов за штуку, но другой источник, близкий к проблеме, сообщил Reuters в понедельник, что Яндекс, скорее всего, продаст акции по цене от 24 до 25 долларов за штуку.

Интернет-компании, особенно те, которые выходят на развивающиеся рынки, похищают сердца инвесторов. «Яндекс», по мнению многих аналитиков, возродил воспоминания о взрывном предложении своего китайского аналога Baidu Inc. Китая», — сказал Энтони Моро, управляющий директор и глава отдела развивающихся рынков подразделения депозитарных расписок BNY Mellon.

«Все остальные пытались быть «Facebook» того или «Amazon» того, но Яндекс действительно является «Google» России … Это огромный и растущий бренд».

Baidu, крупнейшая поисковая система Китая, потрясла рынки США, поднявшись на 354% во время своего дебюта на Nasdaq в 2005 году, и превратилась в один из ведущих мировых брендов.

Яндекс, стоимость которого на момент IPO оценивается в 8 миллиардов долларов, последовал за дебютным блокбастером LinkedIn, чьи акции выросли более чем вдвое в первый день торгов и напомнили о сомнительных оценках до краха доткомов десять лет назад.

«Я не знаю, получите ли вы такую ​​огромную популярность (с Яндексом), как с LinkedIn», — сказал Даррен Фабрик, управляющий директор IPO инвестиционной компании IPOX Schuster LLC. Но «в первый день он должен торговаться достаточно хорошо, даже при волатильности рынка».

Акции США закрылись на самом низком уровне за месяц в понедельник, в отличие от устойчивости рынка во время IPO LinkedIn.

LinkedIn торгуется в 34 раза больше, чем в 2010 году, в то время как акции Google сейчас стоят чуть менее чем в шесть раз больше, чем в 2010 году. IPO Яндекса оценивает акции в 18 раз больше продаж 2010 года.

Яндекс контролирует 65 процентов российского рынка интернет-поиска, что почти в три раза больше, чем у мирового лидера Google. Поклонники Яндекса также подчеркивают рекордный рост прибыли компании благодаря интернет-рекламе: в 2010 году прибыль выросла на 90% до 135 миллионов долларов при росте продаж на 43 процента до 445 миллионов долларов.

Главный исполнительный директор Аркадий Волож сообщил агентству Рейтер в 2005 году, что Яндекс может стать публичным. Компания планирует использовать выручку от IPO для обеспечения ликвидности акционеров, улучшения своего профиля и повышения финансовой гибкости, согласно заявлению Яндекса в регуляторы рынка ценных бумаг США.

Инвесторов может успокоить тот факт, что дуэт, основавший «Яндекс» в 1997 году — генеральный директор Волож и главный технический директор Илья Сегалович — сохранит большую часть своих активов.

Волож, дипломированный специалист по прикладной математике, начал заниматься поисковыми технологиями в 1989 году. Через год он основал собственную фирму по разработке программного обеспечения для поиска, где к нему присоединился геофизик Сегалович. В 1997 году они запустили сайт yandex.ru, которым в марте пользовались 38 миллионов уникальных пользователей.

Алгоритм поиска Яндекса, первоначально разработанный для поиска по ключевым словам в патентах, русской классической литературе и Библии, стал прорывом, поскольку он учитывал сложную грамматику русского языка.

Дуэт придумал название «Яндекс» — где «Я» означает русский эквивалент английского местоимения «I» — поскольку Сегалович экспериментировал с производными словами, описывающими суть технологии. Полное название изначально расшифровывалось как «Еще один iINDEX».

Сегодня слово «Яндекс» стало синонимом интернет-поиска в русскоязычных странах, так как люди предлагают «спрашивать у Яндекса» ответы на свои запросы.

Частные инвесторы также сохраняют доли, в том числе Baring Vostok Capital Partners, которая купила Яндекс в 2000 году, когда его доход составлял всего 72 000 долларов, а убыток составил 2 миллиона долларов.

Первоначальные инвестиции фонда оценили Яндекс в 15 миллионов долларов, что означает, что Baring Vostok и его партнеры могут получить до 9в 3 раза больше их первоначальных инвестиций.

Инвесторы, участвующие в IPO Яндекса, получат акции класса А, которые имеют только одну десятую голосующих акций класса Б, которые останутся у инсайдеров в сделке.

Кроме того, золотая акция, принадлежащая Сбербанку, российскому банку, контролируемому государством, представляет собой ядовитую пилюлю, которую можно использовать, чтобы помешать любому отдельному инвестору приобрести голосующий пакет акций Яндекса в размере более 25 процентов.