Мы в Telegram
Добавить новость





160*600

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Актуальные новости сегодня от ValueImpression.com


Опубликовать свою новость бесплатно - сейчас


<
>

Прошла конференция «Корпусная линвистика ‒ 2019» в Санкт-Петербурге

Прошла конференция «Корпусная линвистика ‒ 2019» в Санкт-Петербурге С 24 по 28 июня 2019 года в Санкт-Петербурге прошла международная конференция «Корпусная линвистика ‒ 2019». В ходе конференции обсуждали теоретические и прикладные вопросы корпусной лингвистики.

Организаторами конференции стали кафедра математической лингвистики Санкт-Петербургского государственного университета (СПбГУ) совместно с Институтом лингвистических исследований (ИЛИ РАН) и кафедрой образовательных технологий в филологии Российского государственного педагогического университета им. А. И. Герцена (РГПУ).

Школы-семинары конференции открыл А. А. Крижановский. Он провёл мастер-класс «Создание словарных статей в электронном комплексном словаре „Русский Викисловарь“». Было создано несколько новых словарных статей. Слайды презентации доступны онлайн.

Ольга Александровна Митрофанова (СПбГУ) вместе со своими учениками рассказала о популярных и востребованных в математической лингвистике дистрибутивно-семантических моделях, её доклад назывался «Дистрибутивно-семантические модели в лингвистическом процессоре для русского языка».

О. А. Митрофанова с коллегами и учениками разработали DSM-калькулятор, которым и воспользовались участники семинара в учебных целях. По этой же ссылке можно увидеть и потестировать семантический калькулятор и ESA-калькулятор.

Сразу два доклада были связаны с корпусом Ru-RSTreebank. Это русскоязычный дискурсивный корпус, тексты в нём размечены в рамках Теории риторической структуры, разработанной в 1980-е годы Уильмом Манном и Сандрой Томпсон.

Соколова Елена Григорьевна проанализировала свойства двух риторических отношений «контраст» и «сравнение» на данных корпуса Ru-RSTreebank (см. видео).

Елезарова Юлиана Николаевна (СПбГУ) представила доклад «Грамматикализация речевого конверба „дип“ в татарском языке (на корпусных данных)». Исследование проведено на основе Татарского национального корпуса «Туган тел» (см. видео).

Проект CoCoCo представил Михаил Копотев (Хельсинкский университет). Это забавное название CoCoCo складывается из начала слов «Collocations, Colligations, and Corpora» (см. видео).

Видеоматериалы к некоторым докладам третьего дня:

Влатко Броз (хорв. Vlatko Broz; Университет Сан-Паулу) рассказал о корпусе одного термина «Brexit».

Словенского языка коснулся Иван Канич (словен. Ivan Kanič). Для обработки текстов и извлечения словосочетаний была использован система Sketch Engine. Иван Канич рассказал о разрабатываемом корпусе научных текстов по информатике и библиотечному делу — Korpus bibliotekarstva.

Наталья Борисовна Крижановская (ИПМИ КарНЦ РАН) представила доклад об извлечении морфологических правил для вепсских слов из Английского Викисловаря и пополнении словаря корпуса ВепКар. См. слайды и текст доклада.

Софья Юльевна Семёнова (ИНИОН РАН) рассказала о семантическом словаре РУСЛАН, первые версии которого разрабатывались в начале 2000 годов под руководством Нины Николаевны Леонтьевой. В новой версии РУСЛАНа используется корпусной подход для выбора наиболее частотных значений слов для описания их в словаре. Словник РУСЛАНа включает около 12 тысяч единиц. У проекта РУСЛАН есть небольшой сайт, где размещена библиография публикаций про словарь и представлены некоторые демонстрационные материалы (в том числе, примеры статей): sites.google.com/site/ruslandict.

Ирина Владимировна Азарова (СПбГУ) рассказала о вычислительной онтологии русских предлогов.

Виктория Бобичева (англ. Victoria Bobicev) из Технического университета Молдовы рассказала о способах решения задачи определения авторства в научных публикациях на русском и украинском языках. Использовалась программа Weka.

О. А. Митрофанова рассказала об исследовании структуры романа «Мастер и Маргарита» М. А. Булгакова с помощью методов тематического моделирования.

Использовалась компьютерная программа scikit-learn, в которой реализована модель LDA. Для визуализации результатов тематического моделирования использовалась библиотека pyLDAvis. После извлечения текста из библиотеки Мошкова получено порядка 120 тысяч словоупотреблений. В тематической модели было выделено 30 тем, по 30 первых слов в выдаче.

Исследование подтвердило выводы литературоведов, в частности есть чёткое противопоставление двух тем романа (роман-Е в романе-М) в построенной тематической модели. Найденные различия между фрагментами текста указывают (1) на создание романа за большой промежуток времени, (2) на стилистическую неоднородность: роман-Е близок к историческому повествованию, роман-М по стилю близок к сатирическим произведениям.

Татьяна Юрьевна Шерстинова рассказала о создаваемой биографической базе данных русских писателей. Для наполнения базы были использованы разные ресурсы, в том числе:

  • список из 3500 русских прозаических произведений на сайте Живой Журнал,
  • Почти забытые — малопопулярные сейчас, известные тогда — писатели XIX—XX века,
  • Нива — периодические журналы онлайн.

База данных включает не только сведения о писателях, но и тексты произведений. По-видимому, в Интернете эта интереснейшая база пока не представлена.


Сергей Александрович Крылов прочитал доклад Ольги Евгеньевны Фроловой «Корпус как инструмент исследования художественного текста». Исследовался текст повести Котлован Андрея Платонова (см. видео).

Виктор Павлович Захаров и Татьяна Юрьевна Шерстинова рассказали о жизни, творчестве и многогранном таланте Григория Яковлевича Мартыненко (см. видео).

Увлекательнейший доклад Г. Я. Мартыненко о стилизованных синтаксических триадах на примере повести Артёма Весёлого «Реки огненные» представила Татьяна Юрьевна (см. видео).

Видеоматериалы к некоторым докладам третьего дня:

Илья Сергеевич Николаев (СПбГУ) рассказал о корпусном исследовании топонимов в ижорских народных песнях

Андрей Анатольевич Крижановский (ИПМИ КарНЦ РАН) рассказал о разнообразии диалектов карельского языка и об Открытом корпусе вепсского и карельского языков, разрабатываемом в Петрозаводске в Карельском научном центре РАН. См. слайды и текст доклада «Представление диалектов в Открытом корпусе вепсского и карельского языков (ВепКар)».

Светлана Олеговна Савчук (ИРЯ РАН) рассказала о том, как можно проводить диахронические исследования с помощью Национального корпуса русского языка.

Николай Дмитриевич Москин (ПетрГУ) рассказал о корпусе СМАЛТ, содержащем тексты в графике XIX века.

Светлана Сергеевна Земичева (ТГУ) рассказала о тематической разметке и анализе на её основе в Томском диалектном корпусе (Демо-версия корпуса). Интересная особенность паспорта текста: наличие поля «образование», см. например текст. Есть ли аудиозаписи этих текстов? Может ли корпус когда-нибудь стать мультимедийным (звуковым)? Очень интересная идея в этом корпусе — это привязка темы к разметке (см. пример).

Елена Андреевна Рогозина (СПбГУ) рассказала о системе СКАТ: Санкт-Петербургский корпус агиографических текстов (13 житий — старая версия сайта) и новая версия сайта (23 жития). Работа с цитатами и анализ цитат показаны на примере двух текстов, связанных друг с другом: житие преподобного Дионисия Глушицкого (учитель) и житие преподобного Григория Пельшемского (ученик). Текст размечается с помощью XML-разметки. Используется программное обеспечение TXM, представленное в следующем докладе.

Алексей Михайлович Лаврентьев (НЦНИ, Франции), один из разработчиков платформы TXM, показал — как работать с этой системой, как за несколько минут можно получить разнообразную числовую и визуальную информацию о тексте, если текст был предварительно размечен. С помощью платформы TXM был выполнен анализ словоформ, предварительно проведена лемматизация текста. TXM написан на языке Java, из TXM можно вызывать скрипты на языке R. В системе TXM используется язык запросов CQP.

Виктор Аркадьевич Баранов (ИжГТУ), рассказал о возможностях исторического корпуса «Манускрипт», www.manuscripts.ru.

Видеоматериалы к некоторым докладам пятого дня:


Читайте на 123ru.net

Другие проекты от 123ru.net



Архангельск

Архангельская область и Альфа-Банк подписали на ПМЭФ соглашение о сотрудничестве



Жизнь

Армянские ковры Арцаха (Карабаха) с уникальным орнаментом представлены как «генетический код» Азербайджана - сайт monumentwatch




Українські новини

Досвідчені садівники обирають великі технічні горщики для своїх рослин і квітів



Новости 24 часа

В Подмосковье сотрудники Росгвардии спасли пожилого мужчину, который оказался один дома и плохо себя почувствовал



Game News

How to watch the 2024 PC Gaming Show: our 10th annual summer showcase



Москва

В районе Симферополя появится крупный жилой микрорайон - ЖК "Республика"



News Every Day

What If You Spent 5 Seconds in the Mariana Trench



Настроение

Остров Огой.



Москва

Более 300 человек посетят форум «Маршал Жуков» в Музее Победы



Александр Галич

Остров Чилаг — по произведениям Александра Галича



Москва

Сотрудники Росгвардии обеспечили общественную безопасность в период проведения праздника Дня защиты детей в Городском парке культуры и отдыха г.о. Чехов



Александр Зверев

Зверев вышел в финал «Ролан Гаррос»



Москва

УЗИ и КТ при диагностике урологических заболеваний: что выбрать



Желдорреммаш

Руководители подразделений электромашинного дивизиона Желдорреммаш прошли обучение в рамках развития производственной системы TOS



Симферополь

В районе Симферополя появится крупный жилой микрорайон - ЖК "Республика"



Москва

Филиал № 4 ОСФР по Москве и Московской области информирует: Отделение СФР по Москве и Московской области в текущем году компенсировало стоимость полиса ОСАГО более 600 жителям региона



Москва

Собянин открыл после реконструкции приемное отделение Морозовской ДГКБ



Москва

Филиал № 4 ОСФР по Москве и Московской области информирует: Соцфонд выдал проактивно 3,2 млн сертификатов на материнский капитал



Другие популярные новости дня сегодня


123ru.net — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 123ru.net.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.



Новости 24/7 Все города России




Загрузка...


Топ 10 новостей последнего часа






Персональные новости

123ru.net — ежедневник главных новостей Вашего города и Вашего региона. 123ru.net - новости в деталях, свежий, незамыленный образ событий дня, аналитика минувших событий, прогнозы на будущее и непредвзятый взгляд на настоящее, как всегда, оперативно, честно, без купюр и цензуры каждый час, семь дней в неделю, 24 часа в сутки. Ещё больше местных городских новостей Вашего города — на порталах News-Life.pro и News24.pro. Полная лента региональных новостей на этот час — здесь. Самые свежие и популярные публикации событий в России и в мире сегодня - в ТОП-100 и на сайте Russia24.pro. С 2017 года проект 123ru.net стал мультиязычным и расширил свою аудиторию в мировом пространстве. Теперь нас читает не только русскоязычная аудитория и жители бывшего СССР, но и весь современный мир. 123ru.net - мир новостей без границ и цензуры в режиме реального времени. Каждую минуту - 123 самые горячие новости из городов и регионов. С нами Вы никогда не пропустите главное. А самым главным во все века остаётся "время" - наше и Ваше (у каждого - оно своё). Время - бесценно! Берегите и цените время. Здесь и сейчас — знакомства на 123ru.net. . Разместить свою новость локально в любом городе (и даже, на любом языке мира) можно ежесекундно (совершенно бесплатно) с мгновенной публикацией (без цензуры и модерации) самостоятельно - здесь.



Загрузка...

Загрузка...

Экология в России и мире
Москва

Тузику и Мурке присвоят номера: нужен ли в России закон о нумерации домашних животных





Путин в России и мире
Москва

Путин на следующей неделе встретится с участниками программы «Время Героев»


Лукашенко в Беларуси и мире



123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.





Зеленский в Украине и мире
Киев

В чем успех визита Зеленского во Францию и почему надо брать Mirage 2000


Навальный в России и мире


Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...



Сергей Шнуров

Стас Михайлов объяснил, почему никогда не выйдет на сцену со Шнуровым



Москва

Эксперты дали советы, как выбрать солнцезащитный крем

Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net