Разработка частотного словаря и корпуса документов русского дореформенного языка
Основное содержимое статьи
Аннотация
Работа посвящена вопросам создания корпуса русского языка в дореформенной орфографии и разработке основанного на этом корпусе частотного словаря русского языка 18-го – начала 20-го веков. Рассматриваются и анализируются существующие подходы к решению поставленной задачи, в том числе приводится обзор ряда наиболее популярных электронных национальных корпусов – русского, британского и чешского. Формулируется модель внутренней организации электронного частотного словаря и его функционал. Описывается программная реализация корпуса русского дореформенного языка и основанного на нем частотного словаря с использованием языков программирования Python и Javascript и базы данных Mongo DB. Рассматриваются вопросы реализации вебприложения для доступа к разработанному электронному словарю.
Скачивания
Информация о статье
Библиографические ссылки
Захаров, В. П., Богданова, С. Ю. Корпусная лингвистика: Учебник для студентов направления «Лингвистика». – СПб. : СПбГУ. РИО. Филологический факультет, 2013. – 148 с.
Национальный корпус русского языка : сайт. – URL : http://www.ruscorpora.ru (дата обращения: 3.07.2020).
British National Corpus : сайт. – URL : http://www.natcorp.ox.ac.uk (дата обращения: 3.07.2020).
Чешский национальный корпус : сайт. – URL : http://ucnk.ff.cuni.cz (дата обращения: 3.07.2020).
Руководство по использованию Node.js. – URL : https://metanit.com/web/nodejs/1.2.php (дата обращения: 3.07.2020).
Руководство по использованию React.js. – URL : https://metanit.com/web/nodejs/1.2.php (дата обращения: 3.07.2020).
Руководство по использованию Express.js. – URL : https://expressjs.com/ru/guide/routing.html (дата обращения: 3.07.2020).
Руководство по использованию MongoDB. – URL : https://metanit.com/nosql/mongodb/1.1.php (дата обращения: 3.07.2020).