Структура словарной статьи Национального корпуса тувинского языка

Дагбажык Ангыр-оол Сымчаан-оолович

Аннотация


В настоящее время активно создаются корпусы естественных языков с помощью современных информационных технологий и методов математического моделирования. Под корпусом понимается информационно-справочная система, основанная на собрании оцифрованных текстов. Корпус включает в себя различные письменные и устные тексты, представленных в данном языке, различные типы словарей, а также разметку — информацию о свойствах текстов. Разметка отличает корпус от электронных библиотек текстов.

Для многих языков народов Российской Федерации, в том числе для тюркских языков, создаются национальные корпусы. Работа над формированием Национального корпуса тувинского языка ведется преподавателями, аспирантами и студентами Тувинского государственного и Сибирского федерального университетов.

В статье представлена структура словарной статьи для Национального корпуса тувинского языка. База данных корпусного словаря включает следующие таблицы: MAIN — основная таблица с заголовочным словом; RUS, ENG, GER — таблицы с переводом заголовочного слова на различные языки; MORPHOLOGY — таблица с морфологическими данными. База данных реализована в Microsoft Office Access.

Для работы с корпусным словарем реализованы следующие функции: добавление новой статьи, редактирование статьи, удаление статьи, поиск словарной статьи с транскрипцией, формирование и визуализация морфологических признаков заглавного слова.

Представленный проект позволяет рассматривать корпусный словарь как мультиструктурную организацию со сложным иерархическим строением, важнейшим корневым компонентом которого является словарная статья. Разработанный корпусный словарь может быть использован для изучения тувинского языка с точки зрения написания, произношения и толкования, а также для организации поиска слов и словосочетаний в текстах, хранящихся в корпусе.


Ключевые слова


организация словарей; корпус текстов; словарь; тувинский язык; элек-тронный словарь; Microsoft Office Access

Полный текст:

Литература


Бавуу-Сюрюн, М. В. (2010) Тувинский язык на современном этапе [Электронный ресурс] // Новые исследования Тувы. № 3. URL: http://www.tuva.asia/journal/issue_7/2158-bavyy-suyruyn-mv.html (дата обращения: 12.09.2016).

Салчак, А. Я., Байыр-оол, А. В. (2013) Электронный корпус ту-винского языка: состояние, проблемы // Мир науки, культуры, образо-вание. № 6. С. 408409.

Ссорина, М. С. (2011) Словарь как мультиструктурная организа-ция // Ярославский педагогический вестник. № 1. Т. 1. Гуманитарные науки. С. 142–146.

Ступин, Л. П. (1985) Лексикография английского языка : учебное пособие. М. : Высшая школа. 185 с.


Ссылки

  • На текущий момент ссылки отсутствуют.