Структура словарной статьи Национального корпуса тувинского языка
Ключевые слова:
организация словарей; корпус текстов; словарь; тувинский язык; элек-тронный словарь; Microsoft Office AccessАннотация
В настоящее время активно создаются корпусы естественных языков с помощью современных информационных технологий и методов математического моделирования. Под корпусом понимается информационно-справочная система, основанная на собрании оцифрованных текстов. Корпус включает в себя различные письменные и устные тексты, представленных в данном языке, различные типы словарей, а также разметку — информацию о свойствах текстов. Разметка отличает корпус от электронных библиотек текстов.
Для многих языков народов Российской Федерации, в том числе для тюркских языков, создаются национальные корпусы. Работа над формированием Национального корпуса тувинского языка ведется преподавателями, аспирантами и студентами Тувинского государственного и Сибирского федерального университетов.
В статье представлена структура словарной статьи для Национального корпуса тувинского языка. База данных корпусного словаря включает следующие таблицы: MAIN — основная таблица с заголовочным словом; RUS, ENG, GER — таблицы с переводом заголовочного слова на различные языки; MORPHOLOGY — таблица с морфологическими данными. База данных реализована в Microsoft Office Access.
Для работы с корпусным словарем реализованы следующие функции: добавление новой статьи, редактирование статьи, удаление статьи, поиск словарной статьи с транскрипцией, формирование и визуализация морфологических признаков заглавного слова.
Представленный проект позволяет рассматривать корпусный словарь как мультиструктурную организацию со сложным иерархическим строением, важнейшим корневым компонентом которого является словарная статья. Разработанный корпусный словарь может быть использован для изучения тувинского языка с точки зрения написания, произношения и толкования, а также для организации поиска слов и словосочетаний в текстах, хранящихся в корпусе.
Библиографические ссылки
Салчак, А. Я., Байыр-оол, А. В. (2013) Электронный корпус ту-винского языка: состояние, проблемы // Мир науки, культуры, образо-вание. № 6. С. 408409.
Ссорина, М. С. (2011) Словарь как мультиструктурная организа-ция // Ярославский педагогический вестник. № 1. Т. 1. Гуманитарные науки. С. 142–146.
Ступин, Л. П. (1985) Лексикография английского языка : учебное пособие. М. : Высшая школа. 185 с.
Опубликован
Как цитировать
Выпуск
Раздел
Автор (лицензиар) произведения предоставляет простую (неисключительную) лицензию на использование редакцией (лицензиатом) произведения науки, который заключается в упрощённом порядке (открытая лицензия), согласно ст. 1286.1. «Открытая лицензия на использование произведения науки, литературы или искусства» Гражданского кодекса Российской Федерации.
В нашем издании публикуемые материалы доступны по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») — CC BY-NC.
Т. к. лицензия открытая, автор имеет право разместить статью после ее выхода на своем сайте, читатель может скопировать и разместить на своих персональных ресурсах, в том числе в виде выдержек, конспектов, но:
а) обязательно должно быть указано ФИО автора, неизмененное название статьи и гиперссылка на первоисточник (журнал «Новые исследования Тувы»),
б) размещающий не имеет права брать деньги за доступ к этому материалу или каким бы то ни было образом давать преимущество одним читателям над другими,
в) при перепечатке автором текста статьи без значительных изменений (если сохраняется 30% текста или более) должно быть указано, что первая редакция статьи вышла в журнале «Новые исследования Тувы» и сделана соответствующая ссылка.
Лицензия действует по всему миру, длится в течение срока авторских прав на произведение, является неотзывной.