Метатекстовая разметка в Национальном корпусе тувинского языка: структура и функциональные возможности
Ключевые слова:
корпусы естественных языков; Национальный корпус тувинского языка; метаразметка; тувинский язык; тувинский героический эпосАннотация
Работа над формированием Национального корпуса тувинского языка (http://www.tuvancorpus.ru/) ведется преподавателями, аспирантами и студентами Тувинского государственного и Сибирского федерального университетов. В статье представлена система метаразметки корпуса, которая является важнейшей частью поискового аппарата всякого корпуса. Под метаразметкой понимается приписывание тексту параметров, характеризующих текст в целом. Метаразметка обеспечивает в корпусе возможность поиска и отбора текстов пользователем для составления подкорпусов с заданными свойствами. Отсюда следует, что чем больше набор признаков, по которым характеризуется каждый текст, тем шире возможности поиска текстов для решения различных лингвистических и филологических задач.
Система метаразметки текстов Национального корпуса тувинского языка может содержать 18 параметров, в том числе: имя автора, пол автора, название текста, дата создания текста — год написания текста, сфера функционирования текста, тема текста или предметная область, хронотоп, или место и время описываемых событий, принадлежность текста к определенному речевому жанру, жанр художественной литературы, стиль текста, возраст аудитории, уровень образования аудитории, источник текста, название издания, название издательства, год издания, тип носителя, комментарии.
Библиографические ссылки
Захаров, В. П. (2005) Корпусная лингвистика: учебно-методическое пособие . СПб. : БВХ-Петербург. 48 с.
Куканова, В. В. (2015) Национальный корпус калмыцкого языка: итоги работы и перспективы [Электронный ресурс] // Новые исследования Тувы. № 1. URL: http://www.tuva.asia/journal/issue_25/7760-kukanova.html (дата обращения: 01.04.2016).
Савчук, С. О. (2005) Метатекстовая разметка в национальном корпусе русского языка: базовые принципы и основные функции [Электронный ресурс] // Национальный корпус русского языка: 2003–2005. Результаты и перспективы. URL: http://ruscorpora.ru/sbornik2005/05savchuk.pdf (дата обращения: 01.04.2016).
Салчак, А. Я., Байыр-оол, А. В. (2013) Электронный корпус тувинского языка: состояние, проблемы // Мир науки, культуры, образование. № 6. С. 408409.
Сысоев, П. В. (2010) Лингвистический корпус в методике обучения иностранным языкам // Язык и культура. № 1. С. 99-111.
Хертек, А. Б., Ооржак А. Б. (2012) О морфологической разметке электронного корпуса текстов тувинского языка // Грамота. Филологические науки. Вопросы теории и практики. № 7. С. 214–218.
EAGLES. Text Corpora Working Group Reading Guide. EAG--TCWG--FR—2. Version of May, 1996 [Электронный документ] // Istituto di Linguistica Computazionale «A. Zampolli». URL: http://www.ilc.cnr.it/EAGLES96/corpintr/corpintr.html (дата обращения: 12.09.2016).
Опубликован
Как цитировать
Выпуск
Раздел
Автор (лицензиар) произведения предоставляет простую (неисключительную) лицензию на использование редакцией (лицензиатом) произведения науки, который заключается в упрощённом порядке (открытая лицензия), согласно ст. 1286.1. «Открытая лицензия на использование произведения науки, литературы или искусства» Гражданского кодекса Российской Федерации.
В нашем издании публикуемые материалы доступны по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») — CC BY-NC.
Т. к. лицензия открытая, автор имеет право разместить статью после ее выхода на своем сайте, читатель может скопировать и разместить на своих персональных ресурсах, в том числе в виде выдержек, конспектов, но:
а) обязательно должно быть указано ФИО автора, неизмененное название статьи и гиперссылка на первоисточник (журнал «Новые исследования Тувы»),
б) размещающий не имеет права брать деньги за доступ к этому материалу или каким бы то ни было образом давать преимущество одним читателям над другими,
в) при перепечатке автором текста статьи без значительных изменений (если сохраняется 30% текста или более) должно быть указано, что первая редакция статьи вышла в журнале «Новые исследования Тувы» и сделана соответствующая ссылка.
Лицензия действует по всему миру, длится в течение срока авторских прав на произведение, является неотзывной.