El'Manuscript-10
Конференция
Организационный комитет
Программный комитет
Направления работы конференции
Направления работы школы
Основные даты
Регистрация и заявка
Организационный взнос
Программа конференции
Список участников
Материалы конференции
Проекты и ресурсы
Организационная информация
Культурная программа





Забыли пароль?
Ещё не зарегистрированы? Регистрация
Сейчас на сайте находятся:
2 гостей
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

(c) "Информационные технологии и письменное наследие", 2008-2020

Морфологическая парадигма и ее составляющие в системе "Манускрипт" PDF Печать E-mail
Автор(ы): Ольга Викторовна Гулина, Виктор Аркадьевич Баранов, Алексей Николаевич Миронов   
03.09.2010 г.
     
       This article describes morphological paradigm and its components in the IAS «Manuscript», gives details about the unique unity of grammatical dictionary of Old Russian language - the type of change involved in the formation paradigm as well as the types of fractional index change.

1. Электронный грамматический словарь древнерусского языка (далее ‑ ГСДЯ) лежит в основе автоматического лемматизатора древнерусских текстов системы “Манускрипт” и представляет собой базу данных, содержащую лингвистические единицы, их значения и связи.

Единицами ГСДЯ являются основа, окончание, тип изменения, вариант основы, парадигма, субпарадигма (подробнее см.: [Автоматизированные 2007]).

Тип изменения (ТИ) является уникальной единицей базы данных. ТИ обладает классифицирующими грамматическими характеристиками частей речи, имеет связь одновременно с вариантами основы и входящими в тип изменения окончаниями и таким образом организует парадигму слова. “Характеристикой типов изменения имени существительного является род, прилагательного – членность и разряд, глагола – наклонение, время (для причастия в составе глагола), залог (для причастия), членность (для причастия)” [Автоматизированные 2007].

Единицы типа основа, окончание имеют свойства и значения. Для единицы типа основа значением является номер омонима, лексико-семантические и лексико-грамматические характеристики. Свойствами окончаний являются число и падеж (для существительного), род, число, падеж (для прилагательного), изменяемость, время, число (для глагола) и т. д.

Для выявления специфики ГСДЯ сопоставим его с другим грамматическим словарем, а именно, с грамматическим словарем русского языка А. А. Зализняка. В основе словаря - классификация слов по грамматическим разрядам. Под грамматическими разрядами А. А. Зализняк понимает “совокупность слов, у которых набор клеток, образующих парадигму, одинаков (т. е. одинаково число клеток и их названия)” [Зализняк 1977: 5]. В словаре грамматический разряд соответствует лексико-грамматическому классу слов. Построить парадигму можно с помощью системы индексов и условных обозначений, которые отсылают читателя к разделу “Грамматические сведения”, где даны образцы спряжения и склонения. Также можно построить парадигму непосредственно по индексу, поскольку все его элементы указывают на определенное морфологическое  значение. Слово в грамматическом словаре представлено в своей исходной форме (для склоняемых частей речи - И. П., ед. ч., м. р., для глаголов - инфинитив, для несклоняемых – единственная форма). В ГСДЯ парадигма строится при помощи основы (варианта основы) и ТИ, который показывает, как было сказано выше, грамматические характеристики словарной единицы, и входящих в тип изменения окончаний (вариантов окончаний), каждое из которых имеет свое значение. Именно таким образом ТИ вместе с основой в ГСДЯ образуют парадигму слова. В том случае, если у основы есть варианты, которые различаются чередующимися компонентами (например, - / -), то они имеют связь с основой и образуют подпарадигму, которая используется для построения парадигмы.

Рассмотрим демонстрацию парадигмы в словаре А. А. Зализняка и в ГСДЯ на примере прилагательных. В первом прилагательные делятся на два разряда. В первом парадигма образуется путем изменения слова по падежам, числам и родам, во втором — по падежам, числам, родам и наличию краткой формы. В словарной статье дается информация о том, как образуется сравнительная степень прилагательного. В ГСДЯ парадигмы прилагательных образуются путем сложения основы (вариантной основы), ТИ и окончаний (вариантных окончаний) со значениями рода, числа и падежа. Все прилагательные делятся на прилагательные местоименного склонения и именного склонения. Местоименные прилагательные связаны с именными прилагательными отношениями основы местоименной парадигмы и варианта основы именной подпарадигмы и наоборот.

У неизменяемых частей речи парадигма состоит из единственной формы в обоих словарях. В ГСДЯ у неизменяемых частей речи ТИ не имеет окончаний.

2. В ГСДЯ все словарные единицы являются нормализованными. “Под нормализацией мы понимаем приведение графико-орфографической формы единиц к виду, соответствующему условным, традиционно применяемым графико-орфографическим правилам передачи на письме единиц (морфем) определенной языковой системы. При нормализации возможно существование вариантов одной и той же единицы, обусловленных регулярными для данной единицы чередованиями и менами буквенных символов в ее составе. Наличие вариантов предусматривает их ранжирование” [Автоматизированные 2007].

В настоящее время ГСДЯ содержит 128499 основ, включая корневые и подчиненные; 15320 корневых основ; 15236 уникальных ТИ; в том числе: 6941 корневая основа существительных, 2438 корневых основ прилагательных, 4465 корневых основ глаголов, 94 корневые основы местоимений, 680 основ наречий, 152 основы предикативов, 37 основ частиц, 89 основ союзов, 108 основ предлогов и 9 основ междометий.

Для того чтобы описать все словоформы, используется дробная индексация ТИ. Например, парадигма прилагательных именного склонения типа  (1а) имеет 5 подпарадигм: парадигму прилагательных с основой не на заднеязычный согласный (1а), парадигмы с основами на заднеязычные и -ск (1а_к, 1а_г, 1а_х, 1а_ск). Аналогично организованы парадигмы прилагательных местоименного склонения типа  (2а, 2а_к, 2а_ск, 2а_х, 2а_г).  Прилагательные именного склонения типа  (1б) имеют 2 подпарадигмы: парадигму с основами на шипящие и аффрикаты (1б_ш) и парадигму с иными согласными в конце основы (1б). Таким же образом организованы парадигмы прилагательных местоименного склонения типа  (2б). Индексация других частей речи также основана на свойствах и значениях ТИ, основ и окончаний.

Таким образом, морфологическую парадигму в ГСДЯ образуют имеющие соответствующие грамматические значения основа (варианты основы) и ТИ с входящим в него набором окончаний. ТИ является уникальной единицей данного словаря. В ГСДЯ используется дробная индексация ТИ, чтобы описать все возможные наборы словоформ слова.

 
Литература

  Автоматический морфологический анализатор древнерусского языка: лингвистические и технологические решения / В.А. Баранов, А.Н.Миронов, А.Н. Лапин [и др.] // 10-я юбилейная международная конференция «EVA 2007 Москва». – М., 2007 [Электронный ресурс]. URL: http://conf.cpic.ru/eva2007/rus/reports/report_1130.html (дата обращения: 30.06.2010).

Зализняк А.А. Грамматический словарь русского языка. Словоизменение. - М.: Русский язык, 1977. – 880 с.
 
« Пред.   След. »