El'Manuscript-10
Conference
Organizational committee
Program Committee
Topic areas for conference
Topic areas for school
Important Dates
Registration and request
The registration fee
Conference program
List of participants
Conference content
Projects and resources
Organizational information
Leisure & Tourism





Lost Password?
No account yet? Register
We have 1 guest online
RSS-feed
rss20.gif

The project is supported by the Russian Foundation for Basic Research, project #07-04-12140в

(c) "Information Technologies and Textual Heritage", 2008-2020

Электронный индекс диалектизмов (лингвистические примечания к лемматизатору) PDF Print E-mail
Written by: Олег Феофанович Жолобов   
Пятница, 09 Июль 2010

     In essence, only in the electronic form this or that historic source may be fully investigated by the researcher. To create an automatic lemmatizator is the foremost and the most difficult task of the electronic lexicography and source study. While elaborating it, not only the orthographical, phonetic and morphological variants should be taken into consideration, but also the dialectal formations.
    Создание электронных баз данных открывает новые горизонты перед историческим языкознанием. По существу, именно в электронном виде тот или иной исторический источник становится доступным исследователю в полной мере и может быть освоен им во всей полноте своих свойств. Один из наиболее ярких недавних примеров и доказательств последнего – скан-копии новгородских цер, датируемых первыми десятилетиями XI в. (см. [Зализняк 2003]). Безусловно, возможности историко-лингвистического анализа источников существенно возрастают после предварительного перевода их на доступный компьютерный язык – конвертации в электронно-наборный вид. В этом случае с помощью компьютерной обработки достаточно быстро могут быть созданы исчерпывающие формоуказатели к любому тексту фактически  вне зависимости от его объема. Вместе с тем ценность научной публикации рукописных источников многократно возрастает, если она сопровождается не просто формоуказателями, а их лингвистически обработанными версиями, т.е. словоуказателями к текстам. Создание автоматического лемматизатора в этом смысле является первоочередной и наиболее сложной задачей электронной лексикографии и языкознания в целом. При его подготовке должны быть учтены не только стандартные словоизменительные образцы, но и многочисленные орфографические, фонетические и морфологические варианты, а также диалектные образования разной природы.  

 

Составление сводного перечня диалектизмов, их своеобразное исчисление необходимы, во-первых, для того, чтобы применение лемматизатора было максимально эффективным – точным и полным – при вычленении лексических единиц, а во-вторых, для того, чтобы при создании словоуказателя могла быть установлена диалектная природа рукописи. Выявление и изучение диалектизмов, как известно, является важной частью любого историко-лингвистического исследования. Именно диалектные образования ближе всего стоят к динамике живой речи и ярче всего ее характеризуют. С помощью особого ключа лемматизатора могут создаваться указатели диалектизмов к электронной версии той или иной рукописи.

Диахроническая классификация особенностей древнерусских диалектов включает следующие параметрические группы (см. [Крысько 1998]):

(1)    праславянские архаизмы[1];

(2)    праславянские диалектизмы[2];

(3)    восточнославянские инновации дописьменного периода;

(4)    общие особенности для того или иного ареала говоров;

(5)    разновременные инновации тех или иных отдельных говоров.

К праславянским архаизмам относится, в частности, вариативность форм 3 л. ед. и мн. числа в презенсе на -ть и . Считается, что она отсутствовала в древнерусских текстах северо-восточного происхождения, а в новгородско-псковских источниках была широко представлена в разных типах спряжения как в ед., так и во мн. числе, в то время как в древнерусских юго-западных письменных памятниках – в основном в 3 л. ед. ч. I спряжения [Зализняк 2004: 152–153]. Безусловно, требуется тщательная проверка этого вывода, поскольку материал юго-западных источников в этом отношении изучен гораздо хуже новгородско-псковских данных. Сопоставление электронных версий новгородско-псковской и галицко-волынской рукописей, связанных с общим протографом, приведенный вывод не подтверждает: галицко-волынская рукопись содержит столь же разнообразные вариативные формы, что и источник новгородско-псковский. Есть основания полагать, что и средне-западные источники отличались родственными характеристиками. Использование сплошной электронной выборки форм позволило бы восполнить очевидные пробелы в языковых данных. Изучение вариативности этого типа тем более важно, что она является индоевропейским наследием в праславянском.

В качестве примера праславянского диалектизма показательно, в частности, распространение окончания -ови/-еви в ДП существительных мужского рода. Сопоставление электронных версий одного и того же сборника разного диалектного происхождения противоречит устоявшемуся положению об устойчивом росте таких словоформ в юго-западных источниках. Только полномасштабная электронная выборка соответствующих словоформ позволит установить подлинную картину распределения вариативных словоформ на -оу и -ови, которые, возможно, имеют родственный генезис (см. [Жолобов 2009а: 224]).

Безусловно, в лемматизаторе должны быть учтены, например, орфограммы с -жч-, свойственные галицко-волынским источникам (см.: дожчь, ижченут < из+женуть, ражчеть < раз+жьжеть и др.). Они отражают праславянский рефлекс палатализации *zg, противопоставленный старославянскому рефлексу [žd’], а также новгородско-псковскому жг’ < жд’ < *ždž’ (см.: одъжгити, ражгяти и под.)[3]. Орфограммы с жг, таким образом, являются примером собственно новгородского диалектизма. В том и другом случае существуют гиперкорректные написания, которые также должны учтены (см.: тужчими vs. щюжгихъ < *teudj-).

Окончание 1 л. мн. числа -мо в презенсе обычно рассматривают как праславянский диалектизм, у восточных славян получивший распространение в Южной и Западной Руси. Однако самые ранние случаи появления флективного -мо отмечаются в галицко-волынской рукописи и ограничены исключительно новыми формами императива с нулевым суффиксом: алчьмо, плачьмося, помилуимо и др. [Жолобов 2009б: 53]. В подобных примерах можно усматривать фонетическое развитие флективной инновации, свойственной собственно древнерусским юго-западным говорам.

Электронная выборка императивных форм 2 л. мн. числа не подтверждает вывода об узко диалектном, новгородско-псковском, характере инновационных форм типа придите, несите и об их отсутствии в юго-западных говорах, где, как указывается, был представлен другой тип генерализации – по первому лескиновскому классу.

Точно так же обстоит дело с другой яркой особенностью, которая связывается с новгородско-псковскими говорами – с особым развитием праславянских групп типа tort и tъrt (см.: срочькъ, съдрово и влонения, мретвымъ и т.д.). Такие же рефлексы обнаруживаются в галицко-волынских источниках (см. [Жолобов 2009в]. Безусловно, это делает более сложной картину рефлексации указанных групп, но вместе с тем и предполагает внесение ее схемы в лемматизацию.

Важное место в рукописных источниках занимают разные диалектные типы обобщения твердых или мягких деклинационных образцов, которые, несомненно, как и другие диалектные явления, должны получить отражение при моделировании парадигм лемматизатора.

 

Литература

Жолобов 2009а – Жолобов О.Ф. К истории славянского датива / О.Ф.Жолобов // Rozprawy Komisji Językowej. – 2009. – Tom LIV. – S. 221–229.

Жолобов 2009б – Жолобов О.Ф. Корпус древнерусских списков Паренесиса Ефрема Сирина. II: РНБ, Погод. 71а / О.Ф.Жолобов // Russian Linguistics. – 2009. 33. C. 3764.

Жолобов 2009в – Жолобов О.Ф. Пристанище невълонимое (к рефлексации групп типа tъrt/tъlt) / О.Ф.Жолобов // Русский язык в научном освещении. – 2009. – № 1 (17). – С. 127–133.

Зализняк 2003 – Зализняк А.А. Проблемы изучения Новгородского кодекса XI века, найденного в 2000 г. / А.А.Зализняк // Славянское языкознание. XIII Международный съезд славистов. Любляна, 2003 г. Доклады российской делегации. – М., 2003. – С. 190–212.

Зализняк 2004 – Зализняк А.А. Древненовгородский диалект / А.А.Зализняк. – М.: Языки славянской культуры, 2004. – 872 с.

Крысько 1998 – Крысько В.Б. Древний новгородско-псковский диалект на общеславянском фоне / В. Б. Крысько // Вопросы языкознания. – 1998. – № 3. – С. 74–93.



[1] Имеется в виду сохранение того или иного образования общеславянского происхождения в той или иной диалектной зоне при его утрате или частичном сохранении в других диалектах.

[2] Имеются в виду диалектные расхождения и изоглоссы, возникшие в праславянский период.

[3] Древнерусская орфография упрощается.

 
< Prev   Next >