El'Manuscript '08
Conference
Organizational committee
Program Committee
Topic areas
Topic areas for workshop
Basic dates
Registration and request
Organizational payment
Program of conference
List of participants
Conference content
Projects and resources
Organizational information
Cultural program
Photoreport





Lost Password?
No account yet? Register
We have 1 guest online
RSS-feed
rss20.gif

The project is supported by the Russian Foundation for Basic Research, project #07-04-12140в

(c) "Information Technologies and Textual Heritage", 2008-2020

Формообразование русского языка XVIII века в аспекте компьютерной интерпретации. PDF Print E-mail
Written by: Геннадий Алексеевич Николаев, Наталья Геннадьевна Николаева   
Понедельник, 30 Июнь 2008

I. Русское субстантивное формообразование XVIII века

в аспекте компьютерной интерпретации
 
    XVIII век известен в истории русского литературного языка как век «словесного эксперимента» (Ю.С.Сорокин). В процессе становления и развития литературного языка нового типа проходили «испытания» языковые формы и элементы самого разного свойства: исконно русские, церковнославянские, заимствованные, диалектные, просторечные и др. Результаты этого «эксперимента» кардинальным образом преобразовали литературный язык XVIII века – от языка на церковнославянской основе  к языку на русской основе.

    Эти преобразования шли эволюционным путем, что позволяет нам выделить в истории русского языка XVIII века три основных периода: Петровский (первая треть века), Ломоносовский (вторая треть ) и Карамзинский (последняя треть столетия). Каждый из этих периодов имел свою доминанту языковых средств. Однако существовала и периферия, в которой скапливались, с одной стороны, архаические элементы, а с другой, нарождающиеся формы. Поэтому эти периферийные формы связывали один период языка XVIII века с другим, размывали четкие границы между отмеченными языковыми периодами.

          Тем не менее, историческая специфика языка XVIII века затрудняет создание единых нормативных свидетельств русского языка этого периода, например,   словаря или грамматики. Правда, в конце века был создан такой словарь – Словарь Академии Российской. Но он в значительной степени ориентировался на современный язык и язык наивысшего авторитета XVIII века – М.В.Ломоносова. Языковые формы Петровского времени или вовсе не использованы в словаре, или присутствуют в нем в ограниченном количестве.

          Коллектив специалистов Казанского университета задался целью составить index a tergo Словаря Академии Российской с применением компьютерной технологии. Самым сложным в этом деле оказалось научить компьютер устанавливать тождество слова при наличии огромного количества вариантных и синонимичных форм слов. А если учитывать то языковое разнообразие, которое характеризовало язык XVIII века и о чем мы уже говорили в начале наших заметок, историкам языка пришлось a priori разрабатывать схемы русского формообразования, которые возможны были в это время (с учетом и архаических форм, и языковых предпочтений отдельных мастеров слова этого времени).

          Естественно, что каждая часть речи в русском языке XVIII века имела свои формообразовательные варианты, определяемые историческим прошлым этой части речи. Например, для субстантива в число вариантов могли быть включены формы двойственного числа при сохранении исконных плюральных форм (колени – колена, плечи – плеча и т.п.), родовые варианты (степень – жен. и муж. род), варианты, связанные с разной реализацией напряженных редуцированных во  флексиях (ночию – ночью, веселием – весельем и т.п.), варианты, связанные с взаимодействием основ разных типов склонения (древа – дерева – древеса – деревья и т.п.) или флексий (формы родит. и дат. ед ч. типа у земле – к  земли) и т.д.

          Таким образом, на основании тщательного изучения всех возможностей, которые могли быть реализованы в русском языке XVIII века, необходимо было разработать соответствующие справочные таблицы, и те были заложены в компьютерную программу распознавания слов по реализованным в речи его формам. В качестве приложения приводится таблица возможных в языке XVIII века субстантивных окончаний, расположенных в алфавитном порядке.

1. –а                         6. –е                    11. –ий                    16. –ой                   21. -ъ

2. –ама                    7. –ей                  12. –има                 17. –ома                 22. -ы

3. –ами                    8. –емъ               13. –ию                   18. –омъ                23. -ь

4. –амъ                    9. –ею                 14. –о                      19. –ою                  24. -ьми

5.–ахъ                     10. –и                  15. –овъ                  20. –у                     25. –ью

 26. –ю         27. –я         28. –яма      29. –ями         30. –яхъ        31. –h     32. -hхъ

Guennadi A. Nikolayev
The Russian substantive form-building of the 18th century in an aspect of computer interpretation.
A computer version of the substantive form-building of the 18th century must consider all possible forms of substantive of that period for definition of the word identity while composing a dictionary on the textual foundation.

 

II.

Русское глагольное формообразование XVIII века

в аспекте компьютерной интерпретации

          При составлении словарных индексов на основании поиска слов в текстах с помощью компьютера встает задача распознавания слова в его словоформах и отождествления этих словоформ в лексему. Даже применительно к современному русскому языку здесь имеются определенные трудности. Эти трудности увеличиваются, как сейчас принято говорить, «в разы», когда речь заходит о русском языке XVIII века. Причины этого рассмотрены в докладе Г.А.Николаева, поэтому я не буду на них останавливаться.

          Особенно большие трудности возникают при компьютерной интерпретации глагола.  Это объясняется, во-первых, значительным количеством глагольных категорий и, соответственно, глагольных форм; во-вторых, большим количеством вариативных и синонимических образований в сфере глагольного словоизменения.

          Варианты глагольных форм имеют, как правило, одинаковую природу: сохранение архаических форм при активном использовании форм более новых (инфинитив на –ти и –ть, презентная форма 2 лица ед.ч. –ши и –шь и др.). Использование архаических форм объясняется не только хронологическими причинами, но, чаще, языковыми пристрастиями писателей (ср., например, предпочтение А.П.Сумароковым форм типа ходиши вместо живой тогда формы ходишь и т.п.).

          Здесь приводится таблица глагольных флексий и финалей русского глагола XVIII века. разработанная совместно с Г.А.Николаевым.

Инфнитив

1. –ть, 2. –ти, 3. –чь, 4. –чи  5. –ся   6. –сь

 

.Личные формы

 

1. –у   2. –ю    3. –мъ   4. –усь   5. –уся   6. –юсь    7. –юся

8. –ешь   9. –еши   10. –ишь   11. –иши   12. –шь  13. –си 14. –ешься  15. –ешися

16. –ишься   17. – ишися     18. –итъ   19. –етъ   20. –стъ    21. –сть   22. –ется   23 –ится

24. –емъ   25. –имъ   26. –емся   27. –имся 

28. –ете   29. –ите   30. –етесь   31. –етеся   32. –итесь   33. –итеся

34. утъ   35. –утся   36. –ютъ   37. –ются   38. –атъ   39. –атся    40. –ятъ   41. –ятся .

 

 

Императив

 

1. –ь   2. –и   3. –ись   4. –ися   5. –й   6. –йся   7. –ься

8. –ьте   9. –ите   10. –йте   11. –итесь   12. –итеся   13. –йтесь   14. –йтеся    15. –ьтесь

16. –ьтеся.

 

Суффиксы деепричастий

 

1. –а   2. –я   3. –учи   4. –ючи   5. –в   6. –вши    7. -ши
 

Nataliya G. Nikolayeva
The Russian verb form-building of the 18th century in an aspect of computer interpretation

A computer version of the verb form-building of the 18th century must consider all possible temporal forms for definition of the word identity while composing a dictionary, i.e. backrunning one, on the textual foundation.

 

 
< Prev   Next >