El'Manuscript-10
Conference
Organizational committee
Program Committee
Topic areas for conference
Topic areas for school
Important Dates
Registration and request
The registration fee
Conference program
List of participants
Conference content
Projects and resources
Organizational information
Leisure & Tourism





Lost Password?
No account yet? Register
RSS-feed
rss20.gif

The project is supported by the Russian Foundation for Basic Research, project #07-04-12140в

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов. 

(c) "Information Technologies and Textual Heritage", 2008-2016

Компьютерные алгоритмы лингво-текстологической стратификации Повести временных лет PDF Print E-mail
Written by: Дмитрий Анатольевич Добровольский, Савва Михайлович Михеев   
Четверг, 02 Сентябрь 2010

       Исследование посвящено новой методике текстологического исследования древнерусской Начальной летописи. C помощью нескольких простых алгоритмов, реализованных на языке Python 3, предлагается создать полный словоуказатель к Лаврентьевскому списку летописи, а затем выявить в этом указателе слова и выражения, распределение которых по тексту окажется сходным. Таким образом можно будет выявить специфические словоупотребления, характеризующие индивидуальную манеру каждого из книжников, работавших над летописью в XI—начале XII в.

The paper proposes a new method of textual study of the Russian Primary‭  ‬Chronicle.‭ ‬The method includes analysis of graphics,‭ ‬vocabulary,‭ ‬and syntax of Laurentian copy of The Chronicle using several simple algorithms written in Python‭ ‬3‭ ‬programming language.‭ ‬The idea is to generate a thesaurus and analyze distribution patterns of numerous words and spellings in order to identify specific usages typical of each of the Chronicles‭' ‬authors.

       Еще в XIX‭ ‬в.‭ ‬исследователи пришли к заключению,‭ ‬что Повесть временных лет‭ [‬далее‭ ― ‬ПВЛ‭] ‬не была первым местным сочинением по истории Руси.‭ ‬Однако восстановление предшествующих ПВЛ летописных сводов представлялось авторам позапрошлого века делом‭ «‬скорее художественным,‭ ‬чем ученым‭» [‬Костомаров‭ ‬1861:‭ ‬3‭]‬.‭ ‬Научный подход к проблеме,‭ ‬ставящий во главу угла требования проверяемости и воспроизводимости,‭ ‬был предложен А.А.‭ ‬Шахматовым,‭ ‬чьи‭ «‬Разыскания о древнейших русских летописных сводах‭» [‬(1908‭)]‬инеоконченное издание ПВЛ‭ [‬(1916‭);‬1940‭]‬являются классикой современного летописного источниковедения.‭ ‬Вместе с тем,‭ ‬опыт А.А.‭ ‬Шахматова также оказался неоднозначным,‭ ‬о чем свидетельствует появление значительного числа альтернативных версий начальной истории русского летописания,‭ ‬оспаривающих не только частности,‭ ‬но и базовыетезисы предшественника,‭ ‬включая атрибуцию ПВЛ Нестору Печерскому,‭ ‬двухкратное редактирование летописи во втором десятилетии XII‭ ‬в.‭ ‬и даже предположение о том,‭ ‬что свод-предшественник ПВЛ сохранился в составе Новгородской I‭ ‬летописи младшего извода‭ [‬Истрин‭ ‬1923‭―‬1924‭;‬Бугославский‭ ‬2006‭ (‬1941‭);‬Алешковский‭ ‬1971‭;‬Кузьмин‭ ‬1977‭ ‬и др.‭]‬.‭ «‬Общепризнанных‭» ‬идей в современном летописеведении практически нет.
Наблюдаемой диссоциациилетописного источниковедения как научной дисциплины в немалой степени способствовал специфический состав сохранившихся источников.‭ ‬Текст Начальной летописи‭ (‬т.е.‭ ‬Повести временных лет и предшествовавших ей сводов XI‭ ‬в.‭) ‬представлен значительным количеством списков,‭ ‬среди которых есть и относительно ранние,‭ ‬не испытавшие существенного воздействия со стороны позднейших редакторов,‭ ‬деятельность которых стала особенно активной в XV―XVI‭ ‬вв.‭ ‬Однако все эти списки,‭ ‬за исключением Новгородской I‭ ‬летописи XIII―XIV‭ ‬вв.,‭ ‬либо восходят к одному протографу,‭ ‬которым была ПВЛ,‭ ‬как она сложилась после‭ ‬1115‭ ‬г.,‭ ‬либо испытали определяющее воздействие этого сочинения.‭ ‬В свою очередь,‭ ‬новгородская традиция сохранила более ранний текст лишь частично,‭ ‬причем число этих‭ «‬частей‭» ‬тоже стало предметом споров:‭ ‬одни говорят о двух фрагментах‭ [‬Шахматов‭ ‬2002‭ (‬1908‭)‬:‭ ‬26‭]‬,‭ ‬другие только об одном‭ [‬Алешковский‭ ‬1971:‭ ‬25‭―‬31,‭ ‬71‭―‬83‭;‬Гиппиус‭ ‬1997:‭ ‬50‭―‬55‭]‬.‭ ‬Описанное положение ограничивает возможности сопоставления летописей.Какую-то пищу для рассуждениймогут дать грамматические нестыковки,‭ ‬вроде остатков двойственного числа в известии о захвате Олегом Киева‭ [‬ПСРЛ I:‭ ]‬,‭ ‬но число таких ситуаций ограничено.‭ ‬Наконец,‭ ‬нестыковки в хронологии могут иметь текстологическое значение лишь в том случае,‭ ‬если доказано,‭ ‬что летописное повествование развивалось строго линейно и целью книжников было дать точные датировки событий,‭ ‬а наблюдения,‭ ‬например,‭ ‬над записями‭ ‬6571‭―‬6575‭ ‬гг.‭ ‬о новгородском походе Всеслава говорят скорее об обратном‭ [‬Добровольский‭ ‬2009‭]‬.‭ ‬Пробелы соблазнительно заполнить соображениями о‭ «‬нелогичности‭»‬,‭ «‬непоследовательности‭» ‬и‭ «‬противоречиях‭» ‬летописного текста.‭ ‬Очевидно,‭ ‬однако,‭ ‬что такого рода построения опираются на определенную интерпретацию изучаемого источника,‭ ‬которую можно принимать,‭ ‬а можно и не принимать.‭ ‬Логика средневекового нарратива‭  ‬столь тонка и сложно‭ (‬на современный взгляд‭) ‬организована,‭ ‬что получить сколько-нибудь обязывающие результаты путем ее анализа практически невозможно.‭ ‬Необходимо искать новые методики текстологической стратификации ПВЛ.
Одну из возможных методик предложил А.А.‭ ‬Гиппиус‭ [‬Гиппиус‭ ‬1996‭;‬2006‭ ‬и др.‭]‬.‭ ‬Изучая язык Синодального списка Новгородской Iлетописи,‭ ‬ученый заметил,‭ ‬что некоторые примечательные графико-орфографические и лексико-синтаксические явления распределены в этом источнике неравномерно.‭ ‬В плане истории выявленные‭ «‬швы‭» ‬обнаружили высокую степень корреляции со сменой новгородских архиепископов.‭ ‬Очевидно,‭ ‬заключил ученый,‭ ‬ведение летописей в Новгороде было занятием официальным и осуществлялось под контролем церковных властей,‭ ‬а языковая неоднородность связана с тем,‭ ‬что новый владыка как правило передавал дело историописания новому писцу.‭ ‬Аналогичная связь между вероятной сменой руки и появлением‭ ‬/‭ ‬исчезновением определенного круга слов и оборотов была выявлена при изучении способов введения прямой речи в Начальной летописи‭ [‬Гиппиус2001‭]‬.Границы зон распространения тех или иных языковых явлений в большинстве случаев предельно наглядны,‭ ‬что обеспечивает воспроизводимость полученных выводов.‭ «‬Лингвистическая карта‭» ‬может дать ответы на многие вопросы из истории текста ПВЛ.
Однако такой карты до сих пор не существует:‭ ‬наблюдения самого А.А.‭ ‬Гиппиуса касаются лишь одногопласта лексики‭ (‬verba dicendi‭)‬,‭ ‬а недавняя работа А.‭ ‬Тимберлейка‭ [‬Timberlake‭ ‬2005‭] ‬ограничена не только по числу изучаемых показателей‭ (‬это оформление заголовков известий‭)‬,‭ ‬но и по охвату текста‭ (‬рассмотрены только статьи‭ ‬1050‭―‬1110гг.‭)‬.‭ ‬А.А.‭ ‬Гиппиус пишет,‭ ‬что соотношение тематических и атематических форм аориста от глагола‭ ‬речи‭(‬рѣхъи‭ ‬рѣшаvsрекохъи‭ ‬рекоша‭) «‬является,‭ ‬по-видимому,‭ ‬наиболее ярким‭» ‬среди‭ «‬текстологически релевантных морфологических признаков‭» [‬Гиппиус‭ ‬2001:‭ ‬165‭]‬.Однако далее‭ ‬ученый анализирует еще несколько признаков,‭ ‬каждый из которых‭ «‬обладает,‭ ‬так сказать,‭ ‬собственным текстологическим‭ “‬рисунком‭”» [‬Там же:‭ ‬170‭]‬.‭ ‬Очевидно,‭ ‬число маркеров индивидуального стилялетописцев может увеличиваться и дальше.
Работа по выявлению таких маркеров весьма трудоемка.‭ ‬Существует несколько словоуказателей к ПВЛ,‭ ‬дающих более или менее точное представление о лексике памятника и позволяющих выявить употребления того или иного конкретного слова‭ [‬Творогов‭ ‬1997‭ (‬1984‭);‬Gröber,‭ ‬Müller‭ ‬1977‭―‬1986‭]‬.‭ ‬Однако необходимо не только найти все вхождения данной лексемы в текст,‭ ‬но и оценить равномерность их распределения,‭ ‬выявить максимумы и минимумы,‭ ‬а также найти слова,‭ ‬распределение которых по тексту окажется сходным‭ (‬чтобы исключить случайные результаты и разного рода статистические‭ «‬артефакты‭»)‬.‭ ‬Решить все эти задачи без использования компьютера не представляется возможным.
Предлагаемые алгоритмы реализованы на языке Python3‭ [‬://python.org/download/releases/3.1.2/‭]‬,‭ ‬выбор которого обусловлен тремя соображениями.‭ ‬Во-первых,‭ ‬данный язык способен без дополнительной настройки и преобразований совершать операции над строками в кодировке Unicode,‭ ‬что дает возможность учитывать большинство орфографических особенностей изучаемого текста.‭ ‬Во-вторых,‭ ‬Python‭ ‬позволяет наглядно обрабатывать т.наз.‭ ‬словари,‭ ‬или коллекции пар‭ «‬ключ‭» ― «‬значение‭» (‬в качестве ключа выступают слова,‭ ‬как они представлены в источнике,‭ ‬в качестве значения‭ ― ‬ссылки на те столбцы‭ ‬1-го тома Полного собрания русских летописей,‭ ‬где эти слова,‭ ‬а точнее написания,‭ ‬встречаются‭)‬.‭ ‬В-третьих,‭ ‬Python‭ ‬является интерпретируемым языком‭; ‬написанные на нем программы хранятся в виде исходного кода,‭ ‬что позволяет оперативно корректировать используемые алгоритмы.‭ ‬В-четвертых,‭ ‬наконец,‭ ‬Pythonраспространяется‭ ‬под очень либеральной лицензией‭ [‬://python.org/psf/license/‭]‬,‭ ‬что дает возможность свободно скачивать и устанавливать необходимые интерпретатор и среду разработки,‭ ‬а также распространятьнаписанные программы.‭ ‬Объектом обработки стал текст ПВЛ по Лаврентьевской летописи,‭ ‬заимствованный из проекта Д.‭ ‬Бирнбаума‭ «‬The e-PVL‭» [‬://clover.slavic.pitt.edu/pvl/‭]‬и преобразованный в файл CSV,‭ ‬каждая строка которого содержит три поля:‭ ‬ссылку на столбец издания,‭ ‬ссылку на строку в столбце и собственно текст источника.
В настоящее время реализованы два модуля.‭ ‬Первый разбирает исходный файл Lav.csv,‭ ‬создавая словарь,‭ ‬где в качестве ключей выступают словоформы,‭ ‬а в качестве значений‭ ― ‬ссылки на столбцы,‭ ‬в которых эти формы выявлены.‭ ‬Результатом работы модуля является еще один файл CSV,‭ ‬представляющий собой словоуказатель к ПВЛ по Лаврентьевскому списку.‭ ‬Второй модуль выявляет и группирует слова,‭ ‬распределение которых оказывается тождественным или сходным‭ (‬с определенным допуском‭)‬.‭ ‬Это позволяет оперативно и наглядно проверять любые догадки относительно истории летописного текста,‭ ‬и‭ ― ‬более того‭ ― ‬сравнивать догадки между собой по числу соответствующих им явлений.‭ ‬В дальнейшем планируется разработать модуль грамматического анализа,‭ ‬использование которого,‭ ‬впрочем,‭ ‬представляется факультативным,‭ ‬поскольку текстологическое значение может иметь не столько употребление слова как такового,‭ ‬сколько употребление его в конкретном времени‭ ‬/‭ ‬лице‭ ‬/‭ ‬числе‭ ‬/‭ ‬падеже,‭ ‬свидетельствующее о склонности‭ ‬/‭ ‬антипатии книжника к конструкциям того или иного типа.
По мере накопления опыта работы с материалом отдельные наблюдения составят полную‭ «‬лингвистическую карту‭» ‬ПВЛ.

Источники и литература
 
ПСРЛ‭ ‬I.‭ ‬Полное собрание русских летописей.‭ [‬Репринт.‭ ‬изд.‭] ‬М.,‭ ‬1997.‭ ‬Т.‭ ‬1:‭ ‬Лаврентьевская летопись.
Алешковский‭ ‬1971.‭ ‬Алешковский М.Х.‭ ‬Повесть временных лет:‭ ‬судьба литературного произведения в Древней Руси.‭ ‬М.,‭ ‬1971.
Бугославский‭ ‬2006‭ (‬1941‭)‬.‭ ‬Бугославский С.А.‭ «‬Повесть временных лет‭»‬:‭ (‬Списки,‭ ‬редакции,‭ ‬первоначальный текст‭) ‬//‭ ‬Бугославский С.А.‭ ‬Текстология Древней Руси.‭ ‬М.,‭ ‬2006.‭ ‬Т.‭ ‬1.‭ ‬С.‭ ‬281‭―‬312.
Гиппиус‭ ‬1996.‭ ‬Гиппиус А.А.‭ ‬Лингво-текстологическое исследование Синодального списка Новгородской Первой летописи:‭ ‬автореф.‭ ‬дис.‭ ‬...‭ ‬канд.‭ ‬филол.‭ ‬наук.‭ ‬М.,‭ ‬1996.
Гиппиус‭ ‬1997.‭ ‬Гиппиус А.А.‭ ‬К истории сложения текста Новгородской Первой летописи‭ ‬//‭ ‬Новгород.‭ ‬историч.‭ ‬сб-к.‭ ‬СПб.,‭ ‬1997.‭ ‬Вып.‭ ‬6‭(‬16‭)‬.‭ ‬С.‭ ‬3‭―‬72.
Гиппиус‭ ‬2001.‭ ‬Гиппиус А.А.‭ ‬Рекоша дружина Игореви...:‭ ‬к лингвотекстологической стратификации Начальной летописи‭ ‬//‭ ‬Russian Linguistics.‭ ‬2001.‭ ‬Vol.‭ ‬25.‭ ‬P.‭ ‬147‭―‬181.
Гиппиус‭ ‬2006.‭ ‬Гиппиус А.А.‭ ‬История и структура оригинального древнерусского текста‭ (‬XI―XIV‭ ‬вв.‭)‬:‭ ‬комплексный анализ и реконструкция:‭ ‬автореф.‭ ‬дис.‭ ‬...‭ ‬д-ра филол.‭ ‬наук.‭ ‬М.,‭ ‬2006.
Добровольский‭ ‬2009.‭ ‬Добровольский Д.А.‭ ‬Когда Всеслав ходил на Новгород:‭ (‬опыт интерпретации летописной статьи‭ ‬6575‭ ‬г.‭) ‬//‭ ‬Вспомогательные исторические дисциплины в пространстве гуманитарного знания:‭ ‬материалы XXIмеждунар.‭ ‬науч.‭ ‬конф.‭ ‬М.,‭ ‬2009.‭ ‬С.‭ ‬146‭―‬149.
Истрин‭ ‬1923‭―‬1924.‭ ‬Истрин В.М.‭ ‬Замечания о начале русского летописания:‭ (‬по поводу исследований А.А.‭ ‬Шахматова в области древнерусской летописи‭) ‬//‭ ‬Изв.‭ ‬/‭ ‬Отд.‭ ‬рус.‭ ‬яз.‭ ‬и слов.‭ ‬РАН.‭ ‬Пг.‭; ‬Л.,‭ ‬1923‭―‬1924.‭ ‬Т.‭ ‬26.‭ ‬С.‭ ‬45‭―‬102.‭ ‬Т.‭ ‬27.‭ ‬С.‭ ‬207‭―‬251.
Костомаров‭ ‬1861.‭ ‬Костомаров Н.И.‭ ‬Лекции по русской истории.‭ ‬СПб.,‭ ‬1861.‭ ‬Ч.‭ ‬1:‭ ‬Источники русской истории.
Кузьмин‭ ‬1977.‭ ‬Кузьмин А.Г.‭ ‬Начальные этапы древнерусского летописания.‭ [‬М.‭]‬,‭ ‬1977.
Творогов‭ ‬1997‭ (‬1984‭)‬.‭ ‬Творогов О.В.‭ ‬Лексический состав‭ «‬Повести временных лет‭»‬:‭ (‬Словоуказатели и частотный словник‭)‬:‭ (‬Кроме‭ «‬Поучения‭» ‬Владимира Мономаха‭) ‬//‭ ‬ПСРЛ.‭ ‬М.,‭ ‬1997.‭ ‬Т.‭ ‬1.‭ ‬С.‭ ‬581‭―‬733.
Шахматов‭ ‬1940.‭ ‬Шахматов А.А.‭ «‬Повесть временных лет‭» ‬и ее источники‭ ‬//‭ ‬Тр.‭ ‬/‭ ‬Ин-т рус.‭ ‬лит.‭ ‬АН СССР.‭ ‬Отд.‭ ‬др.-рус.‭ ‬лит.‭ ‬Л.,‭ ‬1940.‭ ‬Т.‭ ‬4.‭ ‬С.‭ ‬9‭―‬150.
Шахматов‭ ‬2002‭ (‬1908‭)‬.‭ ‬Шахматов А.А.‭ ‬Разыскания о древнейших русских летописных сводах‭ ‬//‭ ‬Шахматов А.А.‭ ‬История русского летописания.‭ ‬СПб.,‭ ‬2002.‭ ‬Т.‭ ‬1,‭ ‬кн.‭ ‬1.‭ ‬С.‭ ‬20‭―‬483.
Шахматов‭ ‬2003‭ (‬1916‭)‬.‭ ‬Шахматов А.А.‭ ‬Повесть временных лет‭ ‬//‭ ‬Шахматов А.А.‭ ‬История русского летописания.‭ ‬СПб.,‭ ‬2003.‭ ‬Т.‭ ‬1,‭ ‬кн.‭ ‬2.‭ ‬С.‭ ‬527‭―‬977.
Gröber,‭ ‬Müller‭ ‬1977‭―‬1986.Gröber B.,‭ ‬Müller L.‭ ‬Vollständiges Wörterverzeichnis zur Nestorchronik‭ ‬//‭ ‬Handbuch zur Nestorchronik‭ ‬/‭ ‬hrsg.‭ ‬von Ludolf Müller.‭ ‬München,‭ ‬1977‭―‬1986.‭ ‬Bd.‭ ‬III.‭ ‬Lief.‭ ‬1‭―‬4.
Timberlake‭ ‬2005.‭ ‬Timberlake A.‭ ‬Intervals of The Kiev Chronicle‭ (‬1050‭―‬1110‭) ‬//‭ ‬Zeitschrift für slavische Philologie.‭ ‬2005.‭ ‬Vol.‭ ‬64.‭ ‬S.‭ ‬51‭―‬70.
 
< Prev   Next >