Об автоматизации перевода нетрадиционного способа записи на примере кормчей книги 15 века
Автор(ы): Юрий Рафаэлевич Айдаров, Галина Павловна Волгирева   
02.10.2010 г.

Algorithmic approach of translating alternative writing style is presented. The algorithm was tested with the Helmsman’s Book written in 15th century.

В ходе распознавания рукописных и старопечатных текстовых исторических источников неизбежно возникает проблема, связанная со специфическими алфавитами, способами записи, требующих разработки специальных алгоритмов. В частности, рукописные книги, созданные в 15 веке для распространения на территории современного Пермского края, содержат специфические стили написания, затрудняющие не только распознавание, но и изучение их экспертами-палеографами.

В том числе в собрании рукописей Пермского педагогического университета хранится список Пространной редакции Русской Правды в составе Кормчей, созданной в 20-х годах XV века. В исследовании Р.Г. Пихои данный список относится к Чудовской редакции [Пихоя Р.Г., 1990]. Состав Чудовской редакции объединяет Кормчую и Мерила Праведного в одно целое. Подробному изучению Кормчих посвящены работы таких авторов, как В.М. Ундольский, В.Н. Бенешевич, Л.В. Милов. Содержание Пермской Кормчей совпадает с Чудовской Кормчей 1499 г. (ГИМ). Среди статей Пермской Кормчей: Канонические ответы митрополита Иоанна II, Вопрошание Кириково, Правила митрополита Кирилла и собора епископов, Правила Максима митрополита русского, антилатинские послания митрополита Иоанна II, церковный устав князя Владимира. В составе Мерила Праведного находятся Краткая редакция Закона Судного Людем, а также Русская Правда, относящаяся по классификации В.П. Любимова, к Синодально-Троицкой группе Пространной редакции [Любимов, 1936]. Завершает Пермскую Кормчую, как и все Кормчие Чудовской редакции краткий анонимный устав о церковных людех и церковных судах, называемый «Сии ряд и суд церковный…». На листах 3-6 в Пермской Кормчей имеется вкладная запись: «Сия б(о)жественная книга св(я)тых ап(осто)лъ и св(яты)х о(те)ць седми събор вселеньскых и поместныхъ съборъ дана быс(ть) еп(иско)помъ Прохором Сарьскым и Поддоньскым в дом пр(е)ч(и)стыя б(огороди)ца ч(е)стнаго ея р(о)ж(дес)тва в Ферапонтовоу поустыню». Запись завершается на л. 6 рукописной монограммой с именем вкладчика – «Прохор». Настоятель Богоявленского монастыря Прохор был поставлен в 1470 г. в сан епископа Сарайского и Подонского и управлял этой епархией до 1493 г. Как видим, Пермская Кормчая является более древним списком, нежели известная исследователям Чудовская редакция Кормчей 1499 г. Напомним, что название «чудовской редакции» происходит от Чудова монастыря, который находился в Московском Кремле.

Известно, что с 1471 г. Иван III организовывал походы на Пермь Великую с целью ее присоединения к Московскому княжеству. Более того, в последствие Иван III с «великими дарами» отпустил великопермского князя Михаила «на Пермь княжити…». Возможно, что Иван III отправил вместе с дарами и данную рукопись. Таким образом, Пермская Кормчая с уникальнейшим древнейшим русским списком Пространной редакции Русской Правды, возможно, является одним из источников изучения присоединения Перми Великой к Московскому княжеству, а также христианизации Перми Великой в целом. Для дальнейшего изучения данной проблемы необходимо сравнить пермский список Русской Правды с Троицким списком – единственным древним списком второй половины XIV в. Пространной редакции из Мерила Праведного, а также подробно изучить архивные документы Московского Кремля XIV-XV вв. в РГАДА.

Вместе с тем, «Пермская Кормчая» во всей ее целостности являет собой уникальный образец особого стиля написания, в данном случае, так называемой «полусловицы». Для сопоставления используемых в тексте знаков и букв кириллического алфавита были использованы данные о частотах букв в источниках 15 века. На основе предварительного анализа текста была выдвинута гипотеза о том, что знаки представляют собой альтернативный вариант изображения гласных кириллических букв. Поскольку «Пермская кормчая» сохранилась практически полностью, объем текста получился достаточно большим для того чтобы проверить гипотезу с помощью методов математической статистики.

Необходимость разработки специального алгоритма была вызвана тем, что существует большое количество вариантов сопоставления, даже при условии принятия гипотезы о том, что элементы альтернативного способа записи представляют собой обозначения гласных букв. Таким образом, требовалось перебрать все варианты сопоставления, и выделить из них наиболее соответствующие частотам гласных букв в текстах 15 века. В качестве метрики использовалась сумма абсолютных значений разностей частот, при этом выбирались те варианты, где сумма была минимальной.

Оптимальный по выбранному критерию вариант сопоставления позволил найти правильное соответствие между элементами альтернативного способа записи и гласными буквами. Окончательная проверка выполнялась вручную и подтвердила возможность полностью прочитать текст в соответствии с правилами старославянского языка, использовавшегося в книгах 15 века.

Таким образом, был апробирован метод сопоставления частот и проверки статистических гипотез для прочтения альтернативных способов записи. Кроме того, что этот метод может быть полезен при работе с другими источниками, предполагается реализовать его в рамках программного решения по распознаванию рукописных и старопечатных кириллических памятников [Корниенко, 2008, Айдаров, 2009].

Литература

Любимов В.П. Об издании Русской Правды // Проблемы источниковедения. М.-Л,, 1936.

Пихоя Р.Г. Пермская Кормчая // Общественное сознание, книжность, литература периода феодализма. Новосибирск, 1990. С.172

Корниенко С.И., Черепанов Ф.М., Ясницкий Л.Н. Распознавание текстов рукописных и старопечатных книг на основе нейросетевых технологий // Современные информационные технологии и письменное наследие: от древних текстов к электронным библиотекам: материалы междунар. науч. конф. (Казань, 26-30 августа 2008 г.) / отв. ред. В.Д. Соловьев, В.А. Баранов. – Казань, 2008. – С. 155-156.

Айдаров Ю.Р., Волгирева Г.П., Гагарина Д.А., Корниенко С.И., Черепанов Ф.М., Ясницкий Л.Н. Сохранение рукописных и старопечатных текстов: возможности применения технологий искусственного интеллекта // Историко-культурное наследие и информационно-коммуникационные технологии: сохранение и исследование: материалы науч. конф. (Пермь, 13–14 ноября 2009 г.) / под ред. С.И. Корниенко. – Пермь, 2009. – С. 60-68.