Summary. The
article deals with the problems of textological study and publication of
Russian medieval written documents in the form of questions and answers. The authors
suggest the project of a Web information system for comparison and investigation
of such documents by means of mathematical models and methods.
Информационная система ... (pdf) (394.46 kB)
Жанр диалога (беседы, в том числе вопросно-ответной)
является очень древним в мировой литературе. В древнерусской оригинальной
(непереводной) литературе эта форма впервые была использована в Речи Философа в
Повести временных лет. В такой форме написаны и многие апокрифы: Беседа трех святителей,
Вопросы Иоанна Богослова Господу на горе Фаворской, Вопросы Иоанна Богослова
Аврааму на Елеонской горе, Луцидариус, Вопросы о Тивериадском море и другие. В
XVII–XX вв. вопросно-ответная форма активно использовалась старообрядческими
книжниками в полемических целях. В рукописных сборниках этого времени
встречается также большое число вопросно-ответных компиляций, которые еще не
обращали на себя внимания исследователей. В ходе исследований апокрифа «Беседа
трех святителей» традиционными методами было установлено, что эти компиляции
включают заимствования из «Беседы…» и других ранних вопросно-ответных памятников
[Бабалык, 2012]. Следовательно, между произведениями этого жанра существует генетическая
связь, которая может быть установлена путем текстологического анализа. Выявление
этой связи, определение круга источников, включенных книжниками в
вопросно-ответные компиляции, позволит объяснить цели (литературные, полемические
и прочие) создания такого рода текстов и соответственно обогатит наши знания о
литературе и культуре позднего русского средневековья и нового времени.
Текстологическое
изучение вопросно-ответных произведений имеет свою специфику, которая
определяется в первую очередь высокой степенью вариативности этих текстов.
Разные списки одного вопросно-ответного памятника могут различаться как
количеством вопросно-ответных пар, так и их последовательностью [Бабалык,
2012]. Для сравнения списков друг с другом, для построения вероятных стемм
списков [Бородкин, 1983], а также для идентификации фрагментов известных
произведений во вновь найденных списках вопросно-ответных компиляций необходимо
применять компьютерные технологии. Более того, необходимо организовать работу
сетевого научного сообщества и виртуальной среды для исследования списков, так
как они находятся в самых разных рукописных хранилищах [Варфоломеев и др.,
2010]. Такие задачи требуют использования общепринятого, универсального формата
для представления текстов, который был бы удобен для многократного текстологического
анализа с помощью различных методик.
В
качестве формата представления текстов мы предлагаем использовать уже
существующий формат на основе стандарта TEI, который был создан нами ранее
[Бабалык и др., 2010]. Существенные свойства предлагаемой нами информационной
системы состоят в следующем:
1) круг
используемых моделей текстов и алгоритмов их сравнения и классификации будет
широким, так как тексты памятников, на которые ориентировано Веб-приложение,
имеют разнообразную структуру.
2) будут
разработаны новые алгоритмы и программные модули, предназначенные для быстрого
поиска аналогичных текстовых фрагментов в других произведениях. Так как полное
совпадение текстов вопросно-ответных пар встречается довольно редко, а
отдельные слова или словосочетания часто входят в разные вопросы и ответы,
корректное установление совпадения оказывается трудной задачей. Мы предполагаем
использовать для этого принципы семантического поиска, предварительно
формализуя смысл вопросов и ответов с помощью графовых структур или других моделей.
3) Информационная
система будет не только электронной библиотекой литературных памятников, но и
виртуальной средой исследований текстов. Это значит, что размеченные тексты
могут исследоваться в нашей среде повторно, при этом ученые могут видеть
методики и результаты их предшественников.
Разрабатываемый
в рамках нашего проекта инструментарий должен состоять из:
-
модуля регистрации, авторизации и персонализации работы с
виртуальной средой,
-
специализированного XML-редактора, позволяющего размечать тексты
в соответствии со стандартной схемой разметки TEI P5 [Wittern et al., 2009],
-
модуля создания и редактирования
описаний методик и результатов исследований текстов,
-
модуля, позволяющего искать описания
исследований по различным критериям,
-
модуля, состоящего из различных
программ сравнения, классификации, семантического поиска текстов, которые могут
использоваться в ходе исследований.
Для
построения предлагаемого Интернет-ресурса будет использована клиент-серверная
архитектура, при этом основные вычисления и обработка данных будут происходить
на сервере. Данная концепция позволит довольно эффективно работать в сети и не
потребует от пользователя дополнительной установки программного обеспечения,
поскольку на стороне клиента будут использоваться возможности стандартного
Web-браузера.
Работа выполняется при финансовой поддержке Программы
стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию
научно-исследовательской деятельности, а также в рамках проекта, поддержанного
грантом РГНФ (проект № 12–04–12027в).
Список
литературы
Бабалык,
2012 ― Бабалык М.Г. Апокриф «Беседа трех святителей» в русской рукописной
книжности: исследование и тексты. LAP Lambert Academic Publishing, Saarbrücken,
2012.
Бабалык
и др., 2011 ― Бабалык М.Г., Варфоломеев А.Г., Пигин А.В. Использование формата
TEI для публикации и анализа списков произведений вопросно-ответного жанра //
Информационные технологии и письменное наследие: Материалы междунар. науч. конф.
(Уфа, 28–31 октября 2010 г.). Уфа;Ижевск, 2010. С.17–20.
Бородкин,
1983 ― Бородкин Л.И. Математические методы классификации древних текстов //
Методы количественного анализа текстов нарративных источников. М., 1983. С.8–30.
Варфоломеев
и др., 2010 ― Варфоломеев А.Г., Бабалык М.Г., Пигин А.В. О проекте
виртуальной среды для исследования списков «Беседы трёх святителей» // Электронные
библиотеки: перспективные методы и технологии, электронные коллекции: Труды XII
Всерос. науч. конф. "RCDL'2010" (Казань, 13–17 октября 2010 г.).
Казань, 2010. С.551–556.
Wittern et al., 2009 ―
Wittern C., Ciula A., Tuohy C. The making of TEI P5 // Literary and
Linguistic Computing. 2009. Vol. 24. № 3. Pp. 281–296.
|