ИНФОРМАЦИОННАЯ СИСТЕМА «ПАМЯТНИКИ РУССКОЙ РУКОПИСНОЙ КНИЖНОСТИ ВОПРОСНО-ОТВЕТНОГО ЖАНРА» |
Автор(ы): Марина Геннадьевна Бабалык, Александр Валерьевич Пигин, Алексей Геннадьевич Варфоломеев | |
27.08.2012 г. | |
Summary. The article deals with the problems of textological study and publication of Russian medieval written documents in the form of questions and answers. The authors suggest the project of a Web information system for comparison and investigation of such documents by means of mathematical models and methods. Информационная система ... (pdf) (394.46 kB) Жанр диалога (беседы, в том числе вопросно-ответной) является очень древним в мировой литературе. В древнерусской оригинальной (непереводной) литературе эта форма впервые была использована в Речи Философа в Повести временных лет. В такой форме написаны и многие апокрифы: Беседа трех святителей, Вопросы Иоанна Богослова Господу на горе Фаворской, Вопросы Иоанна Богослова Аврааму на Елеонской горе, Луцидариус, Вопросы о Тивериадском море и другие. В XVII–XX вв. вопросно-ответная форма активно использовалась старообрядческими книжниками в полемических целях. В рукописных сборниках этого времени встречается также большое число вопросно-ответных компиляций, которые еще не обращали на себя внимания исследователей. В ходе исследований апокрифа «Беседа трех святителей» традиционными методами было установлено, что эти компиляции включают заимствования из «Беседы…» и других ранних вопросно-ответных памятников [Бабалык, 2012]. Следовательно, между произведениями этого жанра существует генетическая связь, которая может быть установлена путем текстологического анализа. Выявление этой связи, определение круга источников, включенных книжниками в вопросно-ответные компиляции, позволит объяснить цели (литературные, полемические и прочие) создания такого рода текстов и соответственно обогатит наши знания о литературе и культуре позднего русского средневековья и нового времени. Текстологическое изучение вопросно-ответных произведений имеет свою специфику, которая определяется в первую очередь высокой степенью вариативности этих текстов. Разные списки одного вопросно-ответного памятника могут различаться как количеством вопросно-ответных пар, так и их последовательностью [Бабалык, 2012]. Для сравнения списков друг с другом, для построения вероятных стемм списков [Бородкин, 1983], а также для идентификации фрагментов известных произведений во вновь найденных списках вопросно-ответных компиляций необходимо применять компьютерные технологии. Более того, необходимо организовать работу сетевого научного сообщества и виртуальной среды для исследования списков, так как они находятся в самых разных рукописных хранилищах [Варфоломеев и др., 2010]. Такие задачи требуют использования общепринятого, универсального формата для представления текстов, который был бы удобен для многократного текстологического анализа с помощью различных методик. В качестве формата представления текстов мы предлагаем использовать уже существующий формат на основе стандарта TEI, который был создан нами ранее [Бабалык и др., 2010]. Существенные свойства предлагаемой нами информационной системы состоят в следующем: 1) круг используемых моделей текстов и алгоритмов их сравнения и классификации будет широким, так как тексты памятников, на которые ориентировано Веб-приложение, имеют разнообразную структуру. 2) будут разработаны новые алгоритмы и программные модули, предназначенные для быстрого поиска аналогичных текстовых фрагментов в других произведениях. Так как полное совпадение текстов вопросно-ответных пар встречается довольно редко, а отдельные слова или словосочетания часто входят в разные вопросы и ответы, корректное установление совпадения оказывается трудной задачей. Мы предполагаем использовать для этого принципы семантического поиска, предварительно формализуя смысл вопросов и ответов с помощью графовых структур или других моделей. 3) Информационная система будет не только электронной библиотекой литературных памятников, но и виртуальной средой исследований текстов. Это значит, что размеченные тексты могут исследоваться в нашей среде повторно, при этом ученые могут видеть методики и результаты их предшественников. Разрабатываемый в рамках нашего проекта инструментарий должен состоять из: - модуля регистрации, авторизации и персонализации работы с виртуальной средой, - специализированного XML-редактора, позволяющего размечать тексты в соответствии со стандартной схемой разметки TEI P5 [Wittern et al., 2009], - модуля создания и редактирования описаний методик и результатов исследований текстов, - модуля, позволяющего искать описания исследований по различным критериям, - модуля, состоящего из различных программ сравнения, классификации, семантического поиска текстов, которые могут использоваться в ходе исследований. Для построения предлагаемого Интернет-ресурса будет использована клиент-серверная архитектура, при этом основные вычисления и обработка данных будут происходить на сервере. Данная концепция позволит довольно эффективно работать в сети и не потребует от пользователя дополнительной установки программного обеспечения, поскольку на стороне клиента будут использоваться возможности стандартного Web-браузера. Работа выполняется при финансовой поддержке Программы стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию научно-исследовательской деятельности, а также в рамках проекта, поддержанного грантом РГНФ (проект № 12–04–12027в). Список литературыБабалык, 2012 ― Бабалык М.Г. Апокриф «Беседа трех святителей» в русской рукописной книжности: исследование и тексты. LAP Lambert Academic Publishing, Saarbrücken, 2012. Бабалык и др., 2011 ― Бабалык М.Г., Варфоломеев А.Г., Пигин А.В. Использование формата TEI для публикации и анализа списков произведений вопросно-ответного жанра // Информационные технологии и письменное наследие: Материалы междунар. науч. конф. (Уфа, 28–31 октября 2010 г.). Уфа;Ижевск, 2010. С.17–20. Бородкин, 1983 ― Бородкин Л.И. Математические методы классификации древних текстов // Методы количественного анализа текстов нарративных источников. М., 1983. С.8–30. Варфоломеев и др., 2010 ― Варфоломеев А.Г., Бабалык М.Г., Пигин А.В. О проекте виртуальной среды для исследования списков «Беседы трёх святителей» // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды XII Всерос. науч. конф. "RCDL'2010" (Казань, 13–17 октября 2010 г.). Казань, 2010. С.551–556. Wittern et al., 2009 ― Wittern C., Ciula A., Tuohy C. The making of TEI P5 // Literary and Linguistic Computing. 2009. Vol. 24. № 3. Pp. 281–296. |