Забыли пароль?
Ещё не зарегистрированы? Регистрация
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов.

(c) "Информационные технологии и письменное наследие", 2008-2017

ИНФОРМАЦИОННАЯ СИСТЕМА «ПАМЯТНИКИ РУССКОЙ РУКОПИСНОЙ КНИЖНОСТИ ВОПРОСНО-ОТВЕТНОГО ЖАНРА» PDF Печать E-mail
Автор(ы): Марина Геннадьевна Бабалык, Александр Валерьевич Пигин, Алексей Геннадьевич Варфоломеев   
27.08.2012 г.

Summary. The article deals with the problems of textological study and publication of Russian medieval written documents in the form of questions and answers. The authors suggest the project of a Web information system for comparison and investigation of such documents by means of mathematical models and methods.

icon Информационная система ... (pdf) (394.46 kB) 

Жанр диалога (беседы, в том числе вопросно-ответной) является очень древним в мировой литературе. В древнерусской оригинальной (непереводной) литературе эта форма впервые была использована в Речи Философа в Повести временных лет. В такой форме написаны и многие апокрифы: Беседа трех святителей, Вопросы Иоанна Богослова Господу на горе Фаворской, Вопросы Иоанна Богослова Аврааму на Елеонской горе, Луцидариус, Вопросы о Тивериадском море и другие. В XVII–XX вв. вопросно-ответная форма активно использовалась старообрядческими книжниками в полемических целях. В рукописных сборниках этого времени встречается также большое число вопросно-ответных компиляций, которые еще не обращали на себя внимания исследователей. В ходе исследований апокрифа «Беседа трех святителей» традиционными методами было установлено, что эти компиляции включают заимствования из «Беседы…» и других ранних вопросно-ответных памятников [Бабалык, 2012]. Следовательно, между произведениями этого жанра существует генетическая связь, которая может быть установлена путем текстологического анализа. Выявление этой связи, определение круга источников, включенных книжниками в вопросно-ответные компиляции, позволит объяснить цели (литературные, полемические и прочие) создания такого рода текстов и соответственно обогатит наши знания о литературе и культуре позднего русского средневековья и нового времени.

Текстологическое изучение вопросно-ответных произведений имеет свою специфику, которая определяется в первую очередь высокой степенью вариативности этих текстов. Разные списки одного вопросно-ответного памятника могут различаться как количеством вопросно-ответных пар, так и их последовательностью [Бабалык, 2012]. Для сравнения списков друг с другом, для построения вероятных стемм списков [Бородкин, 1983], а также для идентификации фрагментов известных произведений во вновь найденных списках вопросно-ответных компиляций необходимо применять компьютерные технологии. Более того, необходимо организовать работу сетевого научного сообщества и виртуальной среды для исследования списков, так как они находятся в самых разных рукописных хранилищах [Варфоломеев и др., 2010]. Такие задачи требуют использования общепринятого, универсального формата для представления текстов, который был бы удобен для многократного текстологического анализа с помощью различных методик.

В качестве формата представления текстов мы предлагаем использовать уже существующий формат на основе стандарта TEI, который был создан нами ранее [Бабалык и др., 2010]. Существенные свойства предлагаемой нами информационной системы состоят в следующем:

1) круг используемых моделей текстов и алгоритмов их сравнения и классификации будет широким, так как тексты памятников, на которые ориентировано Веб-приложение, имеют разнообразную структуру.

2) будут разработаны новые алгоритмы и программные модули, предназначенные для быстрого поиска аналогичных текстовых фрагментов в других произведениях. Так как полное совпадение текстов вопросно-ответных пар встречается довольно редко, а отдельные слова или словосочетания часто входят в разные вопросы и ответы, корректное установление совпадения оказывается трудной задачей. Мы предполагаем использовать для этого принципы семантического поиска, предварительно формализуя смысл вопросов и ответов с помощью графовых структур или других моделей.

3) Информационная система будет не только электронной библиотекой литературных памятников, но и виртуальной средой исследований текстов. Это значит, что размеченные тексты могут исследоваться в нашей среде повторно, при этом ученые могут видеть методики и результаты их предшественников.

Разрабатываемый в рамках нашего проекта инструментарий должен состоять из:

-                          модуля регистрации, авторизации и персонализации работы с виртуальной средой,

-                          специализированного XML-редактора, позволяющего размечать тексты в соответствии со стандартной схемой разметки TEI P5 [Wittern et al., 2009],

-                          модуля создания и редактирования описаний методик и результатов исследований текстов,

-                          модуля, позволяющего искать описания исследований по различным критериям,

-                          модуля, состоящего из различных программ сравнения, классификации, семантического поиска текстов, которые могут использоваться в ходе исследований.

Для построения предлагаемого Интернет-ресурса будет использована клиент-серверная архитектура, при этом основные вычисления и обработка данных будут происходить на сервере. Данная концепция позволит довольно эффективно работать в сети и не потребует от пользователя дополнительной установки программного обеспечения, поскольку на стороне клиента будут использоваться возможности стандартного Web-браузера.

Работа выполняется при финансовой поддержке Программы стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию научно-исследовательской деятельности, а также в рамках проекта, поддержанного грантом РГНФ (проект № 120412027в).

Список литературы

Бабалык, 2012 ― Бабалык М.Г. Апокриф «Беседа трех святителей» в русской рукописной книжности: исследование и тексты. LAP Lambert Academic Publishing, Saarbrücken, 2012.

Бабалык и др., 2011 ― Бабалык М.Г., Варфоломеев А.Г., Пигин А.В. Использование формата TEI для публикации и анализа списков произведений вопросно-ответного жанра // Информационные технологии и письменное наследие: Материалы междунар. науч. конф. (Уфа, 28–31 октября 2010 г.). Уфа;Ижевск, 2010. С.17–20.

Бородкин, 1983 ― Бородкин Л.И. Математические методы классификации древних текстов // Методы количественного анализа текстов нарративных источников. М., 1983. С.8–30.

Варфоломеев и др., 2010 ― Варфоломеев А.Г., Бабалык М.Г., Пигин А.В. О проекте виртуальной среды для исследования списков «Беседы трёх святителей» // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды XII Всерос. науч. конф. "RCDL'2010" (Казань, 13–17 октября 2010 г.). Казань, 2010. С.551–556.

Wittern et al., 2009 ― Wittern C., Ciula A., Tuohy C. The making of TEI P5 // Literary and Linguistic Computing. 2009. Vol. 24. № 3. Pp. 281–296.
 
« Пред.   След. »