Схемы аналитического описания рукописного материала и проблема конвертации различных ИПС (на примере «Реперториум» Института литературы БАН и «Ведь» НИОР БАН) |
Автор(ы): Вера Григорьевна Подковырова, Анисава Милтенова | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
28.06.2008 г. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Тезисы в формате RTF (451.24 kB 2008-07-15 12:45:29) Тезисы в формате PDF (190.96 kB 2008-07-15 12:42:57) Информационно-поисковые системы (далее – ИПС) описания рукописных материалов предназначены для введения в широкий научный оборот новых данных и поддержки научных исследований в области кодикологии, палеографии, текстологии и ряда других гуманитарных дисциплин, базирующихся на рукописном материале.
О сложности разработки системы описания рукописного
материала в автоматизированных системах писалось неоднократно [Крушельницкая 1999;
Подковырова и др. 2004], но, несмотря на эти сложности, к настоящему времени
уже опубликовано несколько подобных схем описания [Miltenova, and et. 2000; Уханова 2004;
Каширина и др. 2005 и др.]. Целый ряд ИПС описания рукописного
материала разработан и уже функционирует в крупных хранилищах рукописей (ГИМ,
Москва, БАН, Петербург и др.) и научных центрах (Институт литературы БАН, София,
Екатеринбургский государственный университет и др.).
Однако до сих пор не решены проблемы разработки и принятия
четких стандартов описания рукописного материала в подобных системах. Каждый
научный центр за многие годы изысканий и практической деятельности по описанию разработал
свои схемы. Например, в Отделе рукописей БАН с 1903 года, то есть за более чем
сто лет его существования, опубликованы 20 томов научных описаний. Но даже
внутри одного хранилища при составлении аналитического описания нет полного
единообразия в его структуре. Это вызвано как
разницей самих описываемых объектов, так и развитием терминологии и других
аспектов научных знаний. Еще большая разница
обнаруживается в деталях между описаниями в разных ИПС.
Информационный массив “Реперториум”
реализован в последние десять лет (1997–2007 гг.). Модель описания в XML формате создана в
результате совместной работе ученых из Болгарии (Милена Добрева, Институт
математики и информатики Болгарской академии, Анисава Милтенова, Институт
литературы и Андрей Бояджиев, Софийский университет), из Голандии (Бейренд ван
Дийк и Гари Гейлорд, Университет в Гронингене) и из
США (Дейвид Бирнбаум, Университет в Питсбурге). Проект содержит около 350
описаний славянских рукописей ХІ–ХVІІ вв. Компьютерное описание рукописей
делается по модели, созданной на основе TEI (Text Encoding Initiative), и развивается
в следующих направлениях: 1) стандартизирование описания рукописей как
памятников культуры; 2) орфография, палеография и
язык древних славянских памятников; 3) стандартизирование
терминологии описания текстов; 4) схемы
описания отдельных типов сборников; 5) идентификация конкретных текстов памятников
письменности, их текстологических признаков и греческих соответствий; 6) связь между аналитическим описанием и полнотекстовой
базой данных. Уже существует работающая поисковая система – проект Repertorium
Workstation проф. Дейвида Бирнбаума из Питсбурга,
США (URL: http://clover.slavic.pitt.edu:8080/exist/mss/index.xml).
Отсутствие единого стандарта как в схеме – структуре
полей описания, так и в программном обеспечении пока не позволяет соединять данные о рукописях в единую базу данных. Если мы
рассмотрим системы «Реперториум» (Ин-т литературы БАН, София) и «Ведь» (НИОР
БАН, Санкт-Петербург) с точки зрения программной основы, то увидим, что они
могут быть выставлены в Интернете без дополнительных доработок, поскольку обе
системы созданы как платформонезависимые и с применением web-языков. Это уже немаловажный аспект их
функционирования и гарант принципиальной возможности создания программы для конвертирования
данных. Однако без принципиального единства
структуры полей описания никакая конвертация невозможна.
В целом схемы аналитического описания рукописей не принципиально
отличаются друг от друга. Обе схемы обязательно имеют две основные части:
внешнее описание рукописного материала (каталожные сведения) и описание его
содержания (аналитическое описание).
Предложим в качестве примера сопоставительную таблицу части схем
описания в двух представляемых ИПС (табл. 1)[1]:
Таблица 1
Как видно из таблицы, большая часть параметров описания
совпадает или очень близка, что при необходимости взаимной конвертации баз
данных позволяет соединить их в едином поле.
Что касается аналитического описания содержания, то здесь
дело обстоит еще более просто, несмотря на то, что именно описание текстов
отдельных памятников положено в основу «Реперториума», а в ИПС «Ведь» основным
объектом описания является рукопись. Но при этом описание текстов памятников
существует как неотделимая часть описания рукописи (табл. 2).
Таблица 2
Сопоставление системы полей описания рукописных документов двух
предложенных ИПС демонстрирует единство логической основы, позволяющей при
необходимости создать программу конвертации всей информации или ее части из
одной системы в другую, т.е. возможность создания единой БД рукописного материала
на основе двух систем описания этого материала. Так как разработанные в БАН в Санкт-Петербурге и в
Институте литературы в Софии системы уже опробованы на основе значительных
массивов рукописей XI-XVIII веков, разнообразных по составу (богослужебные книги,
сборники и др.), работа в направлении конвертации является одной из самых
актуальных перспектив совместной деятельности ученных двух стран.
Список литературы
Каширина и др. 2005 – Каширина, Е. В. Схема
описания рукописного материала для автоматизированной системы Отдела рукописей
БАН / Е. В. Каширина, В. Г. Подковырова // Материалы и
сообщения по фондам отдела рукописной книги БАН. – СПб. : Изд-во Библиотеки
РАН, 2005. – С. 377-394.
Крушельницкая 1999 – Крушельницкая, Е. В.
Проблемы отражения археографического, палеографического и кодикологического
описания славянских рукописей в системе электронной базы данных / Е. В. Крушельницкая
// Опыты по источниковедению. Древнерусская книжность: археография,
палеография, кодикология. – СПб., 1999. – С. 223-239.
Подковырова и др. 2004 – Подковырова, В. Г.
Автоматизированная информационная система описания-хранения-поиска материалов
из фондов Отдела рукописей БАН как особый тип локальной энциклопедии / В. Г. Подковырова,
Е. В. Каширина // Энциклопедия как форма универсального знания: от
эпохи Просвещения к эпохе Интернета. – СПб., 2004. – С. 300-307.
Уханова 2004 – Уханова, Е. В. Компьютерные
базы данных ОР ГИМ: принципы создания и перспективы развития / Е. В. Уханова
// Археографический ежегодник за 2003 г. – М., 2004. – С. 79-96.
Boyadziev, and et. 2003 – Boyadziev,
A. A Unified Model for the Description of the Medieval Manuscripts? / A. Boyadziev, A. Miltenova,
D. Radoslavova // Computational
Approaches to the Study of Early and Modern Slavic Languages and Texts. – Sofia,
2003. – P. 113–125.
Miltenova, and et. 1998 – Miltenova, A. Repertorium of Medieval Slavic Literature: Computer
and Philological Standards / A. Miltenova, A. Boyadzhiev, S. Velev //
Palaeobulgarica. – 1998. – XXII, N 2. – P. 50–69.
Miltenova, and et. 2000 – Miltenova, A. An Electronic
Repertory of Medieval Slavic Literature and Letters: a Suite of Guidelines /
A. Miltenova, A. Boyadzhiev // Medieval Slavic Manuscripts and SGML:
Problems and Perspectives. – Sofia, 2000. –
P. 44–68.
Schemes for analytical description
of manuscripts and problems of conversion in various digital libraries (using
as examples Repertorium and Vedi)
Anissava Miltenova, Vera G. Podkovyrova
Institute of Literature of the Bulgarian
Academy of Sciences, Sofia, Bulgaria; Library of Russian Academy of Sciences,
St. Petersburg, Russia
The paper presents the process of standardization
of analytical descriptions of Slavic manuscripts using informational
technologies. [1] Полные схемы описания см. [Miltenova, and et. 1998; Miltenova, and et. 2000; Boyadziev, and et. 2003; Каширина и др. 2005].
|