ПРОГРАММНЫЙ КОМПЛЕКС ПО ОПИСАНИЮ ДОКУМЕНТОВ ЦАРИЦЫНСКОГО ГОРОДОВОГО МАГИСТРАТА КОНЦА XVIII века КАК ИНФОРМАЦИОННАЯ БАЗА РЕКОНСТРУКЦИИ АРХИВНОГО ФОНДА |
Автор(ы): Наталия Алексеевна Тупикова, Сергей Александрович Преферансов, Дмитрий Андреевич Вуйлов, Галина Львовна Цельник | |
27.08.2012 г. | |
Summary. The
article is devoted to the description of the integrated program developed on
the basis of analysis and classification of the documents, extant as a part of
the archival fund of Tsaritsyn police city council (80−90‑es of the 18th
century). The suggested organization method of the program complex, levels of
electronic database, allocated criteria for defining document status and
structural-functional properties turn useful parameters for searching the
document in frameworks of the archival collection.
Актуальной задачей для прикладной лингвистики считается оптимизация способов фиксации и хранения речевой информации [Кибрик, 2001: 262], что предполагает создание электронных ресурсов, в том числе текстовых массивов [Зубов, 2004: 156]. Документы в составе различных архивных комплексов являются ценными памятниками деловой письменности, изучение которых проливает свет на многие вопросы, связанные с разработкой методологии, методов анализа и эффективного использования документов науки, истории и культуры, определения режима хранения и поиска информации. «Программный комплекс по описанию документов Царицынского городового магистрата (конец XVIII в.)» позволяет распознавать тексты и классифицировать материал. С точки зрения способа организации данная программа создана на основе файл-серверной архитектуры под названием «Электронный магистрат». Несмотря на существующие недостатки и ограничения данного подхода [Кузнецов, 1998], он позволяет осуществлять многопользовательский режим работы, централизовать управление доступом, имеет низкую стоимость и высокую скорость разработки, а также низкие затраты на поддержание программного продукта. Подобная архитектура рассчитана чаще на небольшие объемы информации и применение в однопользовательском режиме. Для создания программного продукта важной является дифференциация функциональных компонентов типов информационных систем [Петров, 2002: 30–31], что позволило в программе «Электронный магистрат» представить базу данных и интерфейс приложения. Под интерфейсом приложения следует понимать совокупность электронных форм, логику их обработки и программной логики взаимосвязи с базой данных, включающей операции выборки, вставки, изменения и удаления данных. Исходя из требований, предъявляемых к приложению в целом (простота развертывания и портативность), в качестве системы управления базами данных (далее ― СУБД), удовлетворяющей им, была выбрана легковесная реляционная база данных SQLite; ее функционирование не требует отдельно работающего процесса, с которым взаимодействует программа. Электронные документы Царицынского городового магистрата конца XVIII в. хранятся в одном файле, а функционирование СУБД SQLite поддерживается самим приложением «Электронный магистрат». Важным аспектом в процессе реализации приложения является организация модели структуры данных. Учитывая особенность рассматриваемой предметной области − разнородность атрибутивных характеристик документов, авторы программного продукта рассматривали в качестве перспективных следующие подходы к решению названной типовой задачи: - осуществление проецирования вида документа на таблицу в базе данных (что использовано при разработке приложения «Электронный магистрат»). Для каждого вида документа при этом создается таблица, описывающая особенности группы, подгруппы, вида и разновидности документа. Преимуществом подобного подхода является простота и наглядность модели, интерфейса и логики приложения; в качестве недостатка можно назвать избыточность и повторяемость операций в процессе разработки и использования приложения; - эмулирование связи «Ключ-Значение» в реляционной модели. Графическая нотация данного подхода представлена на рис. 1. (Document − таблица, в которой хранятся все регистрируемые документы ([…]― обозначает атрибуты, общие для всех видов); Attribute ― справочник всех атрибутов; Document_Attribute ― таблица, в которой хранятся значения для атрибута конкретного документа). Важным в рамках данного подхода является централизация всех данных системы в трех таблицах, возможность программного управления атрибутами документов; к основным недостаткам можно отнести сложность запросов на выборку и последующую их обработку, что, в конечном итоге, сказывается на производительности программы в целом и возникновении проблемы ее масштабирования; - использование документно-ориентированной базы данных (MongoDB, Redis, MemcacheDB). Если предыдущий подход являлся лишь попыткой эмуляции решения «Ключ-Значение», то данная парадигма лежит в основе выше перечисленных систем и представляется наиболее подходящим вариантом. Однако ее использование существенно противоречит предъявляемым требованиям к приложению. Интерфейсная часть приложения реализована с помощью языка высокого уровня программирования C#, инфраструктура которого обеспечивается средствами среды NET Framework 2.0. Поддержка среды осуществляется ОС Windows XP Service Pack 2 и выше.
Рис. 1. Схема "Ключ-Значение" реляционной модели в нотации IDEF1x Программный комплекс предназначен для учета, анализа структуры и функций документов, сохранившихся в составе архивного фонда Царицынского городового магистрата конца XVIII в.: книг и реестров, протокольной документации, различных видов раздельных документов (просительной, договорной, отчетной и др. документации). «Электронный магистрат» позволяет просматривать внесенные документы, добавлять, редактировать и удалять их, осуществлять поиск на основе характеристик различных реквизитов (номера документа, даты поступления, даты решения по делу, наименования документа, подписи и т. д.), основных содержательных и структурно-композиционных параметров текста, целевого назначения бумаги. Архивные тексты помещены в библиотеку документов. Первый уровень представлен группами «Книги и реестры», «Протокольная документация», «Раздельные документы». Второй и третий уровни включают работу с подгруппами, видами и разновидностями документов. Группа «Книги и реестры» содержит подгруппы «учетные книги» (книги прихода и расхода) «регистрационные документы» (реестры входящих указов и предложений, книги регистрации, книги записи), предназначенные для фиксации информации о поступающей и исходящей из магистрата корреспонденции, для регистрации договоров, прошений, вексельных обязательств жителей Царицынского округа. Группа «Протокольная документация» содержит подгруппы «информационно-справочные документы» (журналы) и «распорядительные документы (решения, которые созданы на основе журналов, содержащие постановление коллегиального органа ― присутствия магистрата. Группа «Раздельные документы» состоит из подгрупп «распорядительные документы» (указы, приказы, наставления, предложения), «отчетные» (рапорты), «договорные» (верющие письма, контракты, купчие), «информационно-справочные» (выписки из дел, копии с журналов, сообщения, доношения, объявления), «просительные» (челобитные, прошения, жалобы), «акты принятия на себя каких-либо обязательств» (подписки, клятвенные обещания, расписки, одобрения), «записи показаний судебного и несудебного характера» (сказки, объяснения, допросы), «удостоверительные документы» (квитанции, расписки, паспорта), «учетные» (регистры, описи, ведомости). Характеристика видов документов дается по атрибутам − структурно-содержательным признакам, составляющим формуляр и композиционную структуру текста деловой бумаги. С помощью функций «Добавить», «Редактировать», «Удалить», «Обновить» и «Просмотр» в электронную базу данных могут быть введены данные о новом документе (формуляре, композиционных частях и т. д.), отредактированы или аннулированы сведения об уже имеющихся единицах описания. Выделены обязательные и факультативные (непоследовательностью реализуемые) атрибуты документа. Так, для реестра входящих указов и предложений обязательными реквизитами формуляра являются название документа, а также графы таблицы, в которой заключено деловое содержание: № п/п, число регистрации, названия регистрируемых бумаг; к факультативным будут относиться даты принятия резолюции, исполнения дела, различные служебные отметки и т. д.. Композицию данного документного вида образует перечень обязательных сведений о поступивших в Царицынский городовой магистрат указах и предложениях (название документа, адресант, краткое содержание и т. д.). «Электронный магистрат» позволяет загрузить сканированную копию текста или его фрагмента. Разработанный на основе анализа архивного материала программный комплекс позволяет описать внутреннюю форму различных видов документов конца XVIII в., сделать выводы о степени ее устойчивости в зависимости от реализации системных и функциональных свойств в каждом конкретном случае, показать особенности правил составления официальных письменных текстов, способов систематизации информации в региональном делопроизводстве, что создает основу для реконструкции архивного фонда в его целостности. ИсточникТупикова Н.А., Преферансов С.А., Вуйлов Д.А., Цельник Г.Л. Программный комплекс по описанию архивного фонда Царицынского городового магистрата (конец XVIII в.) // Свидетельство о государственной регистрации программы для ЭВМ № 2011617898 / Зарегистрировано в Реестре программ для ЭВМ 07.10.2011 / Роспатент: М., 2011. Список литературыЗубов, 2004 ― Зубов А.В., Зубов И.И. Информационные технологии в лингвистике: Учеб. пособие. М., 2004. Кибрик, 2001 ― Кибрик, А.Е. Очерки по общим и прикладным вопросам языкознания. М., 2001.
Кузнецов ―
Кузнецов, С.Д. Проектирование и
разработка корпоративных информационных систем. [Электронный ресурс] http://citforum.ru/cfin/ Петров, 2002 ― Петров В.Н. Информационные системы: Учебник. СПб., 2002. |