Electronic processing of ancient Russian text requires its representation in electronic text format. An OCR system may help in translation of real documents into electronic text. A structure-based hypothesis-driven recognition method is proposed. The paper describes the principles of hypotheses nomination and testing used by this method.
Для хранения, электронного издания и компьютерной обработки памятников древнерусской скорописи требуется их представление в виде электронного текста. Процесс ручного перевода имеющихся документов в такое представление требует больших трудозатрат и специальных знаний. Это обстоятельство делает целесообразным создание автоматизированной компьютерной системы распознавания документов этого рода. На основе особенностей графики древнерусской скорописи, выявленных в результате её анализа [Русская 1956], предложена методика распознавания, построенная на следующих характерных принципах: структурный подход к распознаванию [Структурные 1977], трассировка линий входного изображения [Модуль 2002, 4], использование экспертных знаний на этапе обучения и функционирования системы, двухуровневая организация процесса распознавания (слова и буквы), нечёткое описание структурных элементов распознаваемых объектов [Метод 2004]. Влияние случайных пересечений букв и декоративных росчерков, характерных для скорописи, предлагается исключать путём управления процессом распознавания выдвижением гипотез о распознаваемых объектах и их проверкой гипотез. Система выдвигает гипотезы о содержании наблюдаемого в данный момент фрагмента изображения и производит их проверку поиском предполагаемых ими элементов. Таким образом, выделяются только существенные части изображения, а посторонние остаются без внимания. Разработан способ описания структурной информации о распознаваемых словах и буквах. В качестве метода представления знаний выбраны фреймовые сети [Фреймы 1979]. Структура слов и букв иерархическим образом представляется в базе знаний системы. Основные узлы фреймовой сети имеют типы Слово и Буква. Элементами слов являются буквы, элементами букв ― линии и точки их пересечения. Распознавание букв и слов строится на основе концепции виртуального фрейма. Для определённости рассмотрим процедуру распознавания букв. В процессе анализа изображения получаемая информация сохраняется в динамической памяти системы в виде фреймовой модели, описывающей наблюдаемую картину. Этот фрейм называется виртуальным. Задача распознавания сводится к нахождению способа установления соответствия между узлами виртуального фрейма и узлами одного из фреймов букв в базе знаний. В каждый момент процесса распознавания состав и структура виртуального фрейма позволяет выделить набор фреймов базы знаний в качестве списка гипотез, потенциально описывающих наблюдаемую картину. Для описания выдвинутых гипотез для каждой из них строится специальная структура, состоящая из пар ссылок на согласованные узлы и тем самым описывающая схему согласования. Для определения правдоподобности гипотез используются следующие формальные характеристики. Степень согласованности гипотезы отражает, насколько полно в данный момент ВФ соответствует предполагаемому фрейму и определяется как отношение числа пар согласованных узлов в гипотезе к общему числу узлов в фрейме буквы. При успешном согласовании очередного узла она увеличивается, и как только она поднимется выше определённого порога, гипотезу можно считать подтверждённой. Степень пригодности гипотезы говорит о точности установленного соответствия и вычисляется как отношение числа пар в гипотезе к числу узлов ВФ. Чем больше в ВФ узлов, не согласованных данной гипотезой, тем ниже эта характеристика, и при определённом минимальном значении можно говорить о несостоятельности гипотезы. При проверке гипотез для каждой из них вычисляются степени согласованности и пригодности и одна из них принимается текущей. С её помощью в базе знаний определяются ожидаемые пересечения текущей линии и типы пересекающих её линий. Далее трассировщику входного изображения передаются запросы на поиск ожидаемых линий на изображении, полученные результаты анализируются и заносятся в ВФ в виде Вхождений Элементов и Отношений. При этом проводится попытка согласования добавляемых узлов с фреймами базы знаний во всех гипотезах. Далее выполняется пересчёт характеристик гипотез и нарушившие условие пригодности удаляются. Если находится гипотеза, удовлетворяющая условию согласования, то считается, что фрагмент изображения распознан и ответом является буква, указываемая данной гипотезой. Если такой гипотезы нет, текущей назначается гипотеза с максимальной степенью согласованности и распознавание продолжается. Распознавание слов во многом аналогично распознаванию букв. Вместо линий и точек здесь проводится согласование узлов букв и пространственных отношений между ними. Литература 1. Черепнин Л.В. Русская Палеография ― М., 1956 г. 2. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977. 3. Крылов А.Б. Модуль предварительной векторизации растровых монохромных изображений гибридного редактора SpotLight // Интеллектуальные технологии и системы: сборник статей аспирантов и студентов / Под ред. Ю.Н. Филипповича ― М.:МГУП, 2002. ― Вып. 4. 4. Вершинина В.В. Метод и алгоритмы анализа контурных изображений в визуальных информационных системах на основе неоднородной нечёткой семантической сети : Дис. канд. техн. наук; 05.13.01 / Рыбин. гос. авиац.-технол. акад. - Рыбинск, 2004. 5. Мински М. Фреймы для представления знаний. Пер. с англ. 1979. |