Выдвижение и проверка гипотез в системе распознавания древнерусской скорописи

Избор

EnglishRussianBulgarianLithuanian

El'Manuscript-10

Конференция

Организационный комитет

Программный комитет

Направления работы конференции

Направления работы школы

Основные даты

Регистрация и заявка

Организационный взнос

Программа конференции

Список участников

Материалы конференции

Проекты и ресурсы

Организационная информация

Культурная программа

RSS-емисии

Порталът е създаден с финансовата подкрепа на Руската хуманитарна фондация (RHF), номер на проекта 07-04-12140v.

(с) "Информационните технологии и писменото наследство", 2008-2020 г.

Выдвижение и проверка гипотез в системе распознавания древнерусской скорописи

Автор: Иван Анатольевич Зеленцов
10 Июль 2010
Electronic processing of ancient Russian text requires its representation in electronic text format. An OCR system may help in translation of real documents into electronic text. A structure-based hypothesis-driven recognition method is proposed. The paper describes the principles of hypotheses nomination and testing used by this method. Для хранения, электронного издания и компьютерной обработки памятников древнерусской скорописи требуется их представление в виде электронного текста. Процесс ручного перевода имеющихся документов в такое представление требует больших трудозатрат и специальных знаний. Это обстоятельство делает целесообразным создание автоматизированной компьютерной системы распознавания документов этого рода. На основе особенностей графики древнерусской скорописи, выявленных в результате её анализа [Русская 1956], предложена методика распознавания, построенная на следующих характерных принципах: структурный подход к распознаванию [Структурные 1977], трассировка линий входного изображения [Модуль 2002, 4], использование экспертных знаний на этапе обучения и функционирования системы, двухуровневая организация процесса распознавания (слова и буквы), нечёткое описание структурных элементов распознаваемых объектов [Метод 2004]. Влияние случайных пересечений букв и декоративных росчерков, характерных для скорописи, предлагается исключать путём управления процессом распознавания выдвижением гипотез о распознаваемых объектах и их проверкой гипотез. Система выдвигает гипотезы о содержании наблюдаемого в данный момент фрагмента изображения и производит их проверку поиском предполагаемых ими элементов. Таким образом, выделяются только существенные части изображения, а посторонние остаются без внимания. Разработан способ описания структурной информации о распознаваемых словах и буквах. В качестве метода представления знаний выбраны фреймовые сети [Фреймы 1979]. Структура слов и букв иерархическим образом представляется в базе знаний системы. Основные узлы фреймовой сети имеют типы Слово и Буква. Элементами слов являются буквы, элементами букв ― линии и точки их пересечения. Распознавание букв и слов строится на основе концепции виртуального фрейма. Для определённости рассмотрим процедуру распознавания букв. В процессе анализа изображения получаемая информация сохраняется в динамической памяти системы в виде фреймовой модели, описывающей наблюдаемую картину. Этот фрейм называется виртуальным. Задача распознавания сводится к нахождению способа установления соответствия между узлами виртуального фрейма и узлами одного из фреймов букв в базе знаний. В каждый момент процесса распознавания состав и структура виртуального фрейма позволяет выделить набор фреймов базы знаний в качестве списка гипотез, потенциально описывающих наблюдаемую картину. Для описания выдвинутых гипотез для каждой из них строится специальная структура, состоящая из пар ссылок на согласованные узлы и тем самым описывающая схему согласования. Для определения правдоподобности гипотез используются следующие формальные характеристики. Степень согласованности гипотезы отражает, насколько полно в данный момент ВФ соответствует предполагаемому фрейму и определяется как отношение числа пар согласованных узлов в гипотезе к общему числу узлов в фрейме буквы. При успешном согласовании очередного узла она увеличивается, и как только она поднимется выше определённого порога, гипотезу можно считать подтверждённой. Степень пригодности гипотезы говорит о точности установленного соответствия и вычисляется как отношение числа пар в гипотезе к числу узлов ВФ. Чем больше в ВФ узлов, не согласованных данной гипотезой, тем ниже эта характеристика, и при определённом минимальном значении можно говорить о несостоятельности гипотезы. При проверке гипотез для каждой из них вычисляются степени согласованности и пригодности и одна из них принимается текущей. С её помощью в базе знаний определяются ожидаемые пересечения текущей линии и типы пересекающих её линий. Далее трассировщику входного изображения передаются запросы на поиск ожидаемых линий на изображении, полученные результаты анализируются и заносятся в ВФ в виде Вхождений Элементов и Отношений. При этом проводится попытка согласования добавляемых узлов с фреймами базы знаний во всех гипотезах. Далее выполняется пересчёт характеристик гипотез и нарушившие условие пригодности удаляются. Если находится гипотеза, удовлетворяющая условию согласования, то считается, что фрагмент изображения распознан и ответом является буква, указываемая данной гипотезой. Если такой гипотезы нет, текущей назначается гипотеза с максимальной степенью согласованности и распознавание продолжается. Распознавание слов во многом аналогично распознаванию букв. Вместо линий и точек здесь проводится согласование узлов букв и пространственных отношений между ними. Литература 1. Черепнин Л.В. Русская Палеография ― М., 1956 г. 2. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977. 3. Крылов А.Б. Модуль предварительной векторизации растровых монохромных изображений гибридного редактора SpotLight // Интеллектуальные технологии и системы: сборник статей аспирантов и студентов / Под ред. Ю.Н. Филипповича ― М.:МГУП, 2002. ― Вып. 4. 4. Вершинина В.В. Метод и алгоритмы анализа контурных изображений в визуальных информационных системах на основе неоднородной нечёткой семантической сети : Дис. канд. техн. наук; 05.13.01 / Рыбин. гос. авиац.-технол. акад. - Рыбинск, 2004. 5. Мински М. Фреймы для представления знаний. Пер. с англ. 1979.

< Предишна		Следваща >