El'Manuscript '08
Конференция
Организационный комитет
Программный комитет
Направления работы конференции
Направления работы школы
Основные даты
Регистрация и заявка
Организационный взнос
Программа конференции
Список участников
Материалы конференции
Проекты и ресурсы
Организационная информация
Культурная программа
Фотоотчет





Забыли пароль?
Ещё не зарегистрированы? Регистрация
Сейчас на сайте находятся:
7 гостей
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов.

(c) "Информационные технологии и письменное наследие", 2008-2017

Распознавание старославянских текстов методами, основанными на биоалгоритмах анализа изображений PDF Печать E-mail
Автор(ы): Александр Валерьевич Кучуганов, Павел Петрович Осколков   
28.06.2008 г.

icon Тезисы в формате DOC (1.27 MB 2008-07-12 19:44:43) icon Тезисы в формате PDF (613.4 kB 2008-07-12 19:45:33)

 

    Существует множество методов цифровой обработки изображений (см. например, обзорные работы [Гонсалес и др. 2006; Шапиро и др. 2006]). Ниже рассматриваются примеры работы алгоритмов анализа изображений, имитирующих механизмы зрения биологических систем и связанных общей парадигмой рекурсивного анализа пространственных отношений, что позволяет повысить гибкость и помехоустойчивость алгоритмов при низком качестве изображений.

Процесс анализа представляется в виде трех уровней, оперативно взаимодействующих между собой (рис. 1).

Подпись: изображение

Рис. 1. Схема трехуровневого анализа изображений

 

Уровень локального анализа и статистики. Здесь выполняется анализ лучей, исходящих из центрального пикселя окрестности 3´3 или 5´5 (рис. 2), выбор направления смещения окрестности, выделение особых точек и границ площадных объектов. Весь процесс осуществляется с помощью оператора- анализатора локальных областей. В работе [Кучуганов 2006] приведена его нейросетевая

а)                                              б)

Рис. 2. Виды анализируемых окрестностей: а) окрестность 3´3; б) окрестность 5´5 и анализируемые лучи

 

Рис. 3. Цепочка контурных пикселей, полученная рекурсивным анализатором

 

модель. Начавшись в первой попавшейся точке, где обнаружен перепад яркости, локальный анализатор рекурсивно отслеживает контурные линии (рис. 3). Аналогичным образом выделяются границы цветовых областей. Попутно вычисляются простейшие статистические характеристики этих областей.

В режиме выделения особых точек (рис. 4) анализатор локальных областей, попав в зону артефактов, рекурсивно приближается к точке с наиболее ярко выраженными характеристиками (рис. 5).

 

 

       а)                  б)                           в)

 

Рис. 4. Особые точки изображения:         Рис. 5. Оптимизация особой точки

а) конец ветви; б) разветвление; в) угол

 

Уровень фрагментарного анализа и кодирования. Результаты локального анализа изображения в виде особых точек и цепочек контурных или граничных пикселей поступают в оперативную зрительную память (ОЗП). Помимо основной функции – сохранение на некоторое время информации, вышедшей из поля зрения, здесь выполняются операции по сжатию описания изображения: аппроксимация контуров и границ отрезками прямых, дуг, сплайнов; уточнение особых точек (углов и разветвлений); выделение скелетона и других характерных особенностей. Зачастую при этом ОЗП активирует функции первого уровня, возвращаясь непосредственно к анализируемой области изображения, если такая возможность имеется.

В ходе аппроксимации снова, но уже на основе цепочек уточняются особые точки (рис. 6) и рекурсивно подбираются оптимальные точки перегиба – концы аппроксимирующих отрезков. На рис. 7 показаны примеры результатов аппроксимации.

          

Рис. 6. Уточнение особой точки по пересечению исходящих ветвей

Рис. 7. Границы цветовых областей (до аппроксимации – 1752 отрезка; после аппроксимации – 62 отрезка, 75 дуг).

 

Принцип получения скелетона заключается в разбиении фигуры на выпуклые области в тех местах, где граница имеет отрицательный перегиб. При этом рекурсивно уменьшается величина отсекаемых областей, т.е. увеличивается степень детализации анализируемого объекта (рис. 8).

 

 

 

 

 

Рис. 8. Рекурсивное увеличение степени детализации

Уровень логического анализа и распознавания. Пусть известно множество VT типовых конструктивных элементов (ТКЭ), составляющих объекты, изображения которых могут быть предъявлены для анализа. Представим изображение объекта в виде графа G = (V, E), где v Î V Ì VT  – вершины графа; e Î E – множество дуг, отображающих пространственные отношения между ТКЭ.

В общем случае граф G пространственных отношений – это полный граф, в котором все вершины связаны со всеми. Но в реальных ситуациях достаточно установить отношения между топологически соседними ТКЭ, образующими связный подграф на каждом из уровней детализации объекта. В задачах распознавания рукописных текстов типовыми конструктивными элементами служат различные совокупности отрезков прямых и дуг.

Назовем лучевым графом с центром в точке v0 граф GB (beam – луч)

GB(v0) = (VB, EB), v0 Î V, VB Ì EB Ì E,

в котором центральная вершина v0 не имеет входящих дуг, а во всех остальных вершинах есть одна и только одна входящая дуга (рис. 9).

Очевидно, лучевой граф относится к классу графов типа "дерево". Разница заключается в том, что в графе типа "дерево" можно менять местами ветви, исходящие из одной вершины, в то время как в лучевом графе этого делать нельзя, поскольку его дуги отображают относительное положение вершин в пространстве аналогично полярной системе координат. Лучевой граф удобен для рекурсивного анализа ситуаций благодаря тому, что процесс можно вести методом проб и ошибок от известного к мнимому, от видимого к скрытому на любую заданную глубину, а рекурсивные алгоритмы хорошо адаптируются к многопроцессорным системам. Лучевой граф толерантен к топологическим преобразованиям объекта, поскольку строится "от наблюдателя". Наконец, на лучевом графе легко проводятся рассуждения (продукции) типа:

ЕСЛИ (Есть зрачки) ТО Искать (Брови(Выше)Ù(Темные) Ù(Параллельно)).

ЕСЛИ "И", ТО Искать ("~",(Выше)).

Распознавание графов пространственных отношений между ТКЭ заключается в поиске таких связных подграфов, в которых вершины отображают одноименные ТКЭ (рис. 10).

Рис. 10. Фрагмент рукописи Триоди постной, XII в. (ГИМ, Син. 319, 305 л.). Распознавание типовых опорных узлов и букв

На основе разработанных моделей и методов создана программная система ArtPhoto для обработки, векторизации и распознавания полутоновых растровых изображений. Проведенные экспериментальные исследования на примерах обработки изображений церковнославянских рукописных текстов показали: повышение качества векторизации изображений, степени универсальности и гибкости программной системы по отношению к диапазону изображений, эргономичности интерфейса пользователя за счет снижения количества задаваемых пороговых величин, повышение надежности распознавания от 76% до 93% в зависимости от качества исходного материала.

Список литературы

Гонсалес и др. 2006 – Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс– М. : Техносфера, 2006. – 1072 с.

Шапиро и др. 2006 – Шапиро, Л. Компьютерное зрение / Л. Шапиро, Дж. Стокман. – М. : БИНОМ, 2006.

Кучуганов 2006 – Кучуганов, А. В. Разработка и исследование методов и технологий автоматического анализа полутоновых изображений : автореф. дис. … канд. техн. наук / Кучуганов Александр Валерьевич. – Ижевск: Изд-во ИжГТУ, 2006. – 22 с.

Кучуганов и др. 2006 – Кучуганов, А. В. Распознавание рукописных текстов / А. В. Кучуганов, Г. В. Лапинская // Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам : материалы междунар. науч. конф., Ижевск, 13-17 июля 2006 г. – Ижевск: Изд-во ИжГТУ, 2006. – С. 98-103.

 

OCR of Old Church Slavonic texts using bioalgorithmic methods of image analysis

Alexander V. Kuchuganov, Pavel P. Oskolkov

Izhevsk State Technical University, Izhevsk, Russia

This paper discusses the use of algorithms simulating the mechanisms of the biological system of sight, based on a paradigm of recursive analysis of spatial relations, for the recognition of Old Church Slavonic texts. At the first level is the local analysis of image areas; at the second level, the allocation of constructive elements of objects and coding; and at the third, the logical analysis of spatial relations graphs.

 
« Пред.   След. »