El'Manuscript-10
Конференция
Организационный комитет
Программный комитет
Направления работы конференции
Направления работы школы
Основные даты
Регистрация и заявка
Организационный взнос
Программа конференции
Список участников
Материалы конференции
Проекты и ресурсы
Организационная информация
Культурная программа





Забыли пароль?
Ещё не зарегистрированы? Регистрация
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

(c) "Информационные технологии и письменное наследие", 2008-2020

Особенности сохранения, документирования и изучения объявлений в газете «Пермские губернские ведомос PDF Печать E-mail
Автор(ы): Елена Александровна Кузнецова   
02.09.2010 г.

Advertisements from ‘Permskie gubernskie vedomosty’ have a lot of features.

  1. Advertisements are a mass historical source.

  2. Advertisements have specific structure of the text

  3. Advertisements have specific design

  4. Use pre-revolutionary font for publication advertisements.

These features have influence on conservation, documentation and analysis advertisements.

Information system ‘Gazeta ‘Permskie gubernskie vedomosty’ allows describe each advertisement in accordance attributes this system, save text of advertisements in different formats - text and image, classify advertisements. It is allow save and analysis all block of advertisements in ‘Permskie gubernskie vedomosty’ newspaper.

Объявления в газете «Пермские губернские ведомости» являются специфическим типом публикации и особым типом исторического источника. Они характеризуются рядом особенностей.

  1. Объявления - массовый источник,

  2. Они имеют:

  • специфическую структуру текста,

  • специфический дизайн

  1. Напечатаны дореволюционным шрифтом, в старорусской орфографии

Эта специфика их как публикаций требует особого подхода к решению вопросов их сохранения, документирования в электронном формате и анализа с применением современных информационных технологий.

В газете «Пермские губернские ведомости» основные блоки рекламных объявлений размещались, как правило, на первой и последней страницах. Подобная структура номера губернской газеты является обычной для конца XIX – начала XX вв. В «Руководстве для наборщиков» этого периода говорилось: «Чтобы определить пространство для литературной части, нужно сначала сверстать объявления и сообразно оставшемуся месту прибавить или убавить статьи» [Руководство,1874 г., Ч 1: С. 139]. Приоритет в размещении объявлений перед другими типами публикаций объясняется тем, что они являлись одним из главных источников дохода издателей. Размещение объявления на первой странице обходилось дороже, чем на последней – 30 коп. и 15 коп. за строку петита соответственно.

Эффективное использование объявлений как исторического источника делает необходимым анализ их информации как единого текста. Для этого наиболее целесообразно перевести объявления в электронный формат и использовать для их сохранения, документирования и анализа информационные системы. Первичный анализ объявлений в газете «Пермские губернские ведомости», позволил сделать вывод, что цифровая модель публикации их может быть реализована в существующей для сохранения, документирования и анализа газеты информационной системе. Разработанная модель электронной версии объявлений предполагает ввод объявлений в форматах изображение и текст, документировать их такими атрибутами как: тип публикации, раздел, заголовок, дата номера (номер, дата), распознанное текст, имидж объявления. При определенной модификации справочных таблиц информационной системы «Газета «Пермские губернские ведомости» она вполне позволяет это реализовать.

Каждое объявление вводится в информационную систему как отдельная публикация. Для этого при помощи программы ABBYY FineReader блок объявлений разрезается на отдельные части, распознается и сохраняется в двух форматах – текст и изображение. Использование Дореволюционный старых и различных шрифтов осложняет процесс распознавания текстов, для чего необходимо применение технологий «распознавание с обучением» и «создание и использование пользовательских эталонов».

На создание пользовательского эталона влияет и другая особенность объявлений – специфический дизайн. Форма и размеры объявления могут варьироваться – от нескольких строк до нескольких полос. Объявления могут быть вытянуты по горизонтали (на ширину нескольких полос) или по вертикали; могут содержать только текст, или основной смысл может нести изображение, а текст будет нести дополнительную информацию. Все объявления по способу оформления можно разделить на несколько групп: текст, текст с использованием различных шрифтов (2 и более), текст в рамке, текст с изображением.

С особенностью дизайна тесно переплетена специфика построения текста. Текст объявления построен таким образом, чтобы завладеть вниманием читателя, просматривающего газету, поэтому основная задача одним – двумя выделенными в тексте словами заинтересовать, раскрыть суть, заставить читать оставшийся текст, набранный более мелким шрифтом. Для привлечения внимания используется элементы, которые упоминались ранее - рамки, изображения, различные по величине буквы и шрифты, которые усложняют процесс распознавания изображения.

Введенные в систему объявления документируются на основе вышеуказанных атрибутов модели.

Так система через атрибут «Раздел» позволяет отделить объявления от других типов публикаций. В поле системы «Тип публикации» дает возможность дифференцировать объявления по типам. Указанные атрибуты позволяют получать количественные данные как в целом по всему их массиву, содержащемуся в газете, так и по отдельным годам, кварталам, месяцам, номерам, в том числе и учитывая их содержательное разнообразие. Как правило, объявления не содержат специального заголовка. В связи с этим при заполнении важного с точки зрения анализа поля «Заголовок» было решено использовать фрагмент текста объявления, отражающий основной его смысл.

Через поле «Дата номера» объявления привязываются к номеру и странице газеты.

Ввод в информационную систему распознанного текста объявления позволяет производить контекстный поиск, формировать текстовые выборки, например для традиционного или контент-анализа, содержащейся в них информации.

Одновременно сохранение в системе графического образа объявления позволяет наиболее полно передать не только его информацию, но и облик, что важно с источниковедческой точки зрения.

Таким образом, использование информационной системы позволяет осуществлять сохранение, документирование и изучение объявлений как массового исторического источника как в рамках одной газеты, так и в различных совокупностях ее номеров, проводить их количественный и качественный анализ на основе классификаций, выборок, группировок по различным признакам.


Литература

  Газета «Пермские губернские ведомости» № 80 – 90, 1909.

Галанин С.Ф. Реклама в Российских газетах второй половины XIX в. // http://www.m-economy.ru/art.php3?artid=20800.

Горбачева Н.Г., Корниенко С.И. Полнотекстовые историко-ориентированные информационные системы как средство сохранения историко-культурного наследия и развития научно-исторических исследований // Современные информационные технологии и письменное наследие: от древних текстов к электронным библиотекам: материалы Междунар. науч. конф. (Казань, 26-30 августа 2008 г.) / отв. ред. В.Д. Соловьев, В.А. Баранов. Казань: Изд-во Казан. Гос. Ун-та, 2008. С. 89-92.

Гуревич С.М. Номер газеты. Учебное пособие. – М.: Аспект Пресс, 2002.

Кузнецова Е.А. Информационная система «газета «Пермские губернские ведомости» как средство для сохранения и анализа объявлений.// http://lomonosov-msu.ru/archive/Lomonosov_2010/History/%D0%9A%D1%83%D0%B7%D0%BD%D0%B5%D1%86%D0%BE%D0%B2%D0%B0.pdf

Пигалева С.В., Корниенко С.И., Гагарина Д.А., Горбачева Н.Г. Газета «Пермские губернские ведомости» (1838 – 1844 гг.): проблемы сохранения и дальнейшего изучения // Вестник Пермского университета. Серия История. Вып. 7(23). – 2008. – С. 72-76.

Фличе Н., Ниппорт Р. Руководство для типографщиков. Ч.1. СПб., 1874. С. 139.

 
« Пред.   След. »