(6 часов лекционных занятий, 16–18 ноября 2015 г.)
Лекции1-2: «Многоярусное электронное издание
средневековых рукописей с использованием TEI и TXM» развивают
и дополняют вводные занятия по разметке
XML-TEI и по работе с платформой TXM.
В них представлен опыт применения
данных технологий для создания и эксплуатации изданий средневековых рукописей
на французском языке.
1. Введение. Из истории внедрения
электронных ресурсов в исследование языка и литературы средневековой Франции (тексты
как едва ли не единственный источник данных; оцифровка современных изданий; транскрипции
рукописей; комплексные электронные издания: проект Charrette )
2. Преимущества технологии XML-TEI (независимость
от конкретного программного обеспечения; относительная долговечность данных; возможность
обмена данными; детальная документация; многочисленное и активное сообщество
пользователей)
3. Ярусы транскрипции или представления
данных средневековой рукописи (нормализованный; дипломатический
(графематический) палеографический (аллографический))
4. Виды разметки:
4.1 Структура текста
(части текста, форма)
4.2 Палеографические данные (трудности
чтения, следы исправлений...)
4.3. Редактура (варианты, конъектуры,
исправления, комментарии)
4.4. Индексирование (имена собственные,
даты, события, ссылки на источники и соответствия)
4.5. Лингвистический анализ
5.Специфика формата XML: недопустимость
«перекрещивания» структур; способы кодирования «множества иерархий»; «отдельно
стоящая» разметка
6. Разметка романа «Поиск Грааля» :
«компактная» и «развернутая» разметка; решение проблем множества иерархий; морфологическая
и синтаксическая разметка
7. Возможности работы с интерактивным
электронным изданием: синоптическое чтение; поиск форм и мотивов: частотные
указатели и конкордансы; экспортирование результатов поиска; прогрессия; синтаксический
поиск
8. Заключение. Проект коллекции
«Средневековые источники» и готовящиеся издания
Лекция
3.
База средневекового французского языка
BFM: открытый ресурс для научных исследований и популяризаторской деятельности.
Данная лекция представляет историю
и современное состояние Базы средневекового французского языка BFM, одного из
крупнейших ресурсов для исследований языка и литературы Франции IX – XV вв.
Рассмотренные проблемы и
предлагаемые решения актуальны не только для средневековых французских текстов,
но и для создания и эксплуатации корпусов других языков и исторических эпох.
1.
История
создания и развития Базы средневекового французского (BFM): предпосылки, конкордансы
на CD-ROM (1990–2000), разметка XML-TEI, программа Weblex, открытие сайта
проекта (2000 — 2011), портал TXM (с 2012 г.)
2.
Доступ к
порталу BFM: общие и специальные правила пользования, функции, доступные без
регистрации, регистрация и расширенный доступ
3.
Принципы
отбора и описания текстов для BFM: максимальная репрезентативность в пределах
возможного, понятие текстовой единицы, автор и заглавие, дата создания текста и
дата рукописи, сфера и жанр, форма (проза, стихи, смешанная), диалект (скрипта)
автора и переписчика, источник (перевода, переработки)
4.
Работа с
метадаными на портале BFM: общий список и «паспорта» текстов, функция создания
подкорпуса: отбор по критериям, оценка размеров, функция разбивки, включение
метаданных в поисковые запросы и адреса вхождений
5.
Работа с
поисковой машиной: общий частотный словарь и указатель по запросу, переход к
конкордансу, переход к тексту (изданию), язык запросов CQL
6.
Экспорт
результатов запроса
7.
Работа с
офф-лайн версией корпуса: специфичность, факторный анализ, совместная
встречаемость
Литература.
Webography
Лаврентьев А.М.
Проблемы лингвистической разметки и анализа электронных критических изданий
текстов письменного наследия в стандарте XML-TEI // 4th International
conference on information technologies and textual heritage ”El’Manuscript-2012” / ed. Varfolomeev V.B.A. Petrozavodsk, Russia, 2012. P.
150–153. <https://halshs.archives-ouvertes.fr/halshs-00759376>
Лаврентьев А.М.
Влияние корпусных технологий на развитие диахронической лингвистики: пример
Франции // Иностранные языки в школе. 2014. № 8. P. 46–51. <https://halshs.archives-ouvertes.fr/halshs-01071863>
Guillot C. et al. La “ philologie numérique ” : tentative de
définition d’un nouvel objet éditorial // 27e Congrès international de
philologie et de linguistique romanes. Nancy, France, 2013. <https://halshs.archives-ouvertes.fr/halshs-00846767>
Lavrentiev A. Building diachronical reference corpora for the
French language // Corpus Linguistics 2013 / ed. Zakharov V. Saint-Petersbourg,
Russia: SPBGU, 2013. P. 60–67. <https://halshs.archives-ouvertes.fr/halshs-00846764>
Lavrentiev A., Markova E. From the Holy Grail to
the Good Health: a Digital Edition of a 15th Century French Medical Treatise on
the BFM Web Portal // Textual Heritage and Information Technologies. El’Manuscript
- 2014 / ed. Lavrentiev V.B.V.Z.A. Varna, Bulgaria: Cyrillo-Methodian Research
Center and Izhevsk University, 2014. P. 164–166. <https://halshs.archives-ouvertes.fr/halshs-01071459>
|