El'Manuscript-2015
Research School
Organizational committee
Program Committee
Topic areas
Lecturers of the school
Important Dates
Registration and request
The registration fee
School program
School content
School Information





Lost Password?
No account yet? Register
RSS-feed
rss20.gif

The project is supported by the Russian Foundation for Basic Research, project #07-04-12140в

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов. 

(c) "Information Technologies and Textual Heritage", 2008-2016

МНОГОЯРУСНОЕ ЭЛЕКТРОННОЕ ИЗДАНИЕ СРЕДНЕВЕКОВЫХ РУКОПИСЕЙ С ИСПОЛЬЗОВАНИЕМ TEI И TXM & БАЗА СРЕДНЕВЕКОВОГО ФРАНЦУЗСКОГО ЯЗЫКА BFM: ОТКРЫТЫЙ РЕСУРС ДЛЯ НАУЧНЫХ ИССЛЕДОВАНИЙ И ПОПУЛЯРИЗАТОРСКОЙ ДЕЯТЕЛЬНОСТИ PDF Print E-mail
Written by: Алексей Михайлович Лаврентьев   
Воскресенье, 25 Октябрь 2015

(6 часов лекционных занятий,  16–18 ноября 2015 г.)

Лекции1-2: «Многоярусное электронное издание средневековых рукописей с использованием TEI и TXM» развивают и дополняют вводные занятия  по разметке XML-TEI и по работе с платформой TXM.

В них представлен опыт применения данных технологий для создания и эксплуатации изданий средневековых рукописей на французском языке.

1. Введение. Из истории внедрения электронных ресурсов в исследование языка и литературы средневековой Франции (тексты как едва ли не единственный источник данных; оцифровка современных изданий; транскрипции рукописей; комплексные электронные издания: проект Charrette [1])

2. Преимущества технологии XML-TEI (независимость от конкретного программного обеспечения; относительная долговечность данных; возможность обмена данными; детальная документация; многочисленное и активное сообщество пользователей)

3. Ярусы транскрипции или представления данных средневековой рукописи (нормализованный; дипломатический (графематический) палеографический (аллографический))

4. Виды разметки:

4.1 Структура текста (части текста, форма)

4.2 Палеографические данные (трудности чтения, следы исправлений...)

4.3. Редактура (варианты, конъектуры, исправления, комментарии)

4.4. Индексирование (имена собственные, даты, события, ссылки на источники и соответствия)

4.5. Лингвистический анализ

5.Специфика формата XML: недопустимость «перекрещивания» структур; способы кодирования «множества иерархий»; «отдельно стоящая» разметка

6. Разметка романа «Поиск Грааля» [2]: «компактная» и «развернутая» разметка; решение проблем множества иерархий; морфологическая и синтаксическая разметка

7. Возможности работы с интерактивным электронным изданием: синоптическое чтение; поиск форм и мотивов: частотные указатели и конкордансы; экспортирование результатов поиска; прогрессия; синтаксический поиск

8. Заключение. Проект коллекции «Средневековые источники» и готовящиеся издания

 

Лекция 3. База средневекового французского языка BFM: открытый ресурс для научных исследований и популяризаторской деятельности.

Данная лекция представляет историю и современное состояние Базы средневекового французского языка BFM, одного из крупнейших ресурсов для исследований языка и литературы Франции IX – XV вв.

Рассмотренные проблемы и предлагаемые решения актуальны не только для средневековых французских текстов, но и для создания и эксплуатации корпусов других языков и исторических эпох.

1.    История создания и развития Базы средневекового французского (BFM): предпосылки, конкордансы на CD-ROM (1990–2000), разметка XML-TEI, программа Weblex, открытие сайта проекта (2000 — 2011), портал TXM (с 2012 г.)

2.    Доступ к порталу BFM: общие и специальные правила пользования, функции, доступные без регистрации, регистрация и расширенный доступ

3.    Принципы отбора и описания текстов для BFM: максимальная репрезентативность в пределах возможного, понятие текстовой единицы, автор и заглавие, дата создания текста и дата рукописи, сфера и жанр, форма (проза, стихи, смешанная), диалект (скрипта) автора и переписчика, источник (перевода, переработки)

4.    Работа с метадаными на портале BFM: общий список и «паспорта» текстов, функция создания подкорпуса: отбор по критериям, оценка размеров, функция разбивки, включение метаданных в поисковые запросы и адреса вхождений

5.    Работа с поисковой машиной: общий частотный словарь и указатель по запросу, переход к конкордансу, переход к тексту (изданию), язык запросов CQL

6.    Экспорт результатов запроса

7.    Работа с офф-лайн версией корпуса: специфичность, факторный анализ, совместная встречаемость

Литература. Webography

Лаврентьев А.М. Проблемы лингвистической разметки и анализа электронных критических изданий текстов письменного наследия в стандарте XML-TEI // 4th International conference on information technologies and textual heritage ”El’Manuscript-2012” / ed. Varfolomeev V.B.A. Petrozavodsk, Russia, 2012. P. 150–153. <https://halshs.archives-ouvertes.fr/halshs-00759376>

Лаврентьев А.М. Влияние корпусных технологий на развитие диахронической лингвистики: пример Франции // Иностранные языки в школе. 2014. № 8. P. 46–51. <https://halshs.archives-ouvertes.fr/halshs-01071863>

Guillot C. et al. La “ philologie numérique ” : tentative de définition d’un nouvel objet éditorial // 27e Congrès international de philologie et de linguistique romanes. Nancy, France, 2013. <https://halshs.archives-ouvertes.fr/halshs-00846767>

Lavrentiev A. Building diachronical reference corpora for the French language // Corpus Linguistics 2013 / ed. Zakharov V. Saint-Petersbourg, Russia: SPBGU, 2013. P. 60–67. <https://halshs.archives-ouvertes.fr/halshs-00846764>

Lavrentiev A., Markova E. From the Holy Grail to the Good Health: a Digital Edition of a 15th Century French Medical Treatise on the BFM Web Portal // Textual Heritage and Information Technologies. El’Manuscript - 2014 / ed. Lavrentiev V.B.V.Z.A. Varna, Bulgaria: Cyrillo-Methodian Research Center and Izhevsk University, 2014. P. 164–166. <https://halshs.archives-ouvertes.fr/halshs-01071459>


[1] Комплексное мультимедийное издание рукописной традиции романа Кретьена де Труа «Рыцарь телеги» (“Chevalier de la charrette”), получившее название проект «Charrette» (1990–2003 гг., Принстонский уни верситет) осуществлен под руководством профессора К. Ютти (K. Uitti)

[2] Интерактивное издание анонимного романа XIII в. «Поиски Святого Грааля» («La Queste del saint Graal») http://txm.bfm-corpus.org/?command=documentation&path=/GRAAL

 
< Prev   Next >