Школа 2009
Школа
Организационный комитет
Программный комитет
Направления работы школы
Основные даты
Регистрация и заявка
Конкурс
Конкурсные работы
Организационный взнос
Программа школы
Материалы школы
Участники школы
Организационная информация
Культурная программа
Фотогалерея





Забыли пароль?
Ещё не зарегистрированы? Регистрация
Сейчас на сайте находятся:
5 гостей
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

(c) "Информационные технологии и письменное наследие", 2008-2020

Материалы школы
Querying the PROIEL corpus with TigerSearch and other tools. Practical demonstration / Запрос корпуса PROIEL с помощью TigerSearch и других средств. Демонстрация PDF Печать E-mail
Автор(ы): Hanne Martine Eckhoff, Dag Haug   
04.10.2009 г.

 

Материалы к лекции (презентация)

In this session we show some preliminary studies based on data from the PROIEL corpus and demonstrate how simple queries can be done in the PROIEL application, and more sophisticated queries using external tools, such as TIGERSearch.

 
Automatic alignment and aspects of using parallel corpora / Автоматическое выравнивание и перспективы использования параллельных корпусов PDF Печать E-mail
Автор(ы): Hanne Martine Eckhoff, Dag Haug   
04.10.2009 г.

 

Материалы к лекции (презентация)

For the study of languages such as OCS, that are mainly extant in translation, an aligned parallel corpus is invaluable. In the PROIEL corpus, all the translations are automatically aligned with the Greek original at token level, with a success rate of about 97 %. In this lecture we discuss the automatic token aligner and demonstrate how the token alignments can be used in combination with multiple layers of annotation to do sophisticated contrastive work on the translation languages.

 
The PROIEL corpus’s architecture and annotation schemes. How can we make the most out of scanty data? / Архитектура корпуса PROIEL и схемы аннотирования. Как мы можем оптимально использовать недостаточное количество данных? PDF Печать E-mail
Автор(ы): Hanne Martine Eckhoff, Dag Haug   
04.10.2009 г.

 

Материалы к лекции (презентация)

In this lecture we explain the architecture of the PROIEL parallel corpus of New Testament texts. The corpus consists of the original Greek NT and its earliest translations into Indo-European languages: Latin, Gothic, Classical Armenian and Old Church Slavic (OCS). We will use examples mostly from OCS. We will look at file formatting for import, text processing and the many layers of annotation employed in the corpus: for morphology, syntax and information structure. We will also describe our system of free tags that in principle can be used by any scholar for any purpose: we will exemplify this by discussing our animacy tagging.

Practice session. In this practice session we import two chapters from the Gospel of Matthew from the Codex Zographensis and let the participants try out the PROIEL application for annotation in the various layers. 

 
Church Slavonic, Unicode, and OpenType: a practical approach / Церковнославянский язык, Юникод и OpenType: практический подход PDF Печать E-mail
Автор(ы): Achim Rabus   
04.10.2009 г.

 

Материалы к лекции (презентация)

As of now, there are numerous signs and graphemes occurring in Church Slavonic manuscripts that are not included in the Unicode standard. This can be explained by the fact that the Unicode consortium merely encodes characters, not glyph variants. However, the correct rendition of the latter is indispensible for the preparation of scientific editions of Church Slavonic and Old Russian texts, both in printed and in electronic form.

Rus. На данный момент существует огромное количество символов и графем, обнаруженных в церковнославянских рукописях, которые не включены в стандарт Юникода. Это можно объяснить тем фактом, что консорциум Юникод кодирует только символы, а не варианты глифа. Однако корректное изображение последнего обязательно для подготовки научных изданий церковнославянских и древнерусских текстов как в печатном, так и в электроном виде.

 
Проект «Реперториум»: знакомство со структурой данных и с основными функциональными возможностями PDF Печать E-mail
Автор(ы): Анисава Милтенова   
04.10.2009 г.
 
<< [Первая] < [Предыдущая] 1 2 3 4 [Следующая] > [Последняя] >>

Результаты 19 - 27 из 32