Школа 2009
Школа
Организационный комитет
Programos komitetas
Mokyklos veiklos kryptys ir temos
Pagrindinės datos
Registracija ir taikymas
Конкурс
Конкурсные работы
Dalyvio mokestis
Программа школы
Mokyklos medžiaga
Участники школы
Organizacinė Infromacija
Kultūrinė programa
Фотогалерея





Lost Password?
No account yet? Register
RSS-ленты новостей
rss20.gif

Portalo kūrimą rėmė Rusijos humanitarinių mokslų fondas, projektas Nr. 07-04-12140в.

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов. 

(c) "Informacinės technologijos ir rašytinis palikimas", 2008-2016

Automatic alignment and aspects of using parallel corpora / Автоматическое выравнивание и перспективы использования параллельных корпусов PDF Print E-mail
Written by: Hanne Martine Eckhoff, Dag Haug   
Воскресенье, 04 Октябрь 2009

 

Материалы к лекции (презентация)

For the study of languages such as OCS, that are mainly extant in translation, an aligned parallel corpus is invaluable. In the PROIEL corpus, all the translations are automatically aligned with the Greek original at token level, with a success rate of about 97 %. In this lecture we discuss the automatic token aligner and demonstrate how the token alignments can be used in combination with multiple layers of annotation to do sophisticated contrastive work on the translation languages.

 
< Prev   Next >