El'Manuscript-14
Конференция
Организационен комитет
Програмен комитет
Направления на работата на конференцията
Направления за работа и теми на школата
Ключови дати
Условия за участие
Такса
Участниците в конференцията
Програмата на конференцията
Материали от конференцията
Програма на семинара
Материали от семинари
Организационна информация
Културна програма
Фото-репортаж





Забравена парола
Нямате достъп?
Регистрирайте се!!!
В момента 5 госта онлайн
RSS-емисии
rss20.gif

Порталът е създаден с финансовата подкрепа на Руската хуманитарна фондация (RHF), номер на проекта 07-04-12140v.

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов. 

(с) "Информационните технологии и писменото наследство", 2008-2016 г.

Об одном методе автоматической грамматической разметки старопечатных текстов PDF Печат Е-мейл
Автор: Артем Викторович Андреев   
07 Сентябрь 2014
A method is proposed for unsupervised morphosyntactic markup of old texts for which no exact grammar nor vocabulary may be known. The method employs building all possible mappings from text forms into grammemes and then reducing them using a loose context-free (CF) grammar. The forms are further lemmatized based on minimization of morphologic variation. The method has been tested on two old Lithuanian documents from the late 16th century by M. Dauksha and has proven to be rather efficient and accurate (up to 80 %). icon andreev_elmanuscript2014 (594.8 kB)
 
< Предишна   Следваща >