Введение в текстометрию и платформу TXM
Автор(ы): Алексей Михайлович Лаврентьев   
07.08.2014 г.

Лекции

Лекция 1. Лекция 2.

Текстометрия — это методика компьютеризированного исследования текстовых данных, сочетающая инструменты количественного и качественного анализа. Она позволяет использовать различные виды структурной и аналитической разметки, присутствующей в корпусе или создающейся автоматически в процессе импортирования данных.

TXM — это свободно распространяемая межплатформенная среда и графический клиент для анализа отдельных текстов или корпусов, поддерживающая кодировку Unicode и XML разметку, работающая в операционных системах Linux, Windows и Mac OS X. Она также может использоваться через интернет с помощью веб-портала, отвечающего стандарту J2EE (на платформе GWT) с поддержкой контроля доступа.

TXM предлагает широкий набор инструментов анализа (конкордансы, поиск совместной встречаемости, частотные словари и т. д.), основанных на возможностях поисковой машины CQP (http://cwb.sourceforge.net), и на ряде статистических функций (факторный анализ, классификация, анализ совместной встречаемости и т. д.), реализованных в виде пактов R

Подробное описание платформы (на английском языке) можно прочитать на странице инструментов TEI

Научная и методологическая база проекта представлена на сайте проекта Textométrie (на английском и французском языках):

Первое занятие будет посящено демонстрации основных инструментов TXM на материале заранее установленных корпусов на русском и/или на английском языках.