Лекции
Лекция 1. Лекция 2.
Текстометрия
— это методика компьютеризированного исследования текстовых данных, сочетающая
инструменты количественного и качественного анализа. Она позволяет использовать
различные виды структурной и аналитической разметки, присутствующей в корпусе
или создающейся автоматически в процессе импортирования данных.
TXM —
это свободно распространяемая межплатформенная среда и графический клиент для
анализа отдельных текстов или корпусов, поддерживающая кодировку Unicode и XML
разметку, работающая в операционных системах Linux, Windows и Mac OS X. Она
также может использоваться через интернет с помощью веб-портала, отвечающего
стандарту J2EE (на платформе GWT) с поддержкой контроля доступа.
TXM
предлагает широкий набор инструментов анализа (конкордансы, поиск совместной
встречаемости, частотные словари и т. д.), основанных на возможностях
поисковой машины CQP (http://cwb.sourceforge.net), и на ряде статистических
функций (факторный анализ, классификация, анализ совместной встречаемости и
т. д.), реализованных в виде пактов R
Подробное
описание платформы (на английском языке) можно прочитать на странице
инструментов TEI
Научная
и методологическая база проекта представлена на сайте проекта Textométrie (на
английском и французском языках):
Первое
занятие будет посящено демонстрации основных инструментов TXM на материале
заранее установленных корпусов на русском и/или на английском языках.
|