Введение в текстометрию и платформу TXM |
Автор(ы): Алексей Михайлович Лаврентьев | |
07.08.2014 г. | |
Лекции Лекция 1. Лекция 2. Текстометрия — это методика компьютеризированного исследования текстовых данных, сочетающая инструменты количественного и качественного анализа. Она позволяет использовать различные виды структурной и аналитической разметки, присутствующей в корпусе или создающейся автоматически в процессе импортирования данных. TXM — это свободно распространяемая межплатформенная среда и графический клиент для анализа отдельных текстов или корпусов, поддерживающая кодировку Unicode и XML разметку, работающая в операционных системах Linux, Windows и Mac OS X. Она также может использоваться через интернет с помощью веб-портала, отвечающего стандарту J2EE (на платформе GWT) с поддержкой контроля доступа. TXM предлагает широкий набор инструментов анализа (конкордансы, поиск совместной встречаемости, частотные словари и т. д.), основанных на возможностях поисковой машины CQP (http://cwb.sourceforge.net), и на ряде статистических функций (факторный анализ, классификация, анализ совместной встречаемости и т. д.), реализованных в виде пактов R Подробное описание платформы (на английском языке) можно прочитать на странице инструментов TEI Научная и методологическая база проекта представлена на сайте проекта Textométrie (на английском и французском языках): Первое занятие будет посящено демонстрации основных инструментов TXM на материале заранее установленных корпусов на русском и/или на английском языках. |