El'Manuscript-10
Конференция
Организационный комитет
Программный комитет
Направления работы конференции
Направления работы школы
Основные даты
Регистрация и заявка
Организационный взнос
Программа конференции
Список участников
Материалы конференции
Проекты и ресурсы
Организационная информация
Культурная программа





Забыли пароль?
Ещё не зарегистрированы? Регистрация
Сейчас на сайте находятся:
1 гость
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

Портал зарегистрирован 05 августа 2010 г. в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) в качестве средства массовой информации, номер свидетельства ЭЛ № ФС 77 - 41581. Учредитель В. А. Баранов.

(c) "Информационные технологии и письменное наследие", 2008-2017

Мультимедийный корпус русского языка: опыт создания и использования PDF Печать E-mail
Автор(ы): Елена Александровна Гришина, Светлана Олеговна Савчук   
29.08.2010 г.
  
       The paper introduces theMultimodal Russian Corpus (MURCO), which has been created in the framework ofthe Russian National Corpus (RNC). The MURCO provides the users with the greatamount of phonetic, orthoepic, intonational information related to Russian.Moreover, the deeply annotated part of the MURCO contains the data concerningRussian gesticulation, speech act system, types of vocal gestures andinterjections in Russian, and so on. The total structure of MURCO, the types ofannotation and the possibilities of its usage in studying and teaching Russianare described.

Мультимедийныйкорпус русского языкаэто электронныйресурс, предназначенный для изучения звучащей речипогруженной» в обстоятельства ее произнесения.Основу корпуса составляют видео- и аудиозаписитекстов, выровненные с их расшифровками, что позволяет исследовать не только языковые единицы, но и речевые действия говорящего в различных ситуациях общения,и его неречевое поведение (мимику,жесты, позы). Подобноепредставление звучащей речи в виде корпусов для русского языка только начинается[см.: Степанова 2008, Гришина 2008], а в виде большого общедоступногокорпуса производится впервые [Гришина 2010].

Внастоящее время основу корпуса составляют видеоматериалы из отечественных фильмови аудиозаписи публичной и непубличной устной речи. Технология подготовки материалов для корпуса предполагает расшифровку видео и аудиоматериалов, произведенную с высокой степенью подробности (т.е. включая не только собственно слова,но и междометия, возгласы, а также оговорки); фрагментированиевидео и аудио материалов на относительносамостоятельные отрезки (длительностью от10 до 20 секунд); фрагментирование текстовых расшифровок, или транскриптов;выравнивание мультимедийных и текстовых фрагментов между собой.

Таким образом,единицей выдачи в мультимедийном корпусе служат единицы двух типов:1) текстовый фрагмент, соединенный гиперссылкойс соответствующим звуковым или мультимедийным фрагментом, эта единица условно называется клипотекстом, или кликстом и 2) мультимедийный фрагмент,содержащий некоторый жестовый материал, но не содержащий текст, т.е. клип из кинофильма.

Клипотекстыснабжены принятой в Национальном корпусе русского языка аннотациейморфологической, семантической,социологической, акцентологической.Поскольку разметка клипотектов стандартная, то по ним возможен обычный для Национального корпуса поискпо морфологическим, семантическим категориям,по социологическим параметрам и по их комбинации.

Наряду с  метатекстовой разметкой,которая относится к тексту как целому, каждый клипотекст или клип считается отдельным текстом и описываетсякак отдельный текст с точки зрения его автора, названия,даты создания, жанра, хронотопа и некоторых других.

Однако,кроме того, добавляются и другие,дополнительные характеристики, которыеи раскрывают в полной мере своеобразие мультимедийного корпуса по сравнению,например, со стандартным устным подкорпусом.Прежде всего, предлагается некоторая системапараметров, характеризующая речевую составляющую клипотекста.

o  тип ситуации

o  тип речевых действий(вопрос, просьба, извинение, совет и пр.)

o  полнота речевого действия(полное, незаконченное, прерванное)

o  манера говорения(нормальная речь, шепот, крик, диктовка)

o  наличие и типы повторов(однократный, многократный, переспрос, цитирование, передразнивание);

o  наличие и типы междометийи вокальных жестов (причмокивание,цоканье, присвистывание, подзывание и под.);

o  характеристика говорящих(количество, пол, язык, на котором говорят)

Кроме того,разработана система параметров, по которойописывается жестовая составляющая клипа и клипотекста.

o  орган,осуществляющий жест (рука, голова, туловище, нога)

o  активный орган(рука, голова, кисть, подбородок, глазаи т.д.);

o  пассивный орган рука,голова, грудь

o  адаптор(необходимая составляющая жеста, не являющаясячастью тела жестикулирующего, например, одежда при жесте «поправить пиджак»);

o  направление движенияактивного органа (вверх, вперед, назад, вбок, вниз, сверху, спереди, сзади,сбоку, снизу, покругу и пр.);

o  кратность жеста(однократный/многократный);

o  тип жеста(внутреннего состояния, дейктический,декоративный);

o  название жеста(покачать головой,закатить глаза, махнуть рукой);

o  тип коммуникативногодействия/тип внутреннего состояния (приветствие,извинение, прощание, согласие, отрицание, угроза, утешение и под.; нежность, удивление, радость, догадка и под.);

o  наличие удлинителя(напр., «головной убор» при жесте «прижатьруку к груди», если жестикулирующий держит шляпу в руке);

o  наличие спойлера(объекта, мешающего осуществлению жестав полной мере);

o  полнота жеста(полный, прерванный, трансформированный и т.д.);

o  аутентичность жеста(притворный, зеркальный, передразнивание и т.д.).

Уникальныйматериал и система разметки делают мультимедийный корпус мощным исследовательскими обучающим ресурсом. В чем его особенностьпо сравнению с существующими электронными ресурсами, которыедавно используются в преподавании, особенно в преподаваниииностранных языков, – аудиокурсами, мультимедийными пособиями, учебными фильмами?Прежде всего в том, что методика использованиясуществующих пособий ограничивается учебными задачами и предполагает в основномимитационные или имитационно-аналитические упражнения.Что касается корпуса, то в нем аудио-и видеоматериалы, выровненные с текстом,снабжены сложной лингвистической и металингвистической разметкойи снабжены инструментом поискаи это расширяет возможностиих использования. Корпус благодаря этому можно использоватьне только в учебных курсах, но и в научно-исследовательских целях. Сфера учебного использованиякорпуса также расширяетсяон будет полезен не только в  практическом, но и в теоретическом изучении языка в школьныхи вузовских курсах фонетики, орфоэпии, стилистики и культуры речи.

Другим недостаткомготовых мультимедийных пособий, так же каки печатных учебных пособий, является то, что в них заложена определенная методика, подборматериала отражает вкус и предпочтения автора. Случаи,когда такие пособия используются в обучении целиком, без изменений, крайне редки. Обычно преподаватель компилирует разные методические материалы при формированиисвоего курса. Корпус лишен этого недостатка готовых пособий.Он предоставляет огромный выбор материала и разные способы егоизвлечения и комбинации, которые можно использовать длясоставления заданий и упражнений практически любого типа от имитационных до творческих. Примеры такихзаданий с применением мультимедийного корпуса будут приведены в докладе.

Литература

Богданова Н.В. О корпусе текстов живой речи: новые поступления и первые результаты исследования // Труды международной конференции «Диалог2010» http://www.dialog-21.ru/dialog2010/materials/html/7.htm

Гришина Е.А. Мультимедийныйрусский корпус (МУРКО): проблемыаннотации // Национальный корпус русского языка:2006--2008. Новые результаты и перспективы. - СПб., 2009. С. 175-214 http://ruslang.academia.edu/ ElenaGrishina/ Papers

Гришина Е.А., СавчукС.О. Корпус звучащей русской речив составе Национального корпуса русского языка. Проект.// Трудымеждународной конференции «Диалог 2008» http://www.dialog-21.ru/dialog2008/materials/html/19.htm

Степанова С.Б., Асиновский А.С.,Богданова Н.В. и др. Звуковой корпус русского языка повседневногообщения «Один речевой день»: концепцияи состояние формирования // Труды международной конференции«Диалог 2008»  http://www.dialog-21.ru/dialog2008/materials/html/76.htm

Grishina, E. Multimodal Russian Corpus(MURCO): First Steps At:http://www.lrec-conf.org/proceedings/lrec2010/pdf/143_Paper.pdf

 
« Пред.   След. »