Забыли пароль?
Ещё не зарегистрированы? Регистрация
Сейчас на сайте находятся:
2 гостей
RSS-ленты новостей
rss20.gif

Портал был создан при финансовой поддержке Российского гуманитарного научного фонда (РГНФ), проект № 07-04-12140в.

(c) "Информационные технологии и письменное наследие", 2008-2020

ПРЕДСТАВЛЕНИЕ МОДЕЛЕЙ СИНТАКСИЧЕСКОЙ СТРУКТУРЫ ПОЭЗИИ П. А. ВЯЗЕМСКОГО С ПОМОЩЬЮ ТЕХНОЛОГИИ XML PDF Печать E-mail
Автор(ы): Алексей Геннадьевич Варфоломеев, Николай Дмитриевич Москин, Александр Александрович Лебедев   
27.08.2012 г.
Summary. This article shows how XML technology can be used to represent the syntactic structure of P.A.Vyazemsky poetry.

Сложное предложение в современной лингвистике является объектом пристального научного интереса. Одна из немаловажных проблем, актуальных для данной сферы исследования ― типологизация сложных предложений, описание их структуры и составляющих. Исследователи-грамматисты отмечают, что «трудности, с которыми сталкивается синтаксическая наука при решении проблем типологии сложного предложения, начинаются уже на первых этапах классификации» [Мишланов, 1996]. В связи с этим ощущается потребность в создании некоего механизма, позволяющего размечать сложные предложения с точки зрения их структуры, что облегчило бы их последующий анализ, установление взаимосвязей между частями предложения, а также определение роли того или иного сложного предложения в тексте произведения или в целом в творчестве писателя.

Механизм разметки сложных предложений разрабатывался для анализа творчества Петра Андреевича Вяземского, талантливого поэта XIX века. Выбор творчества данного поэта объясняется тем, что именно интеллектуальность поэзии, её глубина стала отличительной чертой творчества Вяземского; стремление к выстраиванию причинно-следственных, глубинных связей, нехарактерное для лирики в целом, нашло широкое отражение в творчестве этого выдающегося автора и мыслителя. Немаловажную роль в оформлении сверхсодержательности и интеллектуальности поэзии Вяземского сыграли именно сложные предложения.

Предлагаемый нами подход основан на способе связи между компонентами сложного предложения; основной критерий для разделения предложений ― наличие или отсутствие союза. В том случае, если союз в предложении присутствует, предложения делятся на сложносочиненные и сложноподчиненные, в зависимости от типа союза и характера отношений между частями сложного предложения. Для русистики данный подход является традиционным, поскольку в русском языке существует особый класс служебных слов ― союзов, а тип союза позволяет с большой точностью отнести предложение к сложносочиненным или сложноподчиненным.

В соответствии с этим подходом все сложные предложения делятся на:

1) бессоюзные (при отсутствии союза),

2) союзные (при наличии союза).

a. Сложносочиненные (сочинительная связь между частями предложения)

b. Сложноподчиненные (подчинительная связь между частями предложения).

Для поэтической лирики характерно употребление сложных предложений с разными видами связи, с большим количеством грамматических основ, взаимоотношения между которыми не всегда можно истолковать однозначно. Именно поэтому механизм, позволяющий выстраивать структуру сложного предложения, является прекрасным подспорьем для лингвиста, исследующего синтаксис того или иного автора, а также смежные вопросы, связанные с синтаксисом (языковая личность автора, идиостиль писателя, исследования языковой игры и т.п.). Подробнее см. работы Ю.Н.Караулова, В.В.Григорьева, В.З.Санникова и др.

В качестве примера рассмотрим фрагмент стихотворения П. А. Вяземского «Вечер на Волге» (1815 год), в котором индексами выделены части предложения:

 

[ Их гений мужествен, как гений вод твоих ]1,

[ Когда гроза во тьме клубится над тобою ]2

[ И пеною кипят громады волн седых; ]3

[ Противник наглых бурь, он злобе их упорной

Смеется, опершись на брег, ему покорный; ]4

[ Обширен их полет ]5, [ как бег обширен твой; ]6

[ Как ты, сверша свой путь, назначенный судьбой,

В пучину Каспия мчишь воды обновленны, ]7

[ Так славные их дни, согражданам священны,

Сольются, круг сверша, с бессмертием в веках! ]8

 

Теоретико-графовая модель синтаксической структуры этого предложения представлена на рис. 1. Важным отличием подобных моделей является иерархическая организация графа. Так, вершина под номером 1 соединена с графом, образованным вершинами с номерами 2 и 3 (такие графы выделены пунктиром). Кроме этого, связи делятся на два типа: направленные (например, от 5 к 6) и ненаправленные (например, от 2 к 3). Подобные схемы можно построить для всех предложений стихотворения и объединить их общей фиктивной вершиной.

 

Рис. 3. Модель синтаксической структуры предложения
«Их гений мужествен, как гений вод твоих»

Заметим, что в компьютерной лингвистике уже достаточно давно известны методы представления синтаксической структуры текстов в виде графов (деревьев). Например, в работе И.П.Севбо [Севбо, 1983] приводится описание так называемых деревьев зависимостей. Здесь при анализе предложения устанавливаются подчинительные связи между словами согласно постулатам традиционной грамматики и грамматики зависимостей. Результаты анализа представляются в виде графов, вершины которых соответствуют словам, а дуги соединяют их в соответствии с синтаксическими связями. Такие модели обычно используются в описаниях текстов на языках со свободным порядком слов (например, русском).

Для хранения и дальнейшего анализа подобных графов мы предлагаем использовать технологию XML. В настоящее время разработано несколько XML-стандартов описания графов и графовых моделей. Одним из предшественников таких форматов является язык GML (Graph Modelling Language) [Himsolt, 1997]. Впоследствии на базе GML были созданы другие форматы, например, XGMML (eXtensible Graph Markup and Modeling Language). В 2000 году на 8-ом симпозиуме «Graph Drawing» был предложен язык описания графов GraphXML [Herman, 2001]. На этом языке могут быть описаны как абстрактные графы, так и более сложные структуры: иерархии графов, динамические графы и т. д. Позднее появились и другие спецификации: GraphML (Graph Markup Language), GXL (Graph eXchange Language), GraX и др. [Москин, 2009]

Однако данные форматы предназначены для описания произвольных графов и графовых моделей, не привязанных к тексту. Поэтому возникла необходимость разработки языка для формального описания и анализа теоретико-графовых моделей текстов ― TextGML (Textual Graph Modelling Language) [Москин, 2009]. Рассмотрим, как можно применить этот язык для разметки синтаксической структуры стихотворений П.А.Вяземского. Каждый граф здесь задается с помощью тега <graph> с уникальным идентификатором id, названием name и атрибутом directed, указывающим будет ли граф ориентированным (например, на рис. 1 таких графов ― пять).

Для разметки частей предложения используется тег <node>, например: <node id="id1" name="n1" type="часть предложения">Их гений мужествен, как гений вод твоих</node>. Связи определяются с помощью тега <link>, например: <link id="l6" source="n7" target="n8" type="СПП с придаточной сопоставительной частью" order="6"/>. В качестве значений атрибутов source и target используются названия инцидентных вершин (атрибут name).

Для организации иерархической структуры графа применяются фиктивные вершины с атрибутом id_graph:

<node id="id11" name="n11" type="graph" id_graph="g4"/>

....................

<graph id="g4" name="объединение вершин-3" directed="true">

<link id="l4" source="n5" target="n6" type="СПП с придаточным собственно-сравнительным" order="4"/>

</graph>

Для ввода текстов и моделей их синтаксической организации в электронную коллекцию, а также дальнейшей разметки и анализа необходимо специализированное программное обеспечение. Решением этой проблемы мог бы стать специализированный Интернет-ресурс, реализованный на языке PHP. Он позволил бы вводить XML-документы в базу данных, визуализировать структуру моделей, проводить поиск по коллекции и сравнительный анализ графов. Данный ресурс может быть полезен для организации распределенных научных исследований в сети Интернет и публикации их результатов в рамках деятельности сетевых сообществ исследователей.

Работа выполнена при финансовой поддержке Программы стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию научно-исследовательской деятельности.

Список литературы

Мишланов, 1996 ― Мишланов В.А. Семантика и структура сложного предложения в свете динамического синтаксиса. Пермь, 1996.

Москин, 2009 ― Москин Н.Д. Решение задач визуализации и поиска мотивов в электронной библиотеке фольклорных текстов // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды ХI Всероссийской конференции RCDL'2009. Петрозаводск, 2009. C. 465–471.

Севбо, 1981 ― Севбо И.П. Графическое представление синтаксических структур и стилистическая диагностика. Киев, 1981.

Himsolt, 1997 ― Himsolt M. GML: A portable Graph File Format // Technical report. University at Passau, 1997.

Herman, 2001 ― Herman I., Marshall M. S. GraphXML ― An XML-based graph description format // Proceedings of Graph Drawing 2000. LNCS, Vol. 1984. Springer: Berlin, 2001. Pp.52–62.
 
« Пред.   След. »