Текст печатного издания в формате PDF
В настоящее время для записи звучащей речи используется несколько систем знаков на основе разных алфавитов. Для русского языка ― это кириллица и латиница. Однако до сих пор не решен вопрос адекватной кодировки/декодировки речи в компьютерных системах. Кроме того, желание исследователей применить наборную транскрипцию для широкого круга задач с использованием информационных систем приводит к постоянному изменению и/или дополнению существующих перечней знаков. Поэтому задача адекватного перевода знаков одной транскрипционной системы в другую полностью не решена.
Целью нашей работы является составление транскрипционной бинарной латинско-кириллической системы на основе кодировки Unicode в соответствии с требованиями IPA (International Phonetic Alphabet).
Задачи: 1) выявление единства транскрипционных систем на основе латинского и кирилловского алфавитов; 2) сопоставление выявленных пар знаков с кодировкой Unicode; 3) выявление недостающих транскрипционных знакопар в системе IPA с адекватным (точным либо близким) значением; 4) «привязка» выявленных пар транскрипционных символов Unicode к одному кодовому значению.
Основной механизм работы состоит из двух этапов: 1) сопоставление транскрипционных знаков с аналогичным значением (например, ‘с’ кир. и ‘s’ лат. репрезентируют фонему ‘шумный щелевой глухой переднеязычный зубной согласный’); 2) установление связи типа «аналог».
Одной из проблем является то, что внешне схожие знаки в разных транскрипционных системах имеют разное значение. К примеру, знак ‘Λ’ кир. обозначает ‘безударный гласный первой степени редукции средне-нижнего подъема средне-заднего ряда’, а ‘Λ’ лат. — ‘неогубленный гласный средне-нижнего подъема заднего ряда’.
В тех случаях, когда не удается напрямую подобрать пару адекватных транскрипционных знаков, обращаемся к IPA. Сопоставление значений знаков в разных транскрипционных системах позволяет подобрать необходимый недостающий знак в одном из диапазонов Unicode. К примеру, такие транскрипционные знаки, как ‘ʦ’, ‘ʧ’ и ‘ʨ’, репрезентирующие аффрикаты, в кириллической (русской) традиции обозначаются знаками ‘ц’, ‘ч’ (= [тш]) и ‘ч’’ (= [т’ш’]) соответственно.
Однако подбор знаков с помощью IPA не всегда результативен, так как несколько знаков этой системы могут обозначать звуки, близкие по характеристикам, различающиеся лишь тонкими артикуляционными характеристикам. Например, символы, обозначающие гласные [ɒ] и [ɐ], имеют совпадающее характеристики ‘гласный заднего ряда нижнего подъема’, но различаются тем, что первый звук произносится без огубления, второй — лабиализован. На основе этого принимается решение о вводе в одну из транскрипционных систем дополнительного знака, если это диктуется фонетическими характеристиками звука или фонемы.
При отсутствии знака в IPA с необходимым для нас значением должна быть решена следующая задача ― необходимость создания комбинированных знаков на основе уже существующих знаков в кодировке Unicode.
Существенная проблема заключается и в том, где разместить такой комбинированный знак в кодировочной таблице. Это зависит, в частности, от того, какая из алфавитных систем принимается в качестве основной. Основной мы определи для себя транскрипцию на базе латиницы, поэтому именно в латинском диапазоне Unicode мы разместили глифы латинского и русского алфавитов.
В русском языке существуют также звуки, для которых ни в одной из имеющихся кодировок нет соответствующих символов. Для таких звуков созданы символы, содержащие в своем составе дополнительные значки, которые передают артикуляционные особенности этих звуков.
Таким образом, разработана система знаков, с помощью которой можно подготовить транскрипцию как на латинского и кирилловского алфавитов с возможностью транслитерации без потерь информации.
Этот набор транскрипционных символов используется для создания фонетического атласа русских говоров Удмуртии в лингвогеографической информационной системе «Диалект», созданной для систематизации и структурирования лексических и фонетико-фонологических особенностей говоров.
Summary
Drawing up transcribitional binary latin-cyrillic system on the basis of coding Unicode according to the requirements of IPA (International Phonetic Alphabet): 1) revealing of signed unit of the transcribitional systems designated above alphabets; 2) comparison of the revealed pairs marks to coding Unicode; 3) recognition and completion of missing transcribitional pairs token from system IPA with adequate (exact or close) value; 4) "binding" of the revealed pairs transcribitional symbols under coding Unicode to one code value.
Список литературы
Аванесов 1968 ― Аванесов, Р. И. Русское литературное произношение : учеб. пособие для студ. пед. ин-тов / Р. И. Аванесов. — М. : Просвещение, 1968. — 287 с.
Баранов и др. 1998 ― Баранов, В. А. Методические указания к диалектологической практике (для студентов филологического факультета) / В. А. Баранов, С. А. Никифорова, Н. Е. Якименко. — Ижевск : Удм. госун-т, 1998. — 82 с.
Суслов 1999 ― Суслов, И. П. Вариации на фонетическую тему // Лингвистический вестник. ― Вып. I. — Ижевск : Изд-во УдГУ, 1999. — С. 13 — 19.
Моисеев 1980 ― Моисеев, А. И. Русский язык: Фонетика. Морфология. Орфография : пособие для учителей / А. И. Моисеев. — М. : Просвещение, 1980. — 255 с.
Осипов 1984 ― Осипов, Б. И. Справочные таблицы к практическим занятиям по фонетике современного русского языка / Б. И. Осипов. — Ижевск : Изд-во УдГУ, 1984. — 14 с.
Руководство 1998 ― Руководство по фонетической транскрипции : методические указания для студентов филологического факультета / сост. Б. И. Осипов. — 2‑е изд., испр. и доп. — Омск : Омск. гос. ун-т, 1998. — 22 с.
IUC 2006 — Internationalization & Unicode Conference [Электронный ресурс]. — 2006. — Режим доступа: http://www.unicodeconference. org, свободный. ― Загл. с экрана.
UCL 2006 — UCL Dept of Phonetic & Linguistics [Электронный ресурс]. — 2006. — Режим доступа: http://www.phon.ucl.ac.uk, свободный. ― Загл. с экрана.
Unicode 2005 — Unicode [Электронный ресурс]. — 2005. — Режим доступа: http://www.unicode.org, свободный. ― Загл. с экрана.
WikipediA 2006 — WikipediA The Free Encyclopedia [Электронный ресурс]. — 2006. — Режим доступа: http://en.wikipedia.org/wiki/ Main_Page, свободный. ― Загл. с экрана.
|