El'Manuscript '06
Konferencijos
Организационный комитет
Programos komitetas
Konferencijos darbo kryptys
Mokyklos veiklos kryptys ir temos
Pagrindinės datos
Registracija ir taikymas
Dalyvio mokestis
Программа конференции
Список участников
Konferencijos medžiaga
Проекты и ресурсы
Organizacinė Infromacija
Kultūrinė programa





Lost Password?
No account yet? Register
We have 1 guest online
RSS-ленты новостей
rss20.gif

Portalo kūrimą rėmė Rusijos humanitarinių mokslų fondas, projektas Nr. 07-04-12140в.

(c) "Informacinės technologijos ir rašytinis palikimas", 2008-2020

Учет регионального компонента на примере элементов шорской культуры и программы MS WORD PDF Print E-mail
Written by: Олег Анатольевич Соседко   
Пятница, 18 Июль 2008

Текст печатного издания в формате PDF  

Чаще всего разработчики программного обеспечения учитывают или популярные, или глобальные национальные приоритеты. В частности, русифицировано большинство программных продуктов для российских пользователей. Но мир языков многообразен. Например, в кузбасском регионе есть малая народность — шорцы, обладающая своей культурой и языком. Поэтому в настоящее время необходимо адаптировать программные продукты и для нужд представителей малых народов.

Чтобы понять, какие проблемы возникают перед пользователем-шорцем, нужно познакомиться с шорским алфавитом.

Современный шорский алфавит основан на кириллице, но имеет ряд специальных букв, в большинстве сходных в буквами тюркских алфавитов. Эти буквы имеют дополнительные элементы ― «хвостики», «черточки» или «двоеточие» над буквой.

Рис. 1. Современный шорский алфавит

Как видно, проблемой является ввод спецбукв, так как  для этих букв нет соответствующих клавиш на клавиатуре.

Проанализируем возможные решения проблемы.

1. Изменить наклейки тех клавиш, символы которых не используются в шорском языке. Перепрограммировать эти клавиши, чтобы при нажатии появлялись на экране эти спецсимволы. Иначе говоря, можно разработать по аналогии с русификатором программу «шорификатор». Недостаток этого способа состоит в том, что за компьютером работает не один, а несколько пользователей и переделка клавиатуры будет неудобна «нешорским» пользователям. А «шорификатор» без нужных клавиш ненагляден и тоже неудобен.

2. Текст набирают в текстовых редакторах. Самым популярным из них, без сомнения, является MS Word. И самое простое, что доступно пользователю, это вставка символа.

Рис. 2. Вид окна вставки символа

3. MS Word ― это многофункциональный редактор, поэтому можно создать макросы, привязанные к кнопкам на панели инструментов. Это автоматизация второго способа. Лучше использовать программы Office 2000/2003, так как  основные, самые популярные шрифты содержат расширенную кириллицу, в том числе особые шорские буквы. Достоинства этого способа состоят в удобстве ввода, хранения и печати. Недостатками являются: возможность хранения только в форматах DOC, RTF, HTML, необходимость сохранять настройки интерфейса в специальном DOT файле и переносить его на другой компьютер, необходимость учитывать совместимость разных версий, в противном случае произойдет потеря спецбукв или их замена на другие, в том числе на латинские. На воспроизведение буквы на значке пиксельной матрицы после записи макроса нужно время.

4. В редакторе MS Word можно использовать автозамену, например, «гъ» заменять на ғ.

Рис. 3. Вид окна автозамены.

Явный недостаток этого способа в нерациональности: чтобы ввести один символ, нужно сделать четыре нажатия на клавиатуре: буква «г», буква «ъ», «пробел», «влево».

5. До появления программ Office 2000 специалисты по шорскому языку и другим тюркским языкам использовали другой подход. В конце двадцатого века был разработан специальный шрифт Siberia, в котором присутствовала часть шорского алфавита. Чтобы ввести символ, надо, как в первом способе, сделать вставку, выбрать шрифт Siberia, среди символов найти нужный, нажать «Вставить», закрыть окно вставки. Но при передаче файла на компьютер, на котором не было Siberia, шорские буквы пропадали.

6. В настоящее время разрабатывается и постоянно пополняется шрифт UNICODE, который в итоге должен содержать глифы символов любого языка мира. Шрифт UNICODE основан на четырехбайтовой кодировке, но это не значит, что каждая буква представляется четырьмя числами символов. Самые популярные, часто используемые в мире символы имеют меньше кодов для своей записи. Для латинского алфавита, как и прежде, используется однобайтовое кодирование, если его ASCII-код меньше 128. Затем идет большой раздел двухбайтового соответствия. В этом диапазоне находятся также полностью и русский, и шорский алфавиты.

Чтобы набрать букву этих алфавитов, надо знать соответствующие таблицы кодирования формата UTF8. Их можно узнать как в справочниках, так и в Интернете, например, по адресу http://titus.uni-frankfurt.de/unicode/unitest.htm. Каждый символ должен записываться двумя числами. Это можно делать с помощью цифровых клавиш на малой клавиатуре при нажатой клавише ALT. Например, букве «ғ» соответствует четырехзначный код 1171. Этот медленный способ и требует наличия на компьютере современного стандарта UNICODE UTF8, присутствующего в операционных системах Windows 2000, XP, 2003 и в их офисных программах.

Каждый из способов ввода символов имеет свои достоинства и недостатки, поэтому каждый пользовать решает, как вводить, редактировать и хранить национальный шорский текст[1].



[1] Соседко 2003 ― Соседко, О. А. Особенности обработки шорских текстов / О. А. Соседко // Повышение качества профессиональной подготовки будущего учителя информатики : сб. науч. тр. — Новокузнецк : КузГПА, 2003.

 
< Prev   Next >