green_fr (green_fr) wrote,
green_fr
green_fr

Categories:

Деванагари

Сделал серию задачек на деванагари.
После корейского ожидал халяву - деванагари действительно очень простая письменность:
- пишем слева направо;
- есть знаки для слогов "согласная + А";
- есть знаки, меняющие гласную предыдущего знака (Unicode называет их "dependent vowels" - "зависимые гласные");
- есть особая "гласная" означающая "отмену предыдущей гласной".
- есть "независимые гласные" (пока что видел применения только для начала слова);
Вроде как всё. Первые две задачки на этом прокатили. Третья - нет...

Требуется написать слог "сви". Кодируется эта последовательность довольно очевидно: "са" + "отмена гласной" + "ва" + "замена гласной на и". А вот отрисовываться это должно так:
1) нарисовать знак "са";
2) "отмена гласной" пририсовывается обычно как аксантик под знаком;
3) но поскольку это ещё не конец слова, вместо 2) нужно склеить два "согласных" знака (лигатура), точнее склеить левую половинку первого знака с целым вторым;
4) приписать зависимую "И", которая является исключением и рисуется не сверху-снизу (что я уже видел в предыдущих задачах) и не справа (что выглядело бы просто как следующая буква), а слева от лигатуры.
Тут я серьёзно задумался о судьбе бедных программистов, реализовывавших это в шрифтах.

Проверил - шрифт Chrysanthi, справившийся с простыми задачками, забуксовал. Т.е. он просто тупо отрисовывал комбинацию "са" + "отмена гласной", затем "ва", затем (справа!) зависимую "и".
Arial Unicode MS рисует отлично (в очередной раз "Ура Майкрософту!"), но не поставляется бесплатно.
Перебрад ещё - только 4-й шрифт (Chandas) корректно отрисовывал этот слог.

Но при этом он рисовал некоторые знаки (NNA и независимую A) не так, как у меня в книжке. Смотрю на том же сайте лежит ещё один шрифт деванагари. Chandas - южный стиль, Uttara - северный. Проверил - действительно моя книга набрана северным стилем (Arial при этом, очевидно, реализует только одно написание, как выяснилось - южное).
Первая мысль - какой ужас! Никогда не встречал подобного. Два "принципиально" разных написания одного алфавита.
Потом вспомнил про "готический шрифт", который (в сегодняшнем понимании) есть не что иное, как альтернативная отрисовка стандартых латинских букв. И далеко не всегда тривиально опознаваемо.

Затем задумался о copy-paste. Выяснил, что лигатуры типа описанного выше "сви" копируются только целиком.
Тоже первая мысль "ужас", затем вспоминаю про букву "Ё", в которой нельзя скопировать только букву "Е". Или там "Ы". Мы просто привыкли.

Результат мне скорее нравится, единственное отличие в написании от "книжного" - склейка VA и JA в лигатурах (всё тот же "сви"). И южный, и северный варианты выглядят немного не так. Какие там ещё стороны света остались? Ладно, и так почти сутки на это убил...
Tags: unicode, лингвистика
Subscribe

  • Радиус 10 километров

    У нас через пару дней обещают снять ограничение на перемещение по стране, а пока ещё можно свободно перемещаться только в радиусе 10 километров…

  • Аукционы на билеты

    Началось! Получил мейл — не хочу ли я проапгрейдить свой билет на самолёт до бизнес-класса? Если хочу, то просят указать, сколько именно я согласен…

  • Увеличенная реальность

    Слушаю сейчас курс по Machine Learning (в двух словах: пока весело, но первые несколько недель слишком просто), мысли в основном о нейронных сетях.…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment