green_fr (green_fr) wrote,
green_fr
green_fr

Хирагана

В апреле собираемся к друзьям в Японию, начал учить язык. Меня, очевидно, больше всего интересует письменность. И с ней японцы не подвели, оправдали свой имидж инопланетян :-)
Известно, что письменность у них состоит как минимум из трёх разных кусочков:
  • кандзи — заимствованные из китайского иероглифы: смысл тот же, пишутся так же, читаются совершенно по-другому. К этой части я пока что даже не думал подступаться...
  • хирагана — слоговая азбука, используемая для того, чего нет в кандзи. Например, для грамматики — японские глаголы имеют разные окончания в разных формах, эти формы записываются хираганой после корня кандзи. Плюс, в детских книжках можно писать слова кандзи хираганой. В более продвинутых детских книжках (таких, как мой учебник) над каждым знаком кандзи можно записать его произношение хираганой.
  • катакана — ещё одна слоговая азбука, в точности для тех же слогов, просто, чтобы иметь две :-) На практике используется для записи иностранных слов, для смыслового выделения и пр. — очень похоже на использование у нас курсива.
Наряду с этим есть какие-то иероглифы, которые были придуманы в Японии (не имеют китайских предков), в тексте могут использоваться латинские буквы, есть свои цифры, но арабские тоже в ходу, свои знаки препинания — учить очень весело. Я пока что на хирагане.


С хираганой ты сталкиваешься с самого начала. Вот, например, глагол «кушать» (с него, мне кажется, нужно начинать изучение любого языка) в инфинитиве (японские знаки я буду писать очень крупно, чтобы непривычный взгляд мог рассмотреть все закорючки):
食べる
Первый символ — это кандзи, китайский иероглиф, обозначающий «кушать». По-японски он читается «ta», а инфинитив читается как «taberu», и два следующих символа — это как раз хирагана для «be» и «ru».
А вот этот же глагол в «обычной» форме — она соответствует «кушаю», «кушаешь», «кушает» и многим другим (в японском есть понятие спряжения, но оно отличается от русского):
食べます
Видно, что корень остался тем же, как и в русском языке при спряжении изменилось лишь окончание, эта форма читается как «tabemasu» (точнее, произносится «табемас» — не только у русских с их «суши / суси» есть флеймы о том, как правильно транскрибировать японский текст).
В моём учебнике подразумевается, что рано или поздно ученик запомнит 46 знаков хираганы, а вот тысячи кандзи сразу считаются вне досягаемости, поэтому последняя форма пишется как:
べます
Над кандзи появляется транскрипция хираганой (это называется «фуригана»), символ «ta».


Мне немедленно стало интересно, как всё это поддерживается в Unicode. И действительно, Unicode предусматривает три специальных символа: FFF9 — начало текста кандзи, FFFA — начало транскрипции хираганой и FFFB — конец всего блока. Точнее даже, эти символы были придуманы не исключительно для японского языка, а в общем случае для аннотации текста сверху другим текстом. Символы эти придуманы, но никем не поддерживаются (я проверил на своём компе).

Зато HTML поддерживает таг <ruby>, этим тагом я и набирал этот пост.

История термина ruby тоже прекрасна. Изначально у британских типографов ruby назывался мелкий шрифт, которым они в частности набирали аннотации к японским символам. В Америке шрифт, использовавшийся для тех же целей, назывался agate. Японцы переняли британский термин ruby, обозначив им уже шрифт, использующийся исключительно для фуриганы, записывая его японскими символами (катаканой). Из японского слово вернулось в английский, но уже по правилам транскрипции японских слов, то есть rubi. Бардак усугубился тем, что в стандарт HTML таг вошёл в версии ruby, но я уже не вижу ничего удивительного в том, что в русской википедии статья, ведущая с Ruby character называется «Агат (кегль)».


В хирагане есть нечто, похожее на диакритику — грубо говоря, берём букву, приписываем над ней пару точек и получаем букву, немного отличающуюся в прочтении. Как русские «е» и «ё». Например, добавив две чёрточки к слогу со звуком «к», мы получим слог со звуком «г»:
(ka) -> (ga)
Unicode предлагает как отдельный символ для «ga» (304C), так и специальный символ «добавить вон те две чёрточки к предыдущему знаку» (3099), который можно написать после «ka» (304B), чтобы получить в точности тот же результат:
(ga) が (ka + две чёрточки)
Этот же символ используется для того, чтобы превратить слоги с «с» в слоги с «з», слоги с «т» в слоги с «д». В тот момент, когда к читателю приходит озарение «да это же просто знак перехода от глухой согласной к звонкой!», он видит, что точно так же из слогов с «х» получаются слоги с «б»:
(sa) -> ざ (za), (ta) -> だ (da), (ha) -> ば (ba)
А на закуску ещё один символ (309A), который превращает слоги с «х» в слоги в «п»:
(ha) -> ぱ (pa)


Помимо стандартных слогов «согласная + гласная» в хирагане есть, очевидно, знаки для одиноких гласных: (a), (i), (u), (e) и  (o).
Плюс, менее очевидно, знак для одинокой буквы «н»: .


Не все варианты «согласная + гласная» существуют. Например, для «д» есть формы «da», «de» и «do», но нет «di» и «du». Более того, некоторые согласные смешиваются — в одном ряду стоят «sa», «shi», «su», «se» и «so». Аналогично «ta», «chi», «tsu», «te» и «to». Частично это можно списать на несовершенство транслитерации, но пример ниже с «с» и «ш» показывает, что не только в транслитерации дело.


У некоторых знаков есть малая и большая формы. Но смысл у них не такой, как у заглавных и прописных букв в кириллице или латиннице. Если знак пишется маленьким, значит он читается не как обычно, а выступает в качестве модификатора соседнего знака.

Например, как мы видели выше, для «ш» есть только форма «shi». Для «sha» есть хитрость: если написать «shi», а затем приписать маленький «ya» (в Unicode это рассматривается как отдельная буква, 3084 для обычной ya и 3083 для маленькой), то всё вместе будет читаться как «sha».
しゃ (sha) しや (shiya) — примеры дурацкие, просто для иллюстрации.
Аналогично «shi» + маленькое «yo» = «sho», «shi» + маленькое «yu» = «shu». Аналогично с «ч» — «cho», «cha», «chu». И даже «ryo», «ryu» и «kyo», «kyu» — везде берётся слог на «i» и приписывается маленький слог с «y».

А ещё, если знак «u» идёт непосредственно за слогом, заканчивающимся на «o», то это «о» читается как «о длинное» (транскрибируется как «ô»). И это правило, конечно же, суммируется с предыдущим. Таким образом, чтобы написать «shô», мы пишем «shi» + «маленькое yo» + «u»:
(shi) しょ (sho) しょう (shô)

Или вот: есть знак (tsu). А если его написать маленьким — , то это означает удвоение следующей согласной:
いっか (ikka) いつか (itsuka).


Это я пока что на 20 уроке...
Tags: japon, unicode, письменности
Subscribe

  • Pour la science № 526 — деликатные простые числа

    Люблю, когда два разных источника одновременно рассказывают тебе об одном и том же. Например, потому что вышла какая-то интересная публикация, и двум…

  • Pour la science №526

    Заметка про то, как размножаются трюфели. Растут они под землёй, и споры ветром не разносятся, поэтому трюфели и получились такими вкусными /…

  • Pour la Science №525

    Отличная колонка о том, как правильно интерпретировать опросы «крутится ли Земля вокруг Солнца?», после которых обычно идёт волна комментариев…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 30 comments

  • Pour la science № 526 — деликатные простые числа

    Люблю, когда два разных источника одновременно рассказывают тебе об одном и том же. Например, потому что вышла какая-то интересная публикация, и двум…

  • Pour la science №526

    Заметка про то, как размножаются трюфели. Растут они под землёй, и споры ветром не разносятся, поэтому трюфели и получились такими вкусными /…

  • Pour la Science №525

    Отличная колонка о том, как правильно интерпретировать опросы «крутится ли Земля вокруг Солнца?», после которых обычно идёт волна комментариев…