pro neutr: Ono jde o to, že arabštinu načítám jako prostý text a výstupem je zatím formátovaná latinková výslovnost, která je však komplet nastavitelná, neboť způsobů jak transliterovat arabská písmena je docela dost a jsou různé, např. uvedu že já mám v oblibě co nejvíc češtinu, tudíž ar ráčkované 'r' dělám jako 'R', ale někde ho mají jako 'g' nebo 'gh'; nebo ar 'dž' mám jako 'dž', ale někdo používá jen 'ž' a někdo 'ǧ'.
Takže si kdokoliv v celkem zajímavé tabulce bude moci nastavit, jaká písmena chce pro jaké arabské znaky a nastavit i jaké barvy či formátování mu vyhovuje pro které druhy výslovnosti (např. právě různé prodlužování samohlásek, ozvěny pro některé kombinace souhlásek, nosní vyslovování pro jiné kombinace, důrazy zase pro jiné apod. - celkem je toho asi 100 možností pro 34 hlásek (tedy i včetně těch s neupravovanou výslovností; ale tradiční (koránská) arabština má i různé 'pauzy' - např. zde doporučená/možná/nevhodná odmlka apod.; a pak z toho vychází těch zmiňovaných asi 150 'hlásek'; pro moderní spisovnou ar je to mnohem méně a já bych to měl rád pro obojí).
Ale odhadujete dobře, že by to bylo dobré i přes obrázky. To bych chtěl také udělat, abych měl možnost načíst prostý arabský text a výstupem byl jednak obarvený arabský text podle nastavených možností výslovnosti a k tomu i ta navolená latinková výslovnost. Jenže to je zatím hudba budoucnosti. Když například převedu pár arabských vět na křivky v Drawu a upravím barvy ručně, tak stačí 10 vět z křivek vložit do Writeru a je znát jak už starý laptop nestíhá, a třeba 30 takových vektorů ve Writeru a soubor se načítá či ukládá déle než minutu, takže ty obrázky k tomu teď nevyvíjím. A bitmapy tam dělat nechci, neboť chci udělat i jednoduchý HTML výstup třeba s SVG tagy právě pro arabské křivky, přeci jen arabština je fakt dobře viditelná až tak pro velikost písma 20pt a tedy počítám i se snadným zoomováním.
Ale ještě třeba pro představu, k tomu abych dokázal převést vokalizovaný arabský text (tzn. jsou v něm zapsané i krátké samohlásky) do té tradiční výslovnosti, tak už mám v tabulce asi 1500 většinou regulárních výrazů -> proto jsem si musel udělat to formátování jednotlivých regulárních subvýrazů.
Kdybych to měl čistě staticky, tak bych se dostal počítám možná i ke 20 tisíc kombinacím :-). Tedy hrubým odhadem, ale fakt vím o čem píši - ty arabské kombinace už znám snad všechny z koránské arabštiny, moderní jich používá mnohem méně, ale stále v ní vznikají nová slova, tudíž mě možná zase v něčem překvapí :-).
Když jsem byl na asi 2 tisících statických vzorcích (natvrdo tenhle ar text = natvrdo takto obarvená latinka), tak jsem to zabalil a začal dělat to regulární barvení :-), protože umělá inteligence a big data fakt nejsem. Taky jsem si musel udělat rychlejší variantu namísto getTransferable, tudíž používám jen vlastnosti tučnost, kurzívu, barvu, podbarvení, podtržení, nadtržení (poslední dvě jsou docela hojně používané v mezinárodních transliteracích, ale já je používám spíše netypicky, neboť mě prostě vyhovuje mnou vyvinutá specifická transliterace, kterou jinde nemají - ale jak píši, je to komplet nastavitelné, žádné věci natvrdo :-)).
Mám také potenciálně v merku vlastní font, ale problém je, že by to musel být jiný formát než TTF, aby šlo pro různé kombinace arabských znaků udělat jinými barvami některé části těch kombinací, což by bylo lepší než přes obrázky - ale kdyby tam nebyla možnost vyhodnocovat jak má font spojovat podle regulárních výrazů, zase by tam muselo být asi těch předpokládaných 20 tisíc statických podmínek :-(. Skutečně je to hodně, ale uvedu další příklad. Např. končí-li věta, tak poslední slovo má-li předposlední hlásku dlouhou samohlásku, tak v 95% případů se ona dlouhá samohláska může vyslovovat (tradičně) na standartní délku dvě doby, ale taky prodloužit na 4 nebo až 6 dob (což barvím oranžově). A jak poznat, že je to poslední slovo věty? Přeci je za tím tečka, středník, vykřičník nebo otazník. A už jsou tu kombinace. A když poslední souhláska bude 'r', tak bude-li to '-ár' nebo '-úr', bude 'r' tvrdší (barvím fialově), ale bude-li to '-ír', bude 'r' měkčí (neobarvené) :-). Takže v případě '-ár' mám oranžové 'á' a fialové 'r', ale v případě '-ír' oranžové 'í' a normální 'r'. A těch kombinací je tam v koránské arabštině skutečně odhaduji tak 20 tisíc a skutečně si myslím, že asi nepřeháním :-).
Nyní je vám jistě jasné, proč mě dané téma začalo po vašem návrhu hodně zajímat, sice to momentálně nepotřebuji, ale chtěl bych nějaké to obrázkování během následujících let asi využít :-). Byť skutečně postupně, teď bych byl rád kdybych do konce roku stačil zpracovat vše pro ten první doplněk a někdy v příštím roce třeba dodělal ty další dva.