Toto téma obsahuje 1 komentář a naposled do něj přispěl před skoro 8 roky.

Od nějaké aktualizace prohlížeče se mi na stránkách zobrazuje zpraseně diakritika. Především v sekci Jak organizovat, ale neprocházel jsem to všechno.

Je to tím, že některé české znaky jsou kanonicky rozložené, například dlouhé í U+00ED je na stránkách representováno jako obyčejné i U+0069 a kombinující akcent U+0301. Což samozřejmě teoreticky má být naprosto ekvivalentní, ale prakticky se ta rozložená representace renderuje idiotsky s diakritikou kdesi úplně mimo.

Šlo by prosím převést texty do komponované normální formy (NFC)?

Udělá to třeba následující skriptík/filtr

\#!/usr/bin/python
import sys, unicodedata
sys.stdout.write(unicodedata.normalize('NFC',sys.stdin.read().decode('utf-8')).encode('utf-8'))
Odpověď na