Toto téma obsahuje 1 komentář a naposled do něj přispěl před více než 7 roky.

  • Autor
    Příspěvky
  • # reagovat

    Od nějaké aktualizace prohlížeče se mi na stránkách zobrazuje zpraseně diakritika. Především v sekci Jak organizovat, ale neprocházel jsem to všechno.

    Je to tím, že některé české znaky jsou kanonicky rozložené, například dlouhé í U+00ED je na stránkách representováno jako obyčejné i U+0069 a kombinující akcent U+0301. Což samozřejmě teoreticky má být naprosto ekvivalentní, ale prakticky se ta rozložená representace renderuje idiotsky s diakritikou kdesi úplně mimo.

    Šlo by prosím převést texty do komponované normální formy (NFC)?

    Udělá to třeba následující skriptík/filtr

    \#!/usr/bin/python
    import sys, unicodedata
    sys.stdout.write(unicodedata.normalize('NFC',sys.stdin.read().decode('utf-8')).encode('utf-8'))
    

Odpověď na