Pojdi na vsebino

UTF-8

Iz Wikipedije, proste enciklopedije

UTF-8je eden izmed načinovkodiranjamednarodnega naboraznakovunicode,pri katerem znakiASCIIostanejo enozložni, ostali znaki pa lahko zasedajo več zlogov.

Iz zgodovine

[uredi|uredi kodo]

Nabor je iznašelKenneth »Ken« Thompson2. septembra1992medvečerjos svojim sodelavcemRobom »Commanderjem« Pikom.Moža nista bila zadovoljna z izvirnim naboromUTF,ki je temeljil na standardu ISO 10646. Ob obedu si je Thompson zamislil bitno pakiranje (bit-packing) novega nabora, ki bi omogočal 16-bitneznake. Še isto noč je Thompson napisalkodo,Pike pa se je silovito poglobil v zapisCin grafične knjižnice. Naslednji dan je bila koda pripravljena in začela sta pretvarjati besedilne datoteke v samem sistemu. Od tu naprej so zgodbo pisali drugi, saj se tvorca nista ukvarjala z zgodovino. (Povzeto poPikovem elektronskem zapisu, 30. april 2003)

V omenjenem viru je zgledkode,ki nakazujealgoritmeza obojestransko pretvorbo med tedaj obstoječim sistemom UCS in novim.

Glej tudi

[uredi|uredi kodo]