Mojibake

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
La codificaUTF-8per la paginamojibakenella Wikipedia in lingua giapponese, con visualizzazione in codificaISO-8859-1.

In ambitoinformaticosi indica con il terminemojibake(Văn tự hóa け?[moʥibake])il fenomeno della scorretta visualizzazione dicaratteriquando ilsoftwarenon riesce a rendere correttamente il testo poiché lo stesso usa unacodificasconosciuta.

La parola giapponese văn tự hóa け (mojibake) è composta da văn tự (moji), che significalettera,carattere,e hóa け (bake), dal verbo hóa ける (bakeru), che significatrasformarsi, assumere la forma di, apparire sotto mentite spoglie, corrompersi.Letteralmente significa "caratteri corrotti".

I mojibake sono causati dall'errato riconoscimento della codifica dei caratteri. Se un software non riconosce correttamente la codifica utilizzata, esso cercherà erroneamente di decodificare i codici numerici dei caratteri usando una codifica diversa da quella usata dall'applicazione che ha codificato il testo. Prendendo come esempio la parola "Văn tự hóa け", codificata inUTF-8,verrà incorrettamente codificata in "æ–‡å—化け" in molti software Windows dove è impostata la codificaWindows 1252.

Unbrowsernon riesce a distinguere una pagina codificata inEUC-JPda una inShift-JIS,se il sistema di codificazione non è direttamente esplicitato nel protocolloHTTPo nel codiceHTML.

Soluzioni al problema

[modifica|modifica wikitesto]

La difficoltà di risoluzione al problema può essere data dal software o dalle varie applicazioni che essa contiene. I programmi e i browser moderni dispongono di una vasta gamma di caratteri e di codifiche. Molti di questi programmi permettono di scegliere la codifica più adatta, anche se l'utente può trovare difficoltà nel trovare e mantenere quella esatta.