
Unicode e Utf-8

Unicode
Unicode è un sistema di codifica che assegna un numero univoco ad ogni carattere usato per la scrittura di testi, in maniera indipendente dalla lingua, dalla piattaforma informatica e dal programma utilizzati.
Unicode è stato compilato e viene aggiornato e pubblicizzato dal Unicode Consortium, un consorzio internazionale di aziende interessate alla interoperabilità nel trattamento informatico dei testi in lingue diverse. Il codice assegnato al carattere viene rappresentato con U+, seguito dalle quattro (o sei) cifre esadecimali del numero che lo individua.
Unicode incorpora, nella primissima parte, la codifica ISO/IEC 8859-1 (codifica usata fino ad ora da maxdev e che verrà sostituita, a partire dalla versione 1083, con Utf-8, encoding di cui parleremo dopo) ma va molto oltre, codificando i caratteri usati in quasi tutte le lingue vive e in alcune lingue morte, nonché simboli matematici e chimici, cartografici, l'alfabeto Braille, ideogrammi etc.
L'Unicode e' attualmente considerato uno standard a livello platenario.
UTF-8
UTF-8 (Unicode Transformation Format, 8 bit) è una codifica dei caratteri Unicode in sequenze di lunghezza variabile di byte, creata da Rob Pike e Ken Thompson.
UTF-8 usa gruppi di byte per rappresentare i caratteri Unicode, ed è particolarmente utile per il trasferimento tramite sistemi di posta elettronica a 8-bit.
UTF-8 usa da 1 a 4 byte per rappresentare un carattere Unicode. Per esempio un solo byte è necessario per rappresentare i 128 caratteri dell'alfabeto ASCII, corrispondenti alle posizioni Unicode da U+0000 a U+007F. (wikipedia)
Come dicevo prima, a partire dalla mdpro1083 si passerà all'encoding UTF-8.
Tutorial per aggiornare a mdpro1083
