Inversion of codings of ASCII and UTF-8 characters

Cette page encodée en ANSI/ASCII (charset=Windows-1252) a été mal interprétée par le navigateur en charset=Big5: Chinese Traditional (Big5).

Ã©

UTF-8 => ASCII

Page stock矇e en fichier local en format Unicode UTF-8 interpr矇t矇e par erreur en ASCII

�

ASCII => UTF-8

Page stock矇e en fichier local en format ASCII interpr矇t矇e par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en Ã©

Il Ã©tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carr� vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En r銶le g幯廨ale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur � l'affichage, le diamant point d'interrogation ou carr� vide � appara褾.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carr� vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de pr嶰iser que tous les caract鋨es ASCII du code 0 � 127 gardent toujours les m瘱es codes sans changement quelque soit le codage des caract鋨es, ASCII, GBK, Unicode...

Tous les caract鋨es ASCII 彋endus du code 0 � 255 (2**8=256, uni-octet, mono-byte) peuvent 皻re stock廥 soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caract鋨es multi-octet (multi-byte) avec un code sup廨ieur ou 嶲al � 256, qui ne peuvent 皻re conserv廥 que dans un fichier Unicode comme UTF-8, ou bien dans un format sp嶰ifique (code page pays) tel le GBK pour les id廩grammes chinois.

Sur le web, un caract鋨e Unicode peut en outre s'exprimer en code entit� HTML, ainsi stock� dans un fichier du codage ASCII. Par exemple, l'id廩gramme 语 signifiant Langue, peut 皻re stock� en mode ASCII par la cha螽e 语, compos嶪 uniquement des ampersand &, di鋊e #, suivi par des chiffres du num廨o d嶰imal de ce caract鋨e en Unicode, et termin� par un point-virgule ;.

Citation de Mao pour tester:

中国应对人类作出较大的贡献！

La Chine doit faire une contribution relativement grande l''Humanit�!

ويتعين على الصين تقديم اسهامات اكبر للبشرية!

Китай должен сделать больший вклад в человечество!

Κίνα θα πρέπει να συμβάλει περισσότερο στην ανθρωπότητα!

中国は人類に大きな貢献をしてください！

בסין יש תרומה גדולה לאנושות!

चीन मानव जाति के लिए एक बड़ा योगदान करना चाहिए!

จีนควรจะให้มีส่วนร่วมมากขึ้นเพื่อมนุษยชาติ!

چین باید سهم بیشتری به انسان را!

China shall make a relatively great contribution to the Man Kind!

Cette page est stock嶪 dans le disque dur en format ANSI/ASCII. Mais je vous propose de l'afficher en diff廨ents codages. Elle peut devenir illisible si le codage diff鋨e trop. Il faut revenir en ASCII si vous avez mal � la t皻e. Testez vous-m瘱e sur votre navigateur en cliquant sur les liens suivants:

Currencies |

Clock |

Translation |

Dictionaries |

Writing |

Encode

Inversion of codings of ASCII and UTF-8 characters

Citation de Mao pour tester:

Give us feedback (0)

Want to come? | Call us 7/7 ☎ 00 33 467 790 487 (Phone)