Repr. du texte (UTF-8)
Point de code → représentation⚓︎
Énoncé
Représenter le caractère « ? », dont le point de code est ?? en représentation en UTF-8.
Rappel de la norme UTF-8
Cette norme n'est pas à connaître par cœur et sera toujours fournie avec les exercices.
La norme UTF-8 indique que le point de code d'un caractère est encodé soit sur un octets, soit sur deux octets, soit sur trois octets, soit sur quatre octets, selon le nombre de bits requis pour écrire le point de code en binaire :
- Si le point de code s'écrit en binaire sur 1 à 7 bits inclus, alors on utilisera un seul octet et écrira le point de code en binaire sur les 7 bits x ci-dessous :
[0xxx xxxx]UTF-8
- Si le point de code s'écrit en binaire sur 8 à 11 bits inclus, alors on utilisera deux octets et écrira le point de code en binaire sur les 11 bits x ci-dessous :
[110x xxxx 10xx xxxx]UTF-8
- Si le point de code s'écrit en binaire sur 12 à 16 bits inclus, alors on utilisera trois octets et écrira le point de code en binaire sur les 16 bits x ci-dessous :
[1110 xxxx 10xx xxxx 10xx xxxx]UTF-8
- Si le point de code s'écrit en binaire sur 17 à 21 bits inclus, alors on utilisera quatre octets et écrira le point de code en binaire sur les 21 bits x ci-dessous :
[1111 0xxx 10xx xxxx 10xx xxxx 10xx xxxx]UTF-8
Réponse
Correction
Représentation → point de code⚓︎
Énoncé
Trouver le point de code du caractère qui est représenté en UTF-8 par les bits [?]UTF-8.
Rappel de la norme UTF-8
Cette norme n'est pas à connaître par cœur et sera toujours fournie avec les exercices.
La norme UTF-8 indique que le point de code d'un caractère est encodé soit sur un octets, soit sur deux octets, soit sur trois octets, soit sur quatre octets, selon le nombre de bits requis pour écrire le point de code en binaire :
- Si le point de code s'écrit en binaire sur 1 à 7 bits inclus, alors on utilisera un seul octet et écrira le point de code en binaire sur les 7 bits x ci-dessous :
[0xxx xxxx]UTF-8
- Si le point de code s'écrit en binaire sur 8 à 11 bits inclus, alors on utilisera deux octets et écrira le point de code en binaire sur les 11 bits x ci-dessous :
[110x xxxx 10xx xxxx]UTF-8
- Si le point de code s'écrit en binaire sur 12 à 16 bits inclus, alors on utilisera trois octets et écrira le point de code en binaire sur les 16 bits x ci-dessous :
[1110 xxxx 10xx xxxx 10xx xxxx]UTF-8
- Si le point de code s'écrit en binaire sur 17 à 21 bits inclus, alors on utilisera quatre octets et écrira le point de code en binaire sur les 21 bits x ci-dessous :
[1111 0xxx 10xx xxxx 10xx xxxx 10xx xxxx]UTF-8
Réponse