Unicode 9.0 : 7 500 nouveaux caractères, dont 72 emojis

Unicode 9.0 : 7 500 nouveaux caractères, dont 72 emojis

ROTFL

Avatar de l'auteur
Vincent Hermann

Publié dans

Société numérique

22/06/2016 3 minutes
78

Unicode 9.0 : 7 500 nouveaux caractères, dont 72 emojis

Le Consortium Unicode a entériné la version 9.0 du standard. Environ 7 500 nouveaux caractères ont été ajoutés. Pour beaucoup toutefois, la mouture sera surtout synonyme d’un nouvel apport d’emojis.

Unicode est devenu pour une partie des utilisateurs synonyme d’emojis. Les « smileys » ont longtemps été l’apanage des éditeurs qui fournissaient des solutions de messagerie, chacun mettant en place bien sûr un système propre. Mais Unicode est un standard informatique. Il est apparu en 1991 et a pour but de normaliser les caractères informatiques. Il s’agit de la table de référence que chaque éditeur peut reprendre pour l’interpréter à sa manière.

Pour tous les goûts

Unicode 9.0, qui vient de paraître, ajoute ainsi 7 500 nouveaux caractères, dont une grande majorité concernent des langues peu utilisées, mais bien actives. La nouvelle version porte la grille complète à une taille de 128 172 caractères, parmi lesquels 72 nouveaux emojis. C’est évidemment ce que l’on retiendra dans la plupart des cas, surtout qu’ils viennent couvrir certaines expressions et émotions qui avaient été mises de côté jusque-là.

C’est ainsi que l’on trouve le « facepalm », le nez agrandi façon Pinocchio, le cowboy, l’expression « aucune idée » avec les paumes ouvertes vers le haut, la poignée de mains, de nouveaux animaux (gorille, papillon, lézard, canard, chauve-souris…), de nouveaux aliments (kebab, carotte, pancakes, kiwi, la fameuse baguette…) et autres activités diverses (waterpolo, jonglage, canoé, tambour, handball…). Quelques nouveaux gestes de doigts apparaissent également, notamment les croisés, ainsi qu’un emoji dédié pour ROTFL (Rolling On The Floor Laughing).

Seul Google a réagi pour le moment

Comme d’habitude avec les emojis – et comme pour l’ensemble d’Unicode – chaque éditeur pourra interpréter les nouvelles icônes à sa manière. C’est pour cette raison qu’un emoji n’a pas la même apparence selon qu’il est regardé sur un iPhone, un smartphone Samsung ou un Lumia. Chaque entreprise interprète la grille selon son propre langage graphique, même si ceux d’Apple ont tendance à être plus utilisés que les autres.

Quant à l’arrivée de ces emojis dans les systèmes et applications, seul Google a réagi pour l’instant. Les nouvelles icones sont en effet présentes dans Android N depuis la Preview 2. On peut se douter cependant qu’elles devraient se manifester prochainement dans l’une des bêtas d’iOS 10. En attendant, ceux qui veulent en connaître le détail pourront se rendre sur le site d’Unicode. Emojipedia a également publié une analyse sur le sujet.

Écrit par Vincent Hermann

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Pour tous les goûts

Seul Google a réagi pour le moment

Commentaires (78)


La patate et le bacon c’est bien mais toujours pas de saucisse <img data-src=" />








Soltek a écrit :



La patate et le bacon c’est bien mais toujours pas de saucisse <img data-src=" />





Il y a tout de même une baguette&nbsp;<img data-src=" />



Et croissant aussi.





Question, comment les maj de Unicode est intégrer a win7/linux/FireFox/… ?


Et la galette saucisse <img data-src=" />


Tu peux proposer ta saucisse aussi ;)


Et la suppression du fusil !


On peut plus tirer son coup en emoji ? 😧


c’est quoi le code pour le caractère WTF? J’en ai besoin pour commenter cette news.


c’est bien beau d’ajouter le gorille mais y’a t’il l’alligator, histoire de coller au plus près à l’actualité?


T’as toujours le revolver et les menottes <img data-src=" />


🐊 <img data-src=" />


Je vois le texan mais il est ou le Breton ?


La première étape est de mettre à jour la font (la police d’écriture) du système qui supporte les emoji. Il ne faut pas oublier qu’il n’y a techniquement pas de différence entre la lettre “a” et un emoji.



Lorsque la font à les nouveaux emoji, le système peut les afficher en monochrome dégueulasse.



Pour que ça soit plus joli, les applis (sms, chat, twitter, etc) parcourent les messages des utilisateurs et remplacent les caractères reconnus comme des emoji par des petites images. Ça devient ni plus ni moins qu’un smiley classique.



Donc il faut attendre que le graphiste de chaque appli design son interprétation de chaque nouvel emoji puis l’ajoute dans le programme qui les remplace.


La liste complète des emojis avec ce que ça donne en version de base, sur les systèmes mobiles, les réseaux sociaux, etc…


Sérieux y’a pas plus important à faire ? Je suis effaré que les emojis fassent partie d’Unicode (oui sans doute que je reviens de loin). Je commence à comprendre maintenant pourquoi je commence à voire souvent des caractères illisibles (non traduits ?) à la fin des phrases sur les forums, etc.








maxxyme a écrit :



y’a pas plus important à faire ?





Non 😋



JE LE VOIS ton smiley !!! <img data-src=" />


C’est quand même assez pratique lorsque tu veux faire une UI vite fait avec des icônes “interactive”. (Bon, encore faut il que ladite emoji soit gérée par la font)


ha tiens, NXI gère l’UTF8 maintenant? j’avais zapé! <img data-src=" />

vous passez quand à l’UTF9 du coup? <img data-src=" />








Minikea a écrit :



c’est bien beau d’ajouter le gorille mais y’a t’il l’alligator, histoire de coller au plus près à l’actualité?





<img data-src=" />

“y a-t-il” (dérivé de “il y a”, avec le “t” pour éviter le hiatus, pas le « t’ » qui est l’abréviation de “tu”)

:-)

&nbsp;

&nbsp;





maxxyme a écrit :



Sérieux y’a pas plus important à faire ? Je suis effaré que les emojis fassent partie d’Unicode (oui sans doute que je reviens de loin). Je commence à comprendre maintenant pourquoi je commence à voire souvent des caractères illisibles (non traduits ?) à la fin des phrases sur les forums, etc.





Je suis d’accord.



C’est ton navigateur qui le gère, pas NXi.


En même temps vu que le klingon est refuser par Unicode en 2001 (j’ai pas trouver d’info sur le elfique, zentradi ou autre…).

Je vois pas trop d’autre taf pour Unicode.


et même pas une mention du fusil/armes à feu rejeté par Apple ?


🤜



(pour quand le navigateur gérera l’UTF9 ^^)








gokudomatic a écrit :



c’est quoi le code pour le caractère WTF? J’en ai besoin pour commenter cette news.



D’accord avec vous, c’est WTF vu de loin.

Mais ça peut faciliter le développement pour des logiciels/applications de la vie courante.



l’UTF était pas géré par NXI avant la version actuelle (il faisait une conversion en ISO, il me semble, pour les commentaires)

(surement un problème de type de champ dans la BDD qui était en ISO et pas en unicode)


Si, NXI doit le gérer. Si le site n’acceptait que des caractères alphanumériques, il n’y aurait même pas les accents. ☀ ✌ ✌


le WTF, je sais pas mais je peux te donner le facepalm : 🤦








Minikea a écrit :



l’UTF était pas géré par NXI avant la version actuelle (il faisait une conversion en ISO, il me semble, pour les commentaires)

(surement un problème de type de champ dans la BDD qui était en ISO et pas en unicode)









psn00ps a écrit :



Si, NXI doit le gérer. Si le site n’acceptait que des caractères alphanumériques, il n’y aurait même pas les accents. ☀ ✌ ✌





Okay je ne savais pas <img data-src=" />



Y’a une source pour ça ?

Parce qu’on peut faire des poignards (🗡), des pistolets (🔫), des couteaux (🔪) ou des bombes (💣) sur Apple je ne vois pas bien ce qu’ils viennent faire là pour ça et on ne le voit pas dans les trucs rejetés.


Dans le source de la page :

meta http-equiv=“Content-Type” content=“text/html; charset=utf-8”/

meta charset=“utf-8”/

On dira que NXI le “gère” quand même un peu.



Edit : j’ai viré les inférieurs et supérieurs, ça fait bugger

Edit 2 : grillé


C’est le fusil qui a été supprimé suite à la demande d’Apple.


Oui donc :







Soltek a écrit :



Y’a une source pour ça ?

Parce qu’on peut faire des poignards (🗡), des pistolets (🔫), des couteaux (🔪) ou des bombes (💣) sur Apple je ne vois pas bien ce qu’ils viennent faire là pour ça et on ne le voit pas dans les trucs rejetés.






Enfin les doigts croisés !

Je ne compte plus le nombre de fois où j’ai envoyé des petits cacas à des gens pour leur souhaiter bonne chance, faute de mieux <img data-src=" />


La proposition date de fin 2015 et semble avoir été supprimé des candidats (pas même rejeté). Le code a bien été réservé (http://emojipedia.org/rifle/ ) et la suppression daterait de mai.


Toujours pas de potamochère <img data-src=" />


Yeah! 😎


&nbsp;

Seul Google a réagi pour le moment





Breaking news: je viens de réagir moi aussi, à l’instant. Par une totale indifférence.

Merci de votre attention.


C’est bien les américains… Même pas une paire de seins/fesses ou une tobe. Vachement utile en SMS/IM <img data-src=" />



Au passage Chrome/Opera sous Windows affichent toujours les Emoji en n &b alors que Firefox leurs rends leurs couleurs d’origine <img data-src=" />


Et Ƀ ?


Probablement jamais UTF-9, la limite théorique de UTF-8 est humainement inatteignable.


les Egyptiens avaient donc raisons d’utiliser les hiéroglyphes.&nbsp;


Yes, enfin un emoji pour la bave aux lèvres (drooling) !








Soltek a écrit :



Y’a une source pour ça ?

Parce qu’on peut faire des poignards (🗡), des pistolets (🔫), des couteaux (🔪) ou des bombes (💣) sur Apple je ne vois pas bien ce qu’ils viennent faire là pour ça et on ne le voit pas dans les trucs rejetés.







Au moins 360000 résultats sur google. Me dit pas que t’as pas pu trouver l’info !







Minikea a écrit :



🤜



(pour quand le navigateur gérera l’UTF9 ^^)







ben, jamais



Comment expliquer UTF-16 et UTF-32 dans ce cas ?


toujours pas de redface @ HFR ou équivalent…








boglob a écrit :



Au moins 360000 résultats sur google. Me dit pas que t’as pas pu trouver l’info !





C’est toujours mieux quand on affirme un truc de l’étayer avec des preuves/sources/faits.

Quelques sites on repris l’info il y a 2j mais sans aucune source fiable et d’autres parle de Google et Facebook en plus donc bon ça fait quand même bien rumeur plus que fait avéré…









fred42 a écrit :



Comment expliquer UTF-16 et UTF-32 dans ce cas ?





Ça n’a pas trop à voir, UTF-8 utilise un codage préfixe à taille variable, alors que UTF-16 est un codage des caractères définis par Unicode où chaque caractère est codé sur une suite de un ou deux mots de 16 bits.









fred42 a écrit :



Comment expliquer UTF-16 et UTF-32 dans ce cas ?





Pas du tout de même fonctionnement et les mêmes besoins. UTF-16 et UTF-32 c’est plus lourd en mémoire, mais plus rapide en lecture. UTF-8 c’est 1 à 4 octets, le décodage est plus complexe, mais c’est extensible.



j’ai été trompé par la version 9.0 du protocole UTF-8. faut dire que c’est pas clair non plus.








OlivierJ a écrit :



Ça n’a pas trop à voir, UTF-8 utilise un codage préfixe à taille variable, alors que UTF-16 est un codage des caractères définis par Unicode où chaque caractère est codé sur une suite de un ou deux mots de 16 bits.









zefling a écrit :



Pas du tout de même fonctionnement et les mêmes besoins. UTF-16 et UTF-32 c’est plus lourd en mémoire, mais plus rapide en lecture. UTF-8 c’est 1 à 4 octets, le décodage est plus complexe, mais c’est extensible.









saladiste a écrit :



C’est pas un problème de taille mais de consistance.







Je sais tout cela, mais je voulais mettre en avant que le fait que l’UTF-8 permettait de coder suffisamment de caractères n’était pas une bonne raison pour dire que l’UTF-9 n’existerait jamais.

Si un jour on utilise à nouveau les bytes de 9 bits, je suis sûr que l’UTF-9 aura un bel avenir.









fred42 a écrit :



Je sais tout cela, mais je voulais mettre en avant que le fait que l’UTF-8 permettait de coder suffisamment de caractères n’était pas une bonne raison pour dire que l’UTF-9 n’existerait jamais.

Si un jour on utilise à nouveau les bytes de 9 bits, je suis sûr que l’UTF-9 aura un bel avenir.





Ça m’étonnait aussi que tu ne saches pas, mais pourquoi on utiliserait des mots de 9 bits ? (et “à nouveau” ?) Et le mécanisme/principe du codage préfixe de UTF-8 marcherait aussi.









Soltek a écrit :



C’est toujours mieux quand on affirme un truc de l’étayer avec des preuves/sources/faits.

Quelques sites on repris l’info il y a 2j mais sans aucune source fiable et d’autres parle de Google et Facebook en plus donc bon ça fait quand même bien rumeur plus que fait avéré…





Le doute porte sur le fait que ce soit Apple (et soutenu par MS) qui a demandé son retrait. Mais le rifle semble bien avoir disparu.



Et là on ajoute MS à la sauce, non franchement c’est une non-news sans source tangible.


pistolet qui ressemble plus à une perceuse qu’à autre chose….


J’ai bien parlé de doute pour mettre en avant l’aspect non vérifiable…

Et la source de l’histoire semble être cet article :https://www.buzzfeed.com/charliewarzel/thanks-to-apples-influence-youre-not-gett…

Donc oui, la source est bien douteuse, mais elle parle bien de Apple, Google et Microsoft (mais pas Facebook, enfin indirectement si vu qu’il fait parti du consortium)


Il y a peu de raison que l’on utilise des multiplets de 9 bit dans le futur, mais c’est arrivé dans le passé. Je n’ai pas retrouvé de référence précise sur les processeurs.

Mais certainsPDP de DEC avaient des mots multiples de 9 bits (18 ou 36 bits).


Vont-ils aussi assujetti à la redevance ? <img data-src=" />


Dans la prochaine version de Windows 10, toutes les émoticônes ont été refaites, et une grande partie de celles manquantes ont été ajoutées. A voir si celles de 2016 seront là d’ici fin juillet !


“buzzfeed”, bon bah voilà, on aurait eu ça dès le début ça nous aurait éviter d’en parler <img data-src=" />








Soltek a écrit :



“buzzfeed”, bon bah voilà, on aurait eu ça dès le début ça nous aurait éviter d’en parler <img data-src=" />





Ils font de bons articles parfois, tout n’est pas à jeter.



Et une quenelle <img data-src=" />


LE smiley dont personne n’a jamais su ce qu’il était sensé exprimer.


A quand l’implémentation de tous ces smileys dans NXI, et façon NXI ? <img data-src=" />

Les smileys et le popup qui les affiche n’ont pas été mis à jour depuis pas mal de version de NXI… <img data-src=" />


Le fusil n’a pas supprimé , il était proposé et n’a pas été voté par les membres du consortium .


L’article de blog suivant me parait intéressant pour se faire une idée des priorités du consortium derrière l’Unicode :

https://modelviewculture.com/pieces/i-can-text-you-a-pile-of-poo-but-i-cant-writ…








DUNplus a écrit :



Et croissant aussi.





Question, comment les maj de Unicode est intégrer a win7/linux/FireFox/… ?





C’est aux navigateurs de faie la màj, pou Firefox, c’est ce bug:

https://bugzilla.mozilla.org/show_bug.cgi?id=1281448



c’est un peut une ponctuation maintenant, mais ça veut dire dans un sens que la phrase est à prendre au second degré








Soltek a écrit :



Sur browser oui, mais ailleurs non : http://www.unicode.org/emoji/charts/full-emoji-list.html#1f52b.





Tiens y a un truc marrant au niveau des noms : le smiley pour le “diable” s’appelle “SMILING FACE WITH HORNS” <img data-src=" />



Et il y a d’autres exemples : par exemple la couleur de peau est un “type” : l’homme blanc est type 1-2, l’homme noir est type-6. “Haircut” n’est qu’avec un personnage féminin, alors qu’une tonne de smiley sont dérivé homme/femme + type.



Y a moyen de lancer des débats alacon avec cette nouvelle table <img data-src=" />



En fait c’est tout simplement la&nbsp;classification de Fitzpatrick.&nbsp;<img data-src=" />


Ah merci je ne connaissais pas cette classification de “phototype”.

Donc le smiley peut bronzer alors ? <img data-src=" />


le shrug original avec le Tsu reste meilleur

¯\_(ツ)_/¯