Sommaire et contenu de l'article :
ToggleLorsqu’on s’intéresse un peu à la technique caméra, à l’encodage des images et à la compression on peut tomber sur ce genre de terme :
« 4:2:2 sous-échantillonnage de chrominance
8 ou 10 bits de profondeur de pixel »
Pas de panique, ce n’est pas si compliqué que ça !
Tout d’abord, un peu d’histoire :
Alors en détail, qu’est-ce que c’est ? :
Dans une image, chacun des pixels comporte 3 types d’informations :
Luminance (Y’)
Chrominance bleue (Cb)
Chrominance rouge (Cr)
Maintenant pourquoi on parle de 4:2:2 par exemple ou de 4:4:4 ?
Parce que pour quantifier le sous-échantillonnage, on prend pour représentation une région de 4 pixels de largeur sur 2 pixels de hauteur.
Sur cet échantillon de 8 cases donc, on va placer différentes informations et quantités de luminances et de chrominances.
– Le premier chiffre indique le nombre d’échantillons de luminance (Y’) par ligne (en règle générale 4)
– le deuxième chiffre indique le nombre d’échantillons de chrominance (Cb, Cr) sur la première ligne de pixels.
– Le troisième chiffre indique le nombre d’échantillons de chrominance (Cb, Cr) sur la deuxième ligne de pixels.
Si vous avez quatre chiffres, par exemple, 4:4:4:4, alors le dernier chiffre représente la transmission ou l’enregistrement d’un canal alpha. On pourra approfondir le sujet dans un autre article si ça vous intéresse, pour l’instant on va se concentrer sur l’essentiel !
Vous remarquez que les informations de luminances sont très souvent de 4 car la vision humaine est plus sensible à la luminosité qu’à la couleur. Donc en gardant assez d’information de luminances et en se séparant d’informations de chrominances, on ne dégrade pas la qualité perçue de l’image.
Pour info un humain a environ 3 à 4 millions de cônes par œil (pour les couleurs) pour environ 100 millions de bâtonnets (lumière) pour chaque œil.
Explication des différentes structures d’échantillonnages :
Si vous avez une structure en 4:4:4 (comme c’est souvent le cas au cinéma) cela veut dire que vous n’avez aucune compression, donc pas de sous-échantillonnage. Tous les pixels de l’images sont « entiers » et conservent toutes leurs informations, ce qui rend les travaux d’incrustations plus simples.
Cependant, vous vous en doutez, afin de traiter ces images en post production il faut des machines onéreuses capables de traiter un fort débit.
Alors que veut dire le 4:2:2 ? Il y a deux fois moins d’échantillons de chrominance que de luminance mais la qualité vidéo peut rester haute gamme.
Si on enregistre avec une structure de 4:2:0 vous remarquez qu’on a presque plus d’info de chrominance. On n’en a que sur la première ligne. A partir de là l’image sera tout de même de moins bonne qualité.
Quand on passe du 4:4:4 au 4:2:2 on gagne environ 33 % en taille de fichier.
Et quand on passe du 4:4:4 au 4:2:0 on gagne environ 50 % en taille de fichier.
Comment ça se passe ? :
Lors d’un sous échantillonnage en 4:2:2 par exemple, pour ne conserver qu’un pixel sur deux, une des méthodes consiste à faire la moyenne des couleurs.
Par exemple, sur une ligne de 4 pixels :

Le bleu et le rouge sont mélangés pour donner du magenta.






Les inconvénients :

Et le deuxième problème reste la difficulté à détourer des objets sur Photoshop avec des images sous échantillonnées.
Quand on parle de 10 ou 8 bits on parle de quoi ?
Chaque pixel qui nous donne une couleur contient en fait différentes informations de rouge, de vert et de bleu (c’est l’espace RVB et jusqu’ici rien de neuf).
En 8 bits on a 256 façons de coder notre vert primaire, 256 façons de coder notre bleu primaire, et de 256 façons de coder notre rouge primaire.
Sur chaque couleur primaire on a 256 nuances différentes qu’on peut obtenir. Et en mettant plus ou moins de bleu, de rouge ou de vert on aura des couleurs différentes.
Si on multiplie 256 x 256 x 256 on obtient 16 777 216 nuances possibles de couleur en 8 bits.
8 bits = 16 millions de nuances environ.
Maintenant si on se met en 10 bits, on a plus de bits à disposition pour chaque couleur. Donc on peut avoir des nuances plus précises.
On aura donc en 10 bits :
1024 nuances de vert, 1024 nuances de rouge et évidemment 1024 nuances de bleu.
1024 x 1024 x 1024 = 1 073 741 824 nuances de couleurs différentes.
10 bits = 1 milliards de nuances environ.
Concrètement cela signifie qu’en 8 bits on est plus à même d’avoir des images avec un phénomène de banding.
On appelle banding ces démarcations, ces lignes de couleurs. On peut en voir sur des photos de ciel par exemple.
Le ciel possède bien plus de nuances que la caméra ne peut reproduire. On va passer par exemple d’un ciel avec une nuance de bleu pâle, à une nuance de bleu « un peu moins pâle » et donc il va créer des nuances comme ça qui vont former des lignes sur notre image.
Et du coup, comme vous pouvez le voir sur les images ci-dessus, le 10 bits sera plus à même de représenter les différentes nuances de couleurs sans créer de banding.
A notez que le 8 Bits et le 10 bits sont indépendants de la compression en 4 :2 :2 par exemple. Ce sont deux paramètres bien différents mais on en parle souvent ensemble.
Voilà, c’est tout pour cet article, si vous avez des questions posez les en commentaire et n’hésitez pas à partager à ceux que ça pourrait intéresser.
A plus pour un prochain article !