A savoir sur les Cartes d'acquisition vidéo
-
A.
L’utilité d’un CODEC de compression
Les composants présents sur la carte d’acquisition vont permettre de transformer le signal analogique en fichier, et ce en temps réel. Pour cela, une résolution de capture est définie (par exemple, 720 pixels par 576 lignes qui est la valeur habituelle de numérisation d’un flux analogique, définition d’une télévision ou du format DV). On associe une valeur de couleur à chacun de ces pixels. Les couleurs sont définies selon une table de conversion : 24 bits permet de coder 16 millions de nuances de couleur. Ce traitement doit s’exécuter très rapidement, car une vidéo diffusée sur un téléviseur défile à 25 images par seconde.
Un CODEC Lossless, c’est-à-dire sans aucune compression, réclame un débit très important. De plus, le fichier résultat demandera lui aussi une énorme capacité de stockage. Calculons !
720 pixels x 576 pixels = 414 720 pixels par image Chaque pixel est codé sur 24 bits, donc sur 3 octets (1 octet = 8 bits).
414 720 x 3 = 1 244 160 octets par image, équivalent à 1,2 Mo par image
À 25 images par seconde : 1,2 x 25 = 30 Mo pour une seconde de vidéo 30 Mo/s est aussi le débit nécessaire au disque dur pour enregistrer le fichier.
Pour 1 minute de vidéo, cela correspond à 1,8 Go, soit tout de même 162 Go pour 1 h 30 de vidéo !
Aussi, on utilise des systèmes de compression ou CODEC qui ont deux effets : limiter le débit du flux vidéo et la taille du fichier résultat.
Haut de page -
B.
Le facteur
La compression peut agir sur plusieurs facteurs indépendamment, mais plus généralement sur tous à la fois.
Le facteur le plus opérant limiterait le nombre de points par image. Si on divise par deux le nombre de lignes et de pixels par ligne, on divise par 4 la résolution finale, donc le débit et la taille du fichier résultat : 360 x 288 x 3 x 25 = 7,4 Mo/s Malheureusement, la qualité de l’image serait énormément altérée.
Un autre facteur est de limiter le nombre d’images par seconde. Passer de 25 à 12,5 images par seconde permet de diviser par deux le débit et la taille du fichier résultat, mais on perd alors toute notion de fluidité. En dessous de 20 images par seconde les mouvements ne sont plus perçus correctement par l’œil humain et on obtient un film saccadé.
Le dernier facteur serait de limiter le nombre de couleurs restituées. Codé sur 2 octets, soit 16 bits pour 65 536 couleurs ou sur 1 seul octet pour 256 couleurs. La dégradation serait, cependant, trop importante pour de la vidéo.
On peut jouer sur ces facteurs, mais de façon très légère. La véritable solution est l’utilisation d’algorithmes de compression.
Haut de page -
C.
Méthode de compression sans perte
Les méthodes de compression sans perte utilisent une des caractéristiques principales des images d’une vidéo. La redondance d’informations, c’est-à-dire d’informations identiques.
- Redondance temporelle Il n’y a quasi pas de différence entre deux images qui se succèdent, sauf pour une partie de l’image où se produit un mouvement. Une image de base sera enregistrée complètement. Pour les suivantes, on n’enregistrera que la zone qui aura changé.
- Redondance spatiale Dans une même image, beaucoup de zones similaires se suivent. On codera donc pour dix lignes de noirs un point noir sur 24 bits et on indiquera qu’il se répète sur les 10 000 points suivants.
La combinaison des deux méthodes réduira de manière drastique la quantité d’information à sauvegarder. En revanche, la redondance spatiale empêchera d’atteindre un endroit aléatoire d’un film, limitant les accès aux images de base.
Haut de page -
D.
Méthode de compression avec perte
Pour continuer à diminuer la compression et obtenir un gain encore plus important, des méthodes de compression avec perte d’informations sont aussi utilisées. Ces méthodes sont tolérées tant que l’œil humain ne perçoit pas ou très peu de chute de qualité. On s’appuie pour ces méthodes sur les particularités de la perception de l’œil humain et, concernant le son, de celle de l’oreille humaine. Il est possible de tromper l’œil ou l’oreille humaine. Par exemple, pour l’audio on coupe toutes les fréquences non distinguées par l’oreille humaine. On va aussi pouvoir enlever des informations d’une image sans que ce soit perceptible. Par exemple, une image dégradée sur une scène en mouvement ne sera que très peu discernée par l’œil humain.
- VLC : Variable Length Coding
Le VLC est une méthode de transformation du code qui part du fait que de nombreuses suites de bits se répètent à l’identique dans le code binaire d’une image. On référence ses suites de bits que l’on remplace par un code d’autant plus court que la suite est fréquemment rencontrée dans l’image.
- DPCM : Differencial Pulse Code Modulation
La méthode DPCM part du principe que les différences de deux pixels adjacents sont souvent faibles, les transitions franches étant assez rares. On calcule donc la valeur d’un pixel en se basant sur celle de son voisin.
- DCT : Discret Cosine Transform
La méthode DCT est complexe. Pour simplifier, une formule mathématique permet de représenter la position spatiale (coordonnées et valeur) des pixels. On transforme la façon de coder la position et la valeur d’un pixel. Ce codage est plus facilement comprimable que le code de base.
Haut de page
-
Page précédente
1. CODEC -
Page suivante
3. Les principaux CODEC vidéo










