Réduire les débits de la vidéo :
On l’a vu, de nombreuses technologies ont été développées pour adapter Internet à la diffusion de la vidéo. Mais cela ne suffit encore pas. Dans l’état actuel des techniques, il n’est pas encore possible de proposer des programmes de télévision avec la qualité et le format que nous leurs connaissons par ailleurs. Les débits nécessaires seraient bien trop importants pour cela. En attendant le temps où cela deviendra possible, il est nécessaire, une fois de plus, de s’adapter, et d’ajuster les flux vidéo et audio aux possibilités qui sont celles d’’Internet d’aujourd’hui. Plus concrètement, cela va donc signifier une réduction des débits et par voie de conséquence une forte diminution de la qualité et des dimensions des images vidéo.
Nous n’évoquerons ici que les principes généraux de la compression, des textes plus techniques sur ces technologies et plus précisément sur MPEG étant proposés sur ce même site.
Les principes généraux :
Toutes les technologies de compression des images reposent sur le même concept général : pour compresser : il faut éliminer !
Réduire le débit signifie comprimer fortement le poids des images. Cela signifie diminuer la taille des fenêtres de visualisation, abaisser la fréquence des images. Cela signifie également réduire la qualité des images en exploitant :
les redondances spatiales (intra-images) : une image seule contient beaucoup de redondances, a fortiori si elle présente des zones uniformes plus ou moins grandes, c’est à dire où il existe de fortes corrélations entre des pixels voisins. Inutile dans ces cas de coder intégralement chacun de ces points.
les redondances temporelles (inter-images) : dans une séquence vidéo, les images successives sont pratiquement identiques, si ce n’est les points qui sont en mouvement. On ne codera que ces déplacements.
les redondances subjectives (vision des détails fins) : compresser, c’est pondérer ce qui est plus ou moins visible par l’œil et ne pas coder ce qui n’est pas visible.
Toutes ces techniques peuvent s’ajouter les unes aux autres pour parvenir au résultat attendu, réduire le débit, et conserver autant que ce peut la qualité des images originales. Plus les taux de compression sont importants, plus les dégradations sont perceptibles.
Quelques technologies :
Les technologies employées pour le traitement des redondances spatiales peuvent être diverses et variées, et leurs paramètres sont souvent tenus secrets de la part des industriels. Citons simplement pour information quelques unes des voies suivies.
La DCT (Discrete Cosine Transform)
Le traitement repose sur un découpage préalable de l’image en blocs de 8 sur 8 pixels puis une réduction des données en trois étapes successives :
Une opération mathématique : la transformation en cosinus discrète DCT (discrete cosinus transform).
Pour permettre un codage plus efficace, cette opération mathématique va réaliser une réorganisation de l’information au sein de chacun de ces blocs de 8 x 8, à savoir une transposition de l’image depuis le domaine spatial vers le domaine fréquentiel transformant ainsi des échantillons d’amplitude en coefficients. Ces coefficients sont représentatifs de la fréquence des signaux vidéo et représentent donc la quantité de détails. Ils sont classés en ordre croissant dans la matrice de 8 colonnes sur 8 lignes, les valeurs situées en haut à gauche représentant les basses fréquences de la transformée, les valeurs représentant les détails fins (et donc les fréquences les plus élevées) étant placés à l’autre extrémité. Si l’image comporte peu de détails (un ciel bleu par exemple) beaucoup de ces coefficients seront faibles voire nuls.
 La DCT repose sur un découpage de l’image en blocs (de 8 sur 8 pixels dans MPEG) sur lesquels on applique une opération mathématique et une quantification sélective.
La quantification :
Ces coefficients sont ensuite quantifiés, mais avec une précision qui sera pondérée en fonction de la position des coefficients dans les blocs et donc de la finesse des détails (précision décroissante quand la fréquence augmente). Pour la quantification des grandes plages presque uniformes, on adoptera un codage avec une précision maximum (on affectera un plus grand nombre de bits) ce qui évitera l’apparition de « méplats » ou d’effets de pixélisation dans les zones de l’image originale qui comportaient de subtils dégradés pour lesquels l’œil est particulièrement sensible. Pour les détails fins (les hautes fréquences spatiales), l’œil est beaucoup plus tolérant et il n’y perçoit pas les différences d’intensité. Les coefficients correspondant à ces détails pourront être codés avec peu de bits. De nombreux coefficients non significatifs verront aussi leur valeur ramenée à zéro. Cela correspond à l’élimination pure et simple des détails les plus fins de l’image. Sur l’image décompressée, la structure en forme de blocs peut redevenir visible lorsque les taux de compression sont importants (ce défaut est d’ailleurs appelé effet de blocs).
La quantification est une phase primordiale. A ce niveau, la réduction des données est importante mais définitive : les informations supprimées sont irrémédiablement perdues.
La lecture des données :
Les données sont ensuite lues et sérialisées. Des techniques de réduction des données, directement issues du monde informatique sont ensuite appliquées. Parmi elles, le codage entropique qui exploite les fréquences d’apparition des coefficients. On repère les fréquences d’apparition de chaque caractère et on le recode en fonction de sa fréquence d’occurrence. Un caractère qui est souvent présent sera représenté par un code court, un caractère plus rare pourra être représenté par un mot plus long.
La DCT est au centre des normes de compression MPEG-1, MPEG-2 et MPEG-4 Deux notes techniques détaillées sont consacrées à ces normes sur ce même site.
La transformation par ondelettes :
La compression par ondelettes n’est pas nouvelle : elle a déjà eu des applications industrielles [1] mais ses qualités ont été occultées jusqu’à présent par le succès de la DCT.
La technologie consiste à décomposer l’image en sous-bandes, c’est à dire à créer des séries d’images de résolutions inférieures. Elle repose sur une décomposition fréquentielle et établit une séparation entre les fréquences les plus basses (les fonds continus) et les fréquences les plus hautes (les détails fins, les contours) qui sont contenus dans l’image. Cette opération est réalisée dans le sens vertical et dans le sens horizontal. Après un sous‑échantillonnage par deux, le résultat est la création de quatre sous-espaces : une sous‑image principale qui a une résolution réduite (divisée par deux par rapport à l’image originale) et trois sous‑espaces qui contiennent respectivement les différences hautes fréquences entre l’image originale et la sous‑image principale dans les trois directions (horizontale, verticale et oblique). Cette sous‑image principale représente donc une approximation de l’image d’origine (elle contient quatre fois moins d’informations). La transformation par ondelettes peut de nouveau être appliquée sur cette image et répétée autant de fois que nécessaire. Si on applique toutes ces transformations dans le sens inverse, on retrouvera l’image d’origine. A ce stade, il n’y a pas de pertes. Par contre, cela ne sera pas le cas si on supprime les sous‑images contenant les détails les plus fins : plus on supprimera de couches et plus l’image finale verra sa définition réduite (mais également, plus le poids du fichier sera faible).

Les ondelettes excellent dans la compression d’images comportant des contours très marqués. Cette technologie a par exemple été employée par le FBI pour le traitement et l’archivage des empreintes digitales (taux de compression 15 : 1). Les ondelettes est appliquée dans de nombreux produits, notamment pour les images fixes, dans les normes MPEG4 et JPEG 2000.
Les fractales :
L’algorithme consiste à repérer dans l’image un nombre réduit d’éléments significatifs qui une fois associés, répétés, agrandis, réduits ou orientés... permettront de décrire l’image dans sa totalité. En effet une image contient généralement un nombre important d’éléments redondants qu’il n’est pas utile de décrire et de stocker plusieurs fois d’où la diminution notable du poids du fichier correspondant. Les manipulations opérées sur ces éléments de base sont réalisées par des fonctions mathématiques. L’opération est symétrique, l’association de ces éléments de base et des opérations mathématiques devant permettre de reconstruire une image conforme à celle d’origine. Certains objets naturels présentent des caractéristiques de fractales. Un flocon de neige peut en être un exemple car il peut être décrit comme la multiple juxtaposition d’une infinité de triangles. Il en est de même de la feuille de fougère qui présente à différents niveaux une homothétie interne.
Les ondelettes permettent des taux de compression très importants et offrent pour un débit donné une meilleure qualité d’image que les deux autres technologies. Dans la mesure où le codage concerne la globalité de l’image et non pas des blocs de 8 sur 8 pixels, les ondelettes sont moins sensibles aux erreurs de transmission. Les défauts qui peuvent apparaître provoquent une sensation de flou qui est moins visible et moins désagréable à l’œil que l’apparition des effets de blocs inhérents à la DCT.
La technologie des ondelettes permet une décompression progressive des images : leur résolution augmente au fur et à mesure de la lecture du fichier décompressé, c’est à dire au fur et à mesure de la lecture par ordre d’importance de toutes les sous-images contenant les détails les plus fins. C’est également l’un des aspects intéressants des ondelettes. Une même compression peut créer différentes couches de détails avec différentes qualités. Ainsi lorsque la bande passante disponible le permet, la qualité peut augmenter en utilisant de plus en plus de couches dans l’image.
La technologie des fractales présente aussi des avantages. Citons notamment l’absence d’effets de mosaïque (pixélisation) lorsqu’on agrandit une image, cette opération ne s’effectuant pas par agrandissement des pixels, mais par calcul mathématique.
Retour vers le sommaire du dossier
|