Les premiers prototypes de téléviseurs sont apparus dans les années 20, mais il ne s’agissait encore que de dispositifs mécaniques et la qualité des images était très sommaire. La décennie suivante a vu l’apparition des premiers équipements électroniques. Certaines règles qui régissent la télévision d’aujourd’hui ont trouvé leur source bien en amont, parfois il y a plus de cent ans. L’œil humain n’est pas un organe parfait et certaines de ses particularités (pour ne pas dire de ses défauts) ont été directement analysées pour déterminer quelques unes des caractéristiques de la télévision et de la vidéo d’aujourd’hui.
1- Les imperfections de l’œil pour expliquer la télévision : la persistance rétinienne
On appelle persistance rétinienne cette propriété de l’œil de pouvoir mémoriser pendant quelques millisecondes toute information lumineuse même très brève. Face à une série régulière de stimulations visuelles, l’oeil va perçevoir une impression de continuité lorsque la fréquence des éclats est supérieure à 40 par seconde en moyenne. Entre 20 et 40 impulsions lumineuses par seconde, on ressentira une sensation de papillotement, tandis qu’en dessous de 20, on aura l’impression d’un mouvement saccadé. Ce qui est un défaut de l’œil est devenu un avantage grâce auquel le cinéma puis la télévision ont pu naître. Au cinéma, afin de respecter le nombre minimum de 40 stimulis par seconde nécessaire à un rendu correct des mouvements, chacune des 24 images par seconde est projetée à l’écran deux fois de suite. A la télévision, même orientation mais à 25 images par seconde (pour l’Europe) et avec une image qui est divisée en deux demi images (les trames) qui sont affichées successivement. L’image vidéo est analysée ligne par ligne et affichée en deux temps successifs : une première trame comportant l’ensemble des lignes paires (trame paire), puis une seconde comportant les lignes impaires (trame impaire). Du point de vue de l’œil, on a donc bien 50 stimulis par seconde. En Europe, une image complète en télévision standard comporte aujourd’hui 625 lignes (576 seulement sont visibles) avec une fréquence d’affichage de 50 trames par seconde (25 images par seconde). On parle de balayage entrelacé.

Si le nombre de lignes composant une image de télévision a pu varier en fonction des époques et des lieux (nous y reviendrons au paragraphe suivant), la fréquence d’affichage des images n’a en revanche pratiquement pas changée. Depuis le milieu des années 30, la fréquence trame est directement liée à celle de la fréquence de l’alimentation secteur : 50 Hz (en Europe) ou 60 Hz (aux USA ou au Japon par exemple). A une époque où les circuits électroniques n’étaient pas aussi performants qu’aujourd’hui, un asservissement sur la fréquence du secteur permettait de s’affranchir de toute interférence néfaste au niveau de l’affichage des images (ondulation, battement...). En studio, où les éclairages artificiels sont alimentés par le secteur, cela présentait aussi l’avantage d’éviter des effets stroboscopiques indésirables à l’image.
Pour les pays avec un réseau d’alimentation électrique à 50 Hz, la fréquence trame a donc été naturellement fixée à 50 Hz (25 images par seconde) quelque soit le système de codage couleur utilisé (PAL ou SECAM). Pour les pays à 60 Hz, la fréquence d’affichage des images pour la télévision a été établie à l’origine à 30 images par seconde. Par contre, toute règle générant des exceptions, l’avènement au début des années 50 de la télévision couleur avec le système américain NTSC, la volonté à l’époque de rester compatible avec le noir et blanc mais de limiter les problèmes d’interférences qui en découlaient [1] ont contraint les ingénieurs à décaler très légèrement les valeurs de certaines des caractéristiques qui avaient été adoptées pour le noir et blanc... Aujourd’hui, pour ces pays, la fréquence image est de 29,97 images par seconde [2], ce qui correspond à une fréquence trame de 59,94 Hz et une fréquence ligne de 15734 Hz au lieu de 15750. Et tant pis pour la synchronisation avec le secteur !
Tous les systèmes de télévision « standards » (par opposition à la télévision haute définition) s’appuient sur le balayage entrelacé. Les matériels informatiques, technologie plus récente, reposent sur une autre méthode d’affichage : le mode progressif. Dans ce cas, l’image est reconstruite ligne par ligne en une seule « passe ». Une image complète n’est donc composée que d’une seule trame. Pour satisfaire les propriétés de l’œil évoquées au début de ce chapitre, ces images doivent être affichées avec une fréquence beaucoup plus élevée que précédemment : des valeurs de 60 Hz ou 75 Hz (l’image est ré-affichée 60 ou 75 fois par seconde) sont très courantes dans ce domaine. Plus cette fréquence de rafraîchissement est élevée et plus l’image est stable.
Le cloisonnement historique, entrelacé pour la télévision et progressif pour l’informatique est battu en brêche avec l’avènement de la télévision numérique en haute définition. Les nouvelles normes s’appuient désormais sur l’un ou l’autre de deux modes d’affichage. Attention aux faux amis ! En anglais technique, "frame" signifie "image". Ne pas confondre avec le mot français "trame" qui se traduit par "field" en anglais. A ce jour, et si on se cantonne à l’Europe, deux grandes normes émergent : le 1080 x 1920 (1920 pixels sur 1080 lignes) en mode entrelacé à 25 images par seconde (50 trames par seconde) que l’on trouvera dans la littérature technique sous l’appellation 1080i ou 1080/50i (i pour interlaced) et le 720 x 1280 (1280 pixels sur 720 lignes) en mode progressif à 50 images par seconde que l’on trouvera sous les termes 720p ou 720/50p (p pour progressif). Chacun des deux systèmes a ses avantages : définition spatiale pour le premier, définition temporelle pour le second. A l’échelon mondial, de nombreuses variantes combinant les différents ingrédients (notamment pour la fréquence trame avec des valeurs comprises entre 24 à 60 Hz...) ont été prévues dans les normes.
2- Les imperfections de l’œil pour expliquer la télévision : l’acuité visuelle
L’œil humain n’a pas une acuité aussi parfaite que celle d’un rapace et sa perception des détails est parfois limitée. L’utilisation d’une mire de Foucault constituée par une succession de bandes blanches et noires de même largeur a permis de chiffrer l’acuité de l’œil ou plus exactement son pouvoir séparateur. A partir d’une certaine distance, l’œil ne peut plus séparer les traits noirs et les traits blancs et il voit la mire comme étant uniformément grise. Connaissant cette distance limite et l’écart entre deux traits noirs, il est facile d’estimer le pouvoir séparateur de l’œil par le calcul de l’angle dont l’œil est le sommet. Pour l’espèce humaine, il est en moyenne d’une minute d’angle (l’acuité est alors égale à dix dixièmes : c’est l’acuité considérée comme normale). A noter que cette valeur est obtenue lorsque les traits noirs et blancs composant la mire sont placés horizontalement ou verticalement. Lorsque la mire est inclinée à 45°, le pouvoir séparateur de l’œil n’est pas aussi parfait, la perte pouvant atteindre 50%
Une image de télévision étant formée par une succession de lignes horizontales, il est impératif que le téléspectateur ne puisse les discerner. On admet généralement que la distance d’observation « confortable » pour une image de télévision « standard » est égale à 5 fois la diagonale de l’écran. Compte tenu des caractéristiques évoquées pour l’oeil, une image de télévision standard devra être composée de 400 lignes au minimum.
En partant de trente lignes pour la première expérimentation française de transmission entre Montrouge et Malakoff par René Barthélemy le 14 avril 1931, et 60 lignes pour la première émission officielle de télévision des PTT depuis le studio du n°103 de la rue de Grenelle à Paris le 26 avril 1935, de nombreuses valeurs ont été expérimentées de part le monde (405 lignes, 441 lignes, 450 lignes, 819 lignes... ) avant que ne soient définitivement fixées les valeurs actuelles : pour la télévision standard, 625 lignes (en Europe) ou 525 lignes (aux USA notamment), pour la télévision haute définition, 1080 lignes ou 720 lignes.
Les conclusions énoncées ci dessus à partir de la mire de Foucault ne concernaient que la vision des détails en noir et blanc. Hors, l’œil humain présente aussi la particularité d’offrir une vision différenciée du noir et blanc et de la couleur : il ne voit pas aussi bien les détails (et donc les transitions) lorsqu’ils sont en couleur. Les expériences menées par Bedford en 1949 aux USA ont mis en lumière cette caractéristique. Il notait ainsi : « qu’il n’était pas nécessaire que la transitoire permettant de passer d’une couleur à une autre soit aussi rapide que la transitoire permettant de passer d’une luminance à une autre ». Cette constatation a eu des répercussions directes lors de l’établissement des normes des différents standards couleurs car elle a permis de réduire notablement l’encombrement « spectral » des signaux. Il a ainsi été retenu la séparation des informations noir et blanc (la luminance) pour lesquelles on conserve la résolution d’origine de celles en couleur pour lesquelles la résolution sera réduite. On admet que la réduction de la bande passante des composantes couleurs est bien tolérée par l’œil jusqu’à une valeur égale à 25% de celle de la luminance. Compte tenu de ces constations, la bande passante théorique en Europe (en terme de diffusion ) a été fixée à 6 MHz pour la luminance et à 1,5 MHz pour chacune des composantes couleurs. Pour certains matériels de production, la bande passante de la chrominance peut parfois être augmentée (environ 2,75 MHz sur les matériels Betacam numériques). Cette réduction de la chrominance reste toujours valable aujourd’hui même pour les nouveaux formats vidéo numériques grand public (DV par exemple) ou professionnels.
3- Remonter l’histoire pour expliquer la télévision : le format 4/3
Dans tous les pays du monde, la télévision « standard » (par opposition aux écrans dits « larges » ou 16/9 qui sont beaucoup plus récents) présente des images aux proportions strictement identiques, légèrement plus larges que hautes. Plus précisément, leurs dimensions sont dans un rapport 4/3, c’est-à-dire que la largeur et la hauteur de l’écran sont dans la même rapport que les chiffres 4 et 3. Cette caractéristique pourra être également indiquée sous la forme 1,33 /1.
Mais quelle est l’origine de ce format ? Difficile à dire. Peut être, il y a plus de 100 ans, à la fin du 19eme siècle. Certains vous diront en effet qu’il trouve ses sources avec la naissance du cinéma et plus précisément avec un brevet déposé en 1891 par Edison pour deux équipements : le Kinetograph (l’ancêtre de la caméra de prise de vue) et le Kinetoscope (le dispositif de visualisation individuel, l’image ne pouvant pas être projetée). Ces matériels utilisaient un film spécifique (pour l’époque !) de 35 mm avec quatre perforations latérales et défilait en boucle à la fréquence de 48 images par seconde. Les images étaient dans la rapport 1,33, rapport qui deviendra quelques décennies plus tard 1,37 après le développement du cinéma sonore. D’autres vous affirmeront que ce format était fait pour une utilisation optimale des tubes à écrans circulaires qui équipaient les premiers récepteurs de télévision expérimentaux au début des années 30. |